Google Colaboratoryでローカルにあるデータセットやモジュールを使う
簡単な例で、実践してみたいと思います。
まずは、ローカルで
cat <<EOF >~/Downloads/data.txt 1,cat 2,bird 3,dog EOF cat <<EOF >~/Downloads/module.py def load_data(fn): with open(fn, 'r') as f: return f.readlines() EOF
みたいなファイルを作って、Colaboratoryで
from google.colab import files uploaded = files.upload() for fn in uploaded.keys(): with open(fn, 'wb') as f: f.write(uploaded[fn]) from module import load_data data = load_data('./temp.txt') out = ['I love '+d.strip().split(',')[1] for d in data] with open('out.txt', 'w') as f: f.write('\n'.join(out)) files.download('out.txt')
これを実行して、先ほど作ったtxt, pyファイルを選択してアップロードすると、out.txtがダウンロードされます。
data.txtがデータセット、module.pyがモジュール、out.txtが出力ファイルとすれば、基本的なことはだいたいできそうです。
GitHubなどでソースをホストしているなら、gitコマンドが使えるのでモジュールはそこから持ってきても良さそうですね。
おわりに
前から気になっていたGoogle Colaboratory。
以下のエントリを見て、使ってみようと思い、やってみたら本当に秒で始められました。
今後もちょくちょく使っていきたいと思うので、ちょっとしたtipsのメモでした。