walkingmask’s development log

IT系の情報などを適当に書いていきます

MENU

Google Colaboratoryでローカルにあるデータセットやモジュールを使う

簡単な例で、実践してみたいと思います。

まずは、ローカルで

cat <<EOF >~/Downloads/data.txt
1,cat
2,bird
3,dog
EOF
cat <<EOF >~/Downloads/module.py
def load_data(fn):
  with open(fn, 'r') as f:
    return f.readlines()
EOF

みたいなファイルを作って、Colaboratoryで

from google.colab import files

uploaded = files.upload()

for fn in uploaded.keys():
  with open(fn, 'wb') as f:
    f.write(uploaded[fn])

from module import load_data

data = load_data('./temp.txt')

out = ['I love '+d.strip().split(',')[1] for d in data]

with open('out.txt', 'w') as f:
  f.write('\n'.join(out))

files.download('out.txt')

これを実行して、先ほど作ったtxt, pyファイルを選択してアップロードすると、out.txtがダウンロードされます。

data.txtがデータセット、module.pyがモジュール、out.txtが出力ファイルとすれば、基本的なことはだいたいできそうです。

GitHubなどでソースをホストしているなら、gitコマンドが使えるのでモジュールはそこから持ってきても良さそうですね。

おわりに

前から気になっていたGoogle Colaboratory

以下のエントリを見て、使ってみようと思い、やってみたら本当に秒で始められました。

qiita.com

qiita.com

今後もちょくちょく使っていきたいと思うので、ちょっとしたtipsのメモでした。