walkingmask’s development log

IT系の情報などを適当に書いていきます

MENU

SoundFlowerとGoogle Docsで自動文字起こし機

要約

  1. SoundFlower の GitHub の releases から .dmg をダウンロード
  2. dmg から SoundFlower をインストール
  3. 環境設定 -> サウンド -> 出力 -> SoundFlower(2ch)
  4. 環境設定 -> サウンド -> 入力 SoundFlower(2ch)
  5. Google Chrome を 開いて Google Docs にアクセスして新規ドキュメントを作成
  6. ⌘+shift+s で音声入力を起動して言語を設定する
  7. 音源を再生してから音声入力を開始する

自動文字起こし機

どうしても自動で文字起こししたいもの(英語)があったので、SoundFlower という無料ソフトと Google Docs を使って自動文字起こし環境を作りました。

なお、SoundFlower は Mac 用のアプリケーションなので Mac での方法を紹介します。Windows についても基本的な考え方は同じなので、それと参考になりそうな URL を紹介したいと思います。

基本的な考え方

いたってシンプルです。「スピーカーから出る予定の出力音声マイクの入力音声送り」「Google Docs音声入力に認識させる」だけです。図解すると下のイラストのようになると思います。

f:id:walkingmask:20170116132428p:plain

これを実現するために、パソコンの設定をいじったり無料のソフトを使えばいいわけです。

手順

まずは、SoundFlower をインストールします。

Google で検索して一番上のものをダウンロードしてもいいと思うのですが、SoundFlower はオープンソースなので GitHubリポジトリーからダウンロードしてきたいと思います。

github.com

releases の一番上の Signed Version for Yosemite/Mavericks/El Capitan/Sierra の Downloads から Soundflower-2.0b2.dmg をクリックしてdmg ファイルをダウンロードします。終わったら、dmg を開いて指示に従ってインストールしてください。

ここで注意したいのが、このインストールで .app ファイルなどはインストールされないということです。なので Applications を探してもどこにもありませんが、確かにインストールされているはずです。

また、アンインストールについても先ほどの GitHub のページに載っているので、する際には参照してください。

これで SoundFlower の準備が終わったので、次は「スピーカーから出る予定の出力音声をマイクの入力音声に送る」です。

⌘マークとスペース(または controlとスペース)を同時に押して Spotlight Search を出します。そこに「Sound」と入力して enter を押してください。

f:id:walkingmask:20170116131831p:plain

すると次のようなウィンドウが開くと思います。

f:id:walkingmask:20170116131904p:plain

ここで、

Output タブ → Select a device for sound output: → SoundFlower(2ch)

Input タブ → Select a device for sound input: → SoundFlower(2ch)

に設定します。volume は適当に調整してください。これだけでスピーカー出力をマイク入力につなぐことができました。

あとは、Google Docs にアクセスして新規ドキュメントを作成し、音声入力を有効にしてしまえばほぼ完了です。

https://docs.google.com/?hl=ja

「新規ドキュメントを作成」して、ドキュメント編集画面に行きます。

f:id:walkingmask:20170116133238p:plain

⌘とshiftとsを同時に押すか、上の画像のように選択して音声入力を有効にします。

f:id:walkingmask:20170116133451p:plain

このボタンが出たら、言語を選択しておきます。クリックして音声入力を始める前に、入力したい音声ファイルを先に再生しておきます。(例えば VLC プレイヤーで mp3 ファイルなど)。

再生してすぐに Google Docs に戻って音声入力のボタンをクリックしたら、自動文字起こしが開始しているはずです。らくてぃん!

ここでも気をつけたいことが、自動文字起こしの間はMacで他のことはしないほうがいいかもしれないということです。そうしてしまうと、途中で音声入力がが止まってしまう可能性があるので、実験するなどして状態を把握していってください。

以上で自動文字おこし環境の構築はおしまいですが、ここまで書いていてより詳しい解説をしてくれている Web ページがあったので紹介させてもらいたいと思います。素晴らしいドキュメントがすでにネットの海に漂っていたようです。

note103.hateblo.jp

また、Windows についても参考になりそうな URL を探してみました。

dynabook.com

オーディオミキサーというのをなんとかすればいけそうですね。「スピーカーから出る予定の出力音声をマイクの入力音声に送る」ことさえできれば、あとは Google Doc の素晴らしい音声入力を使うだけです!

参考文献