音声データからの文字起こし。専門の業者がいるほど、手間と時間がかかるものです。ICレコーダーなどで録音した音声を聞きながら、ちょっとずつテキスト入力をしていくのが伝統的な方法ですが、かなり時間がかかります。

しかし、人間は進化する生き物。なんとGoogleドキュメントを使って、音声データから自動で文字起こしをする方法が編み出されているのです! そこでこの記事では、その方法を解説していきます。

Windows 10で自動文字起こしをする方法

用意するものは、音声データ、PC(WindowsでもMacでも可)、Googleドキュメントです。あとは少々の設定。たったこれだけで、音声データから自動で文字起こしができるようになります。

最初に、Windows 10での自動文字起こし方法について解説します。

サウンドの入出力の設定を変更する

 まずは「サウンド」コントロールパネルを開き「録音」タブを開きます。そこに「ステレオミキサー」という項目があるので、それを右クリックし「規定のデバイス」に設定します。Windows 10での設定はこれだけです。

サウンドミキサーが表示されない場合

image4.jpg

「Virtual Audio Cable」のサイトからアプリをダウンロードしてインストールしておく。

使用しているPCによっては、「サウンドミキサー」が表示されない場合があります。そのときはサードパーティのアプリをインストールしましょう。使用するアプリは「Virtual Audio Cable」です。これをあらかじめインストールしておきます。なお、インストール時に管理者権限が必要になるので、インストールファイルを右クリックし「管理者として実行」を選択しましょう。

image5.jpg

入力デバイスを「CABLE Output(VB-Audio Virtual Cable)」に変更する。

そして、「Windowsの設定」から「サウンド」を開き、「入力」の欄から「入力デバイス」を「CABLE Output(VB-Audio Virtual Cable)」に変更します。これで準備は完了です。

Googleドキュメントで音声入力を行う

image6.jpg

Googleドキュメントで音声入力を有効にしスピーカーアイコンをクリックする。

次にGoogleドキュメントを起動し、「ツール」→「音声入力」を選択。すると画面上にスピーカーのアイコンが表示されるので、それをクリックすると音声入力が開始されます。

image2.jpg

音声ファイルを再生させると、Googleドキュメントが自動的に音声を認識し文字起こしをする。

この状態で音声ファイルを再生させると、Googleドキュメントは自動的に音声入力を開始し、音声がテキスト化されていきます。

image3.jpg

録音状態がよければ精度の高いテキスト化が行えるが、手動での修正は必須。

部屋で一人で読み上げた文章を文字起こしした結果がこちら。おおよその意味はわかりますが、細かい部分は修正が必要です。また、セミナーのように周囲の音が大きい音声ファイルの場合は精度がかなり落ちるので、録音状態で大きく結果が左右される傾向があります。

Macで自動文字起こしをする方法

Macの場合も、基本的にはWindows 10と同じ方法で自動文字起こしができます。使用するアプリも「Virtual Audio Cable」でOK。WindowsとMacの両方のバージョンがあるので、Mac版をインストールしておきます。

image1.jpg

「サウンド」の「入力」から「VB-Cable」を選択しておく。

「システム環境設定」から「サウンド」を開き「入力」画面から「VB-Cable」を選択すると、再生された音声ファイルを認識することができるようになります。

あとはWindowsと同様、Googleドキュメントで音声入力を有効にして、音声ファイルを再生すればOKです。

完璧ではないが文字起こしの労力を大幅に軽減

実際にこの方法を使った印象としては、「文字起こしの結果は完璧ではないが、手間と時間を大幅に軽減してくれる」といった感じ。特に、インタビューのように一人または二人で話しているような、会話がクリアに聞こえる録音ならば、効果は大きいと感じました。

もちろん、後作業は必須ですが、ひたすら音声を聞きながらキーボードを叩くといった作業がなくなるのは、大きなメリットです。

この方法を使えば、寝ている間に文字起こしをさせておくということも可能。さらに音声認識の精度が上がれば、文字起こしはこの方法で行うことがスタンダードになるかもしれませんね。

参考:
Googleドキュメントの自動文字起こし機能を使いこなしたい方向け|MOOVOO