音声データからの文字起こし。専門の業者がいるほど、手間と時間がかかるものです。ICレコーダーなどで録音した音声を聞きながら、ちょっとずつテキスト入力をしていくのが伝統的な方法ですが、かなり時間がかかります。

しかし、人間は進化する生き物。なんとGoogleドキュメントを使って、音声データから自動で文字起こしをする方法が編み出されているのです! そこでこの記事では、その方法を解説していきます。

Windows 10で自動文字起こしをする方法

用意するものは、音声データ、PC(WindowsでもMacでも可)、Googleドキュメントです。あとは少々の設定。たったこれだけで、音声データから自動で文字起こしができるようになります。

最初に、Windows 10での自動文字起こし方法について解説します。

サウンドの入出力の設定を変更する

 まずは「サウンド」コントロールパネルを開き「録音」タブを開きます。そこに「ステレオミキサー」という項目があるので、それを右クリックし「規定のデバイス」に設定します。Windows 10での設定はこれだけです。

サウンドミキサーが表示されない場合

image4.jpg

「Virtual Audio Cable」のサイトからアプリをダウンロードしてインストールしておく。

使用しているPCによっては、「サウンドミキサー」が表示されない場合があります。そのときはサードパーティのアプリをインストールしましょう。使用するアプリは「Virtual Audio Cable」です。これをあらかじめインストールしておきます。なお、インストール時に管理者権限が必要になるので、インストールファイルを右クリックし「管理者として実行」を選択しましょう。

image5.jpg

入力デバイスを「CABLE Output(VB-Audio Virtual Cable)」に変更する。

そして、「Windowsの設定」から「サウンド」を開き、「入力」の欄から「入力デバイス」を「CABLE Output(VB-Audio Virtual Cable)」に変更します。これで準備は完了です。

Googleドキュメントで音声入力を行う

image6.jpg

Googleドキュメントで音声入力を有効にしスピーカーアイコンをクリックする。

次にGoogleドキュメントを起動し、「ツール」→「音声入力」を選択。すると画面上にスピーカーのアイコンが表示されるので、それをクリックすると音声入力が開始されます。

image2.jpg

音声ファイルを再生させると、Googleドキュメントが自動的に音声を認識し文字起こしをする。

この状態で音声ファイルを再生させると、Googleドキュメントは自動的に音声入力を開始し、音声がテキスト化されていきます。

image3.jpg

録音状態がよければ精度の高いテキスト化が行えるが、手動での修正は必須。

部屋で一人で読み上げた文章を文字起こしした結果がこちら。おおよその意味はわかりますが、細かい部分は修正が必要です。また、セミナーのように周囲の音が大きい音声ファイルの場合は精度がかなり落ちるので、録音状態で大きく結果が左右される傾向があります。