ひと昔前まで、編集は時間のかかる仕事でした。
最大の理由はテープで編集するため。
ダビングには実時間がかかるため、シーンやカットを何度も繰り返すような編集をすると頭からやり直さなくてはなりません。
次の理由は、発言を文字に起こすことです。
インタビューなどの発言は、わざわざ音を聞き直さずに使えるコメントを探しやすくするため逐一文字に起こすからです。
編集がデジタル化されて、一番助かったのはインタビュー音声を自動的にテキスト化する技術です。文字起こしに費やす時間が大幅に短縮できました。
最近はスマホでも あたりまえのように 喋った言葉をテキスト化してくれます。
手持ちのパソコンでもグーグルドキュメントを使えば喋った言葉が自動的に日本語テキストになります。
撮影した動画の音声も自動的にテキスト化するにはどうしたらいいのでしょうか。
Virtual Audio Cableを導入する
パソコンで再生した動画の音声をgoogle documentに読み込ませて音声認識能力を使ってテキスト化することができると便利です。
問題はどうやってデータを届けるかです。
パソコンではスピーカー端子などを使って音声を利用する方法しか説明されていません。音声入力についてもマイクなどを使って入力する方法は説明されているだけです。
音声信号をいったん取り出さずに内部だけで処理できれば便利です。
そこでお薦めなのが“Virtual Audio Cable”というソフトです。
今日の仕事で使おうと思い…
— フルヤアツシ@tpDnrkRen (@ves_telesterion) August 14, 2019
virtual audio cable (VB-CABLE)とGoogleDocumentの高精度な音声入力を使って、Windows内部音声を仮想オーディオデバイスに送って自動文字起こしする実験
思いの外精度が高く、一人で舞い上がっている。
(動画は実験用の又吉イエスの政見放送) pic.twitter.com/3BZyrnnuEa
さっそく使って見ましょう。ダウンロードはこちらから。
Virtual Audio Cableを使って google document から音声テキスト化する流れは次の通り。[1]管理者として実行してください。
- Virtual Audio Cable をインストールする
- パソコンの音声設定を調整する
- google document を開く
- 動画ファイルを再生する
- google documentの録音ボタンを押す
以上です。簡単ですね。
解凍したソフトを起動すると各種Windowsに対応したインストーラー画面になります。その中から自分の環境を選びます。
私の場合はWindows10_64ビットなので「VBCABLE_Setup_x64.exe」です。
「Install Driver」を管理者権限でクリックします。
(管理者権限でないと「VBCABLE Installation Error」の画面が出てブラウザーが起動することがあります。インストール画面に戻って右クリックし、管理者権限で実行しましょう。)
デバイスをインストールするか聞かれるのでインストールを選ぶと完了です。
次に、パソコン側の設定です。初期設定では音声信号はパソコン内で google documentに繋がるようになっていないので、再生側と録音音の二つの回路をつくります。
WindowsPC 音声入出力を繋ぐ
タスクバーのボリュームアイコンを右クリックし、「再生デバイス」をクリックします。
サウンド・再生の一覧に「CABLE Input」というのがあることを確認します。
既定のデバイスとして設定します。
再生のセッティングが終わったら次に「録音」のセッティングに移ります。
「CABLE Output」を右クリックして、「既定のデバイスとして設定」します。
※慌てることがあるのは、これまでパソコンのスピーカーで聞こえていた音が聞こえなくなることです。パソコン内のスイッチがスピーカーから内部に切り替わったことが原因です。切り替えスイッチはタスクバーのボリュームアイコンを右クリックすると見えてきます。操作パネルから好みの出力を選択してください。
Googleドキュメントで音声解析する
google documentはクラウド上にファイルを置いて、異なるパソコンから文書を共有することができる文書作成ツールです。
マイクロホンなどで入力した音声も音声認識を使うことでかなり正確に日本語化してくれます。動画の音声も同じように音声認識して日本語化してくれますので便利です。
日本語変換率は、語り手のしゃべり方によって大きく左右されます。アナウンサーが一定の早さで読み上げた文章は、ほぼ9割方間違いなく日本語化されます。しかし、聞き取りにくい発声や方言、スラングなどは誤変換されたり、解析できずに機能が中断してしまうので注意が必要です。
設定の手順は簡単です。 google documentの新規ページを開いて認識のボタンを表示します。次に変換したい動画ファイル(YouTubeなどのストリーミングもOKです)を再生し、 同時に google documentの認識ボタンを押すだけです。
これで自動的に解析と日本語化が進みます。
まとめ
専門家に依頼すると結構な金額になるので、時間に余裕がある場合は自分でやった方がお得です。簡単・無料で使えることから利用者は続々増えています。
VRChatでボイチェン試してみてる。恋声ってアプリと、仮想オーディオデバイスの VB-Cable Virtual Audio Device というものを使ってる。ここが参考になった。 https://t.co/ZPtKcOsy72
— suna (@suna_vrc) June 30, 2018
VRC内のサウンド入力で「VB-Audio Virtual Cable」が選べない場合は、サウンドの録音デバイス名を英語にする。 pic.twitter.com/2uKlEhwBCX
難点があるとすれば誤変換や解析不能の部分が生じること。
ですから私も変換が終わった後、動画を再生しながら間違った部分を手打ちで修正します。
結構、面倒な作業ですが、耳で聞きながらキーボードを最初から打ちまくるよりも、時間が大幅に短縮できました。
音声のテキスト化が必要な人はぜひお試しください。
References
↑1 | 管理者として実行してください。 |
---|
こんにちは、フルタニです。放送局で番組作りをしてました。 Virtual Audio Cable を書きます。