AIツールで 文字起こし &校正を時短する方法

文字起こし
フルタニ

こんにちは、フルタニです。放送局で番組作りをしてました。 文字起こし を書きます。

動画の 文字起こし をする機会が増えています。少し前までは「Vrew」という無料のWebサービスが便利でしたが、最近有料化され使いにくくなりました。

そこで、「Vrew」に代わってなるべくコストをかけずに「文字起こし」する方法はないものでしょうか。

動画から文字起こしを校正まで行う方法

AIの進歩で、動画の会話を簡単にテキスト化できるようになりました。音声をテキストに変換すれば、翻訳、要約など、仕事や学習の幅が広がります。

しかし、Web版のChatGPT単体では基本的に音声入力で質問ができず、動画の文字起こしや校正ができません。

一般的なのは文字起こしウェブツール「Vrew」で会話をテキスト化し、その内容を「ChatGPT」もしくは「Copilot」などにかけて校正する方法です。

文字起こしデータはChatGPTを使って無料で校正できますが、動画からテキスト抽出を抽出する際便利なVrewは月間120分を超えると月額1,358円の有料プランを選択する必要があります。

また、「ChatGPT」もしくは「Copilot」もアカウントにつき1日で校正できる文字数の制限があります。

動画音声を文字起こし・校正する方法

文字起こし

文字起こしの機能を売り物にするサービスが増えています。有償版の編集ソフトの中にはAIを使ってかなり正確に文字起こしができるサービスもあるため、動画編集もし買うのであれば編集ソフトを選ぶのが早道です。

Filmora

Filmoraの有償版には簡単に字幕データを抽出する機能があります。

方法は簡単。Filomraを起動し、メディアプールに動画を取り込んで、メディアプール上で右クリックすると、字幕データとして音声を変換することができます。Filomraが扱えるファイル形式は多いので、ブルーレイなどで見かけるMTS(M2TS)ファイルなどを変換せずに直接読み込みもできます。

使ってみて感じたのは、解析できる動画の長さに制限がある点。文字起こししたデータはタイムデータが記録されたSRT形式で書き出される点が少し窮屈です。文字情報だけ欲しい場合は別途SRT形式変換サービスなどを探して、テキストデータだけにする必要があります。

字幕変換機 サイト ソフト アプリ SRT ASS VTT SUB SMI SBV シンクエンコード | Online Batch Subtitles Converter

DaVinci Resolve有償版

DaVinci Resolve有償版には、動画の音声から文字起こしを行う「自動文字起こし」機能があります。複数の人が話している声を自動的に判別する「話者検出」機能をが使えるので、話者を切り分けたい用途にはメリットです。

デメリットはMTS(M2TS)ファイルなどには対応していないこと(そもそも読み込めない)。読み込めた動画ファイルでも日本語として読み取れない場合がたまにあることです。

料金はFilmoraの価格は永続プランで¥8,980円、DaVinci Resolve有償版は¥49,980円なのでVrewの月額1,358円と比較すると明らかにお値打ちです。

最新版のバージョン13が登場

動画の音声だけをテキストとして書き出すだけなら、Filmoraが手間要らず。プロジェクトを立ち上げ、文字起こししたい動画をメディアプールに読み込んでSRTファイルとして書き出し、変換サービスを使ってSRTファイルをテキストにするという手順です。

ウェブツールで文字起こし

編集ソフト以外の文字起こし方法をお探しの方には、動画を一旦ウェブ上に上げて解析するウェブツールを使う方法があります。

Notta

リアルタイムで文字起こし【Notta】

リアルタイム自動文字起こしができるWebサービスです。高精度な音声自動テキスト化サービスで、世界中で500万人以上が利用中。「ITreview Grid Award 2024 Fall」において最高位の「Leader」を受賞。

無料で使えるフリープランは毎月120分(2時間)まで無料で使用できます。デメリットは一回に変換できるのは三分間に限られているため、こまめなアップロードが必要になります。

有料版のメリットは月1,200円で30時間の音声データの変換が可能な点です。

Rimo Voice

「Rimo Voice」は、Rimo合同会社が提供するAI文字起こしツールです。

AI文字起こし | Rimo Voice

日本語に特化した自然言語処理技術を持っており、句読点を含む自然な日本語での文字起こしが可能です。

従量制で、個人プランの場合、30秒22円という価格です。30分の動画を文字起こしすると1,320円という計算になるので他社のサブスクプランに比べると割高です。

Gemini

Geminiに音声データをアップロードして文字起こしするサービスです。文字起こしした内容の要約まで可能です(校正ではありません)。

Geminiで文字起こし機能を利用するには通常のGeminiではなく、Webベースの無料のプラットフォーム「Google AI Studio」の登録が必要です。特別なプログラミングスキルがなくても、Geminiの機能を活用でき、最上位の「Gemini 1.5 Pro」も無料で利用可能です。

  • プロンプトを入力するボックスの右側にある「+」マークを押し、「Upload to Drive」から音声データをアップロードします。
  • 「Type something」の欄にプロンプト(例)を入力して実行します。

この動画の録音音声を、日本語で書き起こしてください。原文は可能な限り変更せず、「えーっと」「え」などの意味のない音声のみ削除してください。

文字起こしデータを無料で校正をする方法

テキスト化した音声データには誤字や脱字が含まれています。そのため、そのまま利用するのはリスクがあります。地名や人名の表記や外国語の読み取りなど内容の確認・つまり校正が必要です。

そこで注目なのが生成AIです。手間のかかる校正もAIにまかせることでかなりの手間を省くことができます。

さまざまなサービスがありますが、よく使えるのが「ChatGPT」もしくは「Copilot」そして「Gemini」です。少量の作業であれば無料で利用できます。

テキストデータとして抽出した話者データを、生成AIツールのプロンプトに質問とあわせてコピペするだけ。校正されたテキストが返ってきます。

ChatGPTの文章校正を効果的に行うためには、適切なプロンプトを与えることが重要です。命令や質問に明確な条件などを与えることで、よりChatGPTの回答の精度が上がります。

ChatGPTで文章校正するプロンプト例

音声を文字起こしした以下の日本語の文章に対して、誤字脱字と無意味な音声(あー、ああ、えっと、えー、ええ、など)を修正し、適切な句読点と助詞をつけて段落わけを行う校正をしてください。そのうえで、誤字や脱字が残っていると思われる部分と日本語の意味が通じにくい語句を指摘してください。
#入力文:
(ここに校正したい文章を入力)

#命令書:
あなたは、プロの編集者です。
以下の文字起こし文をもとに、冗長な表現や読みにくい箇所を見つけ、分かりやすくするように修正してください。
#入力文:
(ここに校正したい文章を入力)

長文の場合、後半になると精度が落ちていくため、文章をいくつかに分けて入力するとより良い文章が戻ってきます。

Geminiを利用する

Geminiの料金は、2024年2月時点で無料です。Googleアカウントを持っている場合は、無料登録することで回数制限なしで自由に使えます。

プロンプトの入力例は次のとおり

文字起こしの文章の校正をお願いします。冗長な表現や読みにくい箇所を見つけ、分かりやすくするように修正してください。
本文

以下は解答例です。インタビューの内容は整理され読みやすい文章にリライトされました。リライトの理由も明確にされるので、再検討が必要な場合の目安になります。

修正案
「おっしゃる通り、筆で絵を描くと、抽象画であっても、ある程度はこうしたい、ああしたいというイメージを持って描き始めるのですが、実際に絵具がキャンバスに広がっていく過程で、思いがけないものが生まれてくることがあります。それは、絵具が重なり合い、新たな空間や深みが生まれるような感覚に似ているかもしれません。抽象画の面白さは、作者の意図を超えて、見る人それぞれが異なるイメージや感情を投影できる点にあると思います。」

修正点と解説
文の分割: 長すぎる文を複数の文に分割し、読みやすくしました。
言葉の置き換え: 口語的な表現や重複する言葉を、より一般的な言葉に置き換えました。
主語の明確化: 主語を明確にすることで、文意が分かりやすくなりました。
接続詞の活用: 文と文のつながりをスムーズにするために、適切な接続詞を用いました。
表現の簡潔化: 冗長な表現を削り、簡潔な文章にしました。
ポイント
文意の明確化: 原文の意図を損なわずに、より簡潔かつ明瞭な表現に置き換えました。
自然な日本語: 口語的な表現を避け、より自然な日本語に修正しました。
抽象的な概念の具体化: 抽象的な概念を、具体的な言葉で説明することで、理解を深めやすくしました。
原文との比較
原文は、会話口調で、抽象的な表現が多く、全体としてやや分かりにくい印象でした。修正案では、文法的な誤りを修正し、表現を簡潔にすることで、より読みやすく、内容が伝わりやすい文章に仕上げました。
補足
この修正案はあくまで一例です。原文のニュアンスや、より詳細な情報に基づいて、別の修正案も考えられます。
ご希望に応じて、以下の点についてさらに詳しく説明できます。

特定の表現の変更理由
文章全体の構成について
抽象画の表現技法に関する解説

お気軽にご質問ください。
この修正案が、あなたの役に立てれば幸いです。ソースと関連コンテンツ

以上のような結果がアウトプットされます。

ChatGPTと違って1日の利用制限はないようなので、無料で使い倒したい場合はGemini一択になるかもしれません。注意点は文字数の限度があるようで、大量のデータを入れると作業エラーが起きる場合があります。そのため入力する文章を妥当なサイズに小分けして質問することをおすすめします。

Claude(クロード)

ChatGPTの校正は誤字脱字が多いのが難点です。そのため修正に時間がかかる場合があります。より精密な校正が必要な場合はClaude(クロード)というサービスがあります。

Claude

まとめ

動画の音声データの文字起こしと校正は意外に今がかかり重労働になりがちです。生成AIを適切に利用することで単純作業を極力減らし、時短に繋げてみてはいかがでしょうか。