声優ゲットだぜ! 合成音声AIツール AivisSpeechでプロ級のナレーションを収録する方法

フルタニ

こんにちは、フルタニです。放送局で番組作りをしてました。 音楽生成AI を書きます。

みなさん、動画編集してて「うーん、ナレーションどうしようかな…」って悩んだことありません?

僕はめちゃくちゃあります。声を録音してみたけど、なんか棒読みっぽい。かといって声優さんに頼むお金もない。そこで出会ったのが、まさに“声優さん級”のAIボイスです。

今回は、最新のAI音声合成ツール 「AivisSpeech」 を使って、動画に自然なナレーションを当てる方法を初心者向けに解説していきます。

正直に言います。最初に触ったとき、あまりのリアルさに「え、これ人間じゃん?」って声出ました。

声優さん級のAIボイスで動画に命を吹き込む方法【初心者向け】

どんなときにAIナレーションが役立つの?

たとえば、こんなシーン。

  • 旅行Vlog
    自分の声が入るとちょっと恥ずかしい。代わりにAIナレーションを入れるとプロっぽくまとまります。
    「沖縄の青い海!まるで絵に描いたような絶景です」って声が入るだけで、一気にテレビ番組感。
  • 商品レビュー動画
    ガジェット系のレビューって、説明が長くなりがち。そんなときに落ち着いたAIボイスを使えば、信頼感が増します。
    実際、僕も最近レビュー動画を作ったんですが、「AIボイスの方が落ち着いてて聞きやすい」ってコメントをもらいました。
  • ラノベ朗読
    「声優さんに読んでもらえたらなぁ…」って思ったこと、ありますよね?
    AivisSpeechなら、AIキャラにセリフを振り分けて、ライトノベルをそのままドラマ仕立てにできます。深夜ラジオみたいな雰囲気になるんですよ。

AivisSpeechとは

AivisSpeechは、日本で開発されたAI音声合成ツール。人間の声に近い自然な読み上げが特徴で、文ごとに話者スタイル・速度・音量・無音区間・アクセントなどを調整可能。

特徴をざっくり言うと、

  • 声が人間っぽい。感情がちゃんとこもっている
  • Windows / Mac 対応
  • 個人利用も商用利用も無料 初期費用も月額料金も不要で、すぐに音声制作を始められる
  • クレジット表記不要(外部モデルを除く)自由な利用が可能

もうね、「これ本当に無料でいいの?」っていうレベルの神サービスです。

メリット

  1. 超リアルな声質 → ナレーション、ボイスドラマ、朗読に最適
    人間の声と区別がつかないほど自然で感情表現豊かな音声を生成できるため、動画ナレーションやボイスドラマに最適です。
  2. 商用利用OK → 仕事の案件にもそのまま使える
    商用利用可能なライセンスを含むモデルがあり、追加費用なしで使えるのが魅力です。
    ※公式ページでは「将来的に有料プランを導入する可能性はありますが、その場合でも追加機能のみが対象となります。」と説明されています。
  3. 業務効率化
    録音データの文字起こし機能やカスタムボイス生成が可能で、時間を大幅に削減できます。

デメリット

  1. スマホでは使えない → PC必須(Windows / Mac)
  2. 音声モデルは初期1人だけ → 追加は「AivisHub」からDLすれば様々な音声モデルを無料で入手できます。キャラクターの数が少ない点がものたりないです。
  3. 操作に慣れが必要
    イントネーションやアクセント、速度や喜怒哀楽などを編集することができますが、機能をフル活用するためには、ある程度のソフトウェア操作スキルが求められます。

初心者の方は「まずは読み上げてもらう」だけで十分楽しめます。

実際に使ってみよう

インストール

公式サイトからダウンロード
AivisSpeechの公式ページ(Aivis Project | AivisSpeech でかんたんに感情豊かな音声合成、使ってみませんか?)から対応するWindowsまたはMac版をダウンロードします。

インストーラーを起動し、画面の指示に従ってインストールを完了させます。

インストール時に「Windows によって PC が保護されました」「開発元が検証できないため開けません」と表示されます。
※公式ページでは「AivisSpeech は安全なソフトウェアですので、「詳細情報」→「実行」(Windows)、「キャンセル」→「システム環境設定」→「セキュリティとプライバシー」→「このまま開く」(Mac)をクリックして、インストールを進めてください。」としています。

自分専用の環境であればユーザーはデフォルトでOK。

プロジェクトの作成

AivisSpeechを起動
アプリを立ち上げて「新規プロジェクト作成」。

テキスト入力欄にナレーションしたい文章をコピペ。

あとは、枠の中にテキストを打ち込むだけ。シナリオ形式でまとめたテキストもコピペするだけでキャラクターごとにセリフを振り分けてくれます。

ここでポイント!

改行を使うと「文ごとに分割」されるので、後で調整が楽になります。

音声モデルを選ぶ

初期は「Anneli」ってキャラだけですが、AivisHub から他の声を追加可能。

キャラごとに「元気系」「落ち着き系」とか声の方向性が違うので、動画の雰囲気に合わせられます。

AivisHub (β) – AI 音声合成モデル共有サイト

音声を生成

右上の「再生」ボタンを押すと…はい、もう喋ってくれます。

リアルタイム変換なので、試行錯誤がすぐできるのが最高。

テキスト入力エリア
合成したい文章を入力します。コピペもOK。改行があると複数段に分けられます。

書き出し

WAV形式で保存可能。

動画編集ソフトにドラッグ&ドロップすれば、そのままナレーション完成です。

実際に試した動画例

僕が実際に作ったショート動画はこちら👇

この動画のナレーション、全部AivisSpeech。

「これ声優さんに読んでもらったの?」って言われるレベルでした。

 さらに便利な小ワザ

  • ?や!を入れると感情が出やすい
  • ショートカットキーを設定 → 再生、書き出しをワンタッチで
  • 保存設定を固定 → 上書き防止ONにすると修正がラク
  • GPU対応 → グラボ積んでるなら「GPUモード」で高速処理

ちょっとした工夫で作業効率が一気に上がります。

まとめ

AIナレーションはもう「お遊び」じゃなくて、完全に実用レベルです。

特にAivisSpeechは無料で始められるから、「ちょっと試してみようかな」って人にもピッタリ。

僕自身、AIボイスを導入したことで、動画のクオリティが一気に上がった感覚があります。

声優さんにお願いするのが難しいなら、まずはAIに頼ってみましょう。

ナレーションが変わると、動画の印象もガラッと変わります。

ぜひ試してみてください!

運用の知恵

「オプション」機能にある「エンジンモード」が初期設定だと「CPU」が選択されています。パソコンにこのようなグラフィックボードが搭載されてない場合 に「GPU」を選択すると声の生成がめちゃめちゃ遅くなる可能性が高いので注意。逆にグラボが搭載されている場合は「GPU」を選択すると声の生成が速くなります。

「保存」の項目にある 「書き出し先を固定」と 「上書き防止」を有効にしておくとけっこう便利です。保存先をあらかじめ指定しておくと 音声を保存するときに いちいち保存先を指定しなくてもよくなります。「上書き防止」を有効にしておくと、直しが生じた時、直し前の音声ファイルが別々に保存されるので修正の手間がなくなります。

AivisSpeechではいろんな ショートカットキーを設定することができます。「デフォルトに戻す」「再生」「音声書き出し」はショートカットキーに登録しておくと便利です。

AivisSpeechはテキストの内容を解析できる能力があるため、喜怒哀楽がわかりやすいセリフにしたり、文章の中に「? ! … ・・・」のような 記号を使うとAivisSpeechが読み取って感情表現を変えてくれます。

AivisSpeechは他の読み上げソフトのように「抑揚」の調整機能はありません。声の高さをいじると音質が劣化するという弱点も抱えているので注意しましょう。

「スタイルの強さ」を使うと喋りかたの特徴の強弱を調整できます。しかし、「ノーマル」モードでは自由に調整することができない仕様になっています。欠点というよりもノーマルはいわばお任せモードのようなものだからです。AivisSpeechが文脈を読み取り感情表現を自然な感じに調整してくれます。

調整のパラメータはマウスホイールで調整しますが、ctrl(command)キーを押しながらホイールを動かすことで細かな調整が可能です。

「読みの修正」 アクセントのテキストに合わせて左クリックすると読み方を修正することができます。

思いどおりの発音にならない。間違った読み方をする。など、いちいち修正するのが手間という場合は、「読み方&アクセント辞書」で単語と読み、アクセント調整の優先度を設定して登録できます。

気がつきにくいですが、AivisSpeechは途中から再生することができます。カーソルをアクセント区間の上のほうで左クリックしてから再生します。すると途中から再生することができます、

とはいえ、読みの補正はアクセントの調整ツールしかないため、VOICEVOXほど調整は楽ではありません。

AivisSpeechは音声合成モデルの追加ができます。モデルは「音声合成モデルの管理」をクリックして、右上にある「音声合成モデルを探す」から共有プラットフォーム「AivisHub」が表示されるので、そこからダウンロードしたり、BOOTHなど他のサイトからダウンロードできます。

「ファイルからインストール」の 「AIVMXファイルを選択」をクリックして、ダウンロードした音声モデルを選択し、「インストール/更新」をクリックすると追加登録できます。

(YMM4)でAivisSpeechを使う場合、基本なにもすることはありません。AivisSpeechをインストールした状態で YMM4を最新版に更新するだけです。 YMM4側で勝手にAivisSpeechを認識して、音声のリストにモデルが入ってるはずです。

利用規約

声合成モデルの利用規約は三つあります。

  • 「ACML」は AivisSpeechの標準的な規約みたいなもので 「禁止事項を守れば商用利用も複製も改変もOKですよ」っていう他と比べてもけっこう緩めの規約です。
  • 「ACML-NC」っていうのは ACMLに「商用利用の禁止」が追加されただけとなっているものです。
  • 「パブリックドメイン」は その名のとおり権利が放棄されて「自由に使っていいよ」という内容です。

最初のうちはHubからダウンロードして使うのがおすすめです。

AivisSpeech自体はクレジット表記が任意ですが 外部で提供されている音源はクレジット表記が必要です。

チュートリアル動画