声優ゲットだぜ! 合成音声AIツール AivisSpeech の使い方

フルタニ

こんにちは、フルタニです。放送局で番組作りをしてました。 音楽生成AI を書きます。

声優さんのような声で読み上げてくれる合成音声AIツールを探している人いませんか。

実在の人物と見分けがつかないほど滑らかなしゃべりを実現してくれるサービスが登場しました。それがAivisSpeechです。

AivisSpeechは、日本で開発された高性能なAI音声合成ツールで、人間の声と区別できない自然な音声を生成できます。

このブログでは、初心者でも簡単に始められるAivisSpeechの基本的な使い方を解説します。

合成音声AIツールAivisSpeechの使い方【初心者向け】

AivisSpeechとは

人間の声に近い自然な読み上げが特徴で、文ごとに話者スタイル・速度・音量・無音区間・アクセントなどを調整可能。

Windows と Mac の両方に対応。クレジット表記も不要で自由な利用が可能。個人利用から商用利用まで、完全無料。初期費用も月額料金も不要で、すぐに音声制作を始められるという、神サービスです。

メリット

  1. 高品質な音声合成
    人間の声と区別がつかないほど自然で感情表現豊かな音声を生成できるため、動画ナレーションやボイスドラマに最適です。
  2. 無料で利用可能
    商用利用可能なライセンスを含むモデルがあり、追加費用なしで使えるのが魅力です。
    ※公式ページでは「将来的に有料プランを導入する可能性はありますが、その場合でも追加機能のみが対象となります。」と説明されています。
  3. 業務効率化
    録音データの文字起こし機能やカスタムボイス生成が可能で、時間を大幅に削減できます。

デメリット

  1. ローカル環境が必要
    Windows/MacのPCにソフトをインストールする必要があるため、スマートフォンでは利用できません
  2. 音声モデルの制限
    無料版で利用できる音声モデルは一人です。AivisHubを通じて、様々な音声モデルを無料で入手できます。キャラクターの数が少ない点がものたりないです。
  3. 操作に慣れが必要
    イントネーションやアクセント、速度や喜怒哀楽などを編集することができますが、機能をフル活用するためには、ある程度のソフトウェア操作スキルが求められます。

インストール

公式サイトからダウンロード
AivisSpeechの公式ページ(Aivis Project | AivisSpeech でかんたんに感情豊かな音声合成、使ってみませんか?)から対応するWindowsまたはMac版をダウンロードします。

インストール
ダウンロードしたインストーラーを起動し、画面の指示に従ってインストールを完了させます。

インストール時に「Windows によって PC が保護されました」「開発元が検証できないため開けません」と表示されます。
※公式ページでは「AivisSpeech は安全なソフトウェアですので、「詳細情報」→「実行」(Windows)、「キャンセル」→「システム環境設定」→「セキュリティとプライバシー」→「このまま開く」(Mac)をクリックして、インストールを進めてください。」としています。

自分専用の環境であればユーザーはデフォルトでOK。

公式ページでは、AivisSpeechのほかに、ユーザーが制作したモデルを無料でダウンロードできる音声合成モデル共有プラットフォーム「AivisHub」や、かんたんな操作で高品質な音声合成モデルを制作できる無料ツール「AivisBuilder」(現在開発中)、AI 音声合成モデルファイル (AIVM / AIVMX) を、簡単に制作・編集できる「AIVM Generator」、従量課金制の HTTP API サービスなども利用できます。

プロジェクトの作成

AivisSpeechを起動
起動後、「新規プロジェクト作成」ボタンをクリックします。
※初回起動のみ、AivisSpeech は必要なモデルデータをダウンロードするため、起動の完了まで数分程度かかります。

初回起動時のみライセンス、プライバシーポリシーの確認があります。

ホーム画面はいたってシンプルです。

音声モデルの選択
初期設定ではデフォルトのAnneli(ノーマル)のみが登録されています。追加キャラクターはAivisHub (β) – AI 音声合成モデル共有サイトから選べます。

AivisHub (β) – AI 音声合成モデル共有サイト

好みのキャラクターを.aivmxファイルでダウンロードしたら、[設定][音声合成モデルの管理]から管理画面に進み、右上にある[インストール/更新]からキャラクターを追加できます。話者を変更するには、モデルをデフォルトで選んだ上、アプリを再起動する必要があります。キャラクターの切り替えは[設定][話者リスト]から話者の並びを替えることで反映されます。

テキストを入力して音声を生成

画面右のプリセットからプリセットボイスを選び、音声スタイルを決定します。

テキスト入力エリア
合成したい文章を入力します。コピペもOK。改行があると複数段に分けられます。

再生ボタンをクリック
入力したテキストがリアルタイムで音声に変換されます。

画面左上、左から4つ目のアイコンをクリックすると連続再生が始まります。

音声のエクスポート

音声の確認
再生して内容に問題がないか確認します。

保存
画面右上の「選択音声を書き出し」ボタンをクリックして、保存先を指定するとWAV形式で音声を保存できます。

便利な機能

  • カスタム音声の作成
    AivisBuilderを利用すれば、自分の声を音声モデルに追加することも可能です。
  • 高品質な音声合成
    最新技術であるStyle-Bert-VITS2を活用して、プロフェッショナルな音声制作が可能です。

チュートリアル動画

おわりに

私が普段利用しているのは有料のVoicePeakです。このサービスと比較しても遜色ないクオリティだったので驚きました。

現状使えるキャラクターが一人なので様子見ですが、サービスが充実してきたら使いたいと思います。

AivisSpeechは、初心者でも簡単に使える直感的なインターフェースが魅力です。ナレーション作成や動画編集など、幅広い用途に活用できます。ぜひ挑戦してみてください!