誰もが自分のAI音声合成を作れる 音声フォント 登場

音声フォント
フルタニ
こんにちは、フルタニです。放送局で番組作りをしてました。 音声フォント を書きます。

しゃべりに自信がない人や顔出ししたくない人などに人気なのがAI音声サービス。

テキストを入力するだけで音声合成してくれるサービスです。

有名声優さんの声で読み上げてくれるなど、音声変換サービスは百花繚乱。

でも有料だったり、無料でも制約があったりと条件は様々です。

音声フォント サービス

「すべてのクリエイターに声を届ける」Web音声合成サービス『CoeFont STUDIO』が無料で公開を開始!

その中でも異色なのが、自分の肉声をAI音声読み上げソフトにできるというもの。

WebAI音声合成サービス『CoeFont STUDIO』が大型アップデート!機能追加に加え、より自然な声が発声可能に|株式会社Yellstonのプレスリリース

静かなところで約700個の指定された「台本」をレコーディングして、アップロードするだけ。

自分の声を「音声フォント」というものにすることで自分だけのオリジナルな人工音声をだけでも作れるというサービスです。

自分の声をweb上に上げると『CoeFont STUDIO』のAIがDeepLearningにより聞き取りやすい自然な音声合成により人間の声を再現してくれるのだそうです。

「動画の声あてに。無料音声合成のCoeFontSTUDIOを使ってみる」

黒しゃもじさんの投稿動画。

ナレーションのAI音声は別物。CoeFontSTUDIOの作例は2分30秒あたりで聞くことができます。

CoeFontの気になるところ
  • コエに勘定をこめられない
  • 調整できる範囲が少ない
  • サーバーが止まると使えない
  • 撮影中に自動露出調整機能は使えない

サーバーがダウンして使えなくなるケースは、ユーザー数が増えたりして回線が輻輳(ふくそう)すると起きやすくなることから気になります。

【ゆっくり解説】ゆっくり&CoeFontSTUDIOでCoeFontSTUDIO

こちらは二種類のAI音声を比較した動画。

Web上でアクセント調整やスピード調整などの機能を利用することができ、作成した音声はダウンロードしてSNSやゲームなどの音声に使用することができます。

誰もが手軽に「声」を使えるようになる、言うなれば「声のフォント」のようなものがいま、必要とされています。そこで、我々は人間の声道をAI(ディープラーニング)で定義しました。この方法では、コンピュータに最適化させるため、声道を忠実に再現できます。その結果、従来とは比べ物にならないくらい自然な音声を実現しました。

Yellston Co.,Ltd.

作ったのは 東京工業大学2年生の早川尚吾さん。

自らAIベンチャーYellston(東京都港区)を立ち上げ音声コンテンツ市場の開拓を目指しています。

利用料は15分収録のベーシックプランが500円から。商用利用も可能な品質で120分収録可能なプランが1500円とコストはべらぼうに高額なものでもなさそうです。

超難問AIテスト | あなたは何問正解できる??音声聞き分けクイズ

まとめ

サービスを見た限りではある程度の知識がないと使いこなすのは難しく感じます。

いつでもどこでも自分の声をデジタル化できるだけでなく、編集も可能。自分の声なので権利の問題も自分だけで完結するのは魅力です。

自分の声は本人特定の要素になりうるためセキュリティの不安もありますが、セルフブランディングが求められる時代に様々な可能性を秘めているように思います。

15分500円という金額ですが、手際よく収録ができる人にとっては計算が立ちますが、慣れていない人にとっては結構負担になるのではないかと思います。