AI彼女も生成できる トーキングフォト サービス6選

フルタニ

こんにちは、フルタニです。放送局で番組作りをしてました。 トーキングフォト を書きます。

トーキングフォトとは写真などの人物静止画を音に合わせて口パクさせる動画のこと。

Vtuber動画などでアニメキャラが喋る動画を見かけますが、人間が喋ることでより強い印象を伝えることができます。

そんなトーキングフォトを手軽に作れるサービスをいくつか紹介します。

トーキングフォト動画が生成できるAIサービス

トーキングフォトを使うメリットは次の通りです。

  • 人件費を節約できる
  • 見た目のインパクトが強い
  • 制作時間の節約につながる

最大のメリットは、リアルな人を使うと発生する人件費が下げられることです。出演料や旅費などの直接費や、収録機材や収録時間などの費用、著作権料などがあたります。

ソフトによっては身振り手振りも可能なため、視聴者に対するインパクトも強く、動画の内容を分かりやすく伝えることができます。

収録時の修正作業もテキスト原稿を手直しするだけで、好きな時間に何度でもリテイクできるのでスケジュール管理も簡単です。

デメリットは、リアルな人物ほど表現力が豊かではないこと。そのため、信頼感や高級感を大切にしたい動画などには使いにくいかもしれません。

無料でトーキングフォトが作れるSadTalker

無料でトーキングフォトを作るにはSadTalkerがおすすめです。

使い方は簡単。

HuggingFaceのSadTakerにアクセスして、操作パネルから素材画像と音声素材をアップロードするだけです。

デメリットは、生成画像の画角が固定されていること。

そのため高解像度の生成動画がつくれないことです。

画像の品質にこだわりたい人は、有料サービスを選ぶことで自由な画像生成ができます。

有料トーキングフォト

Creative Reality Studio

テキストを打ち込むことで、アバターやアニメーション作成ができるウェブツールです。Open AIの「GPT-3」や「Stable Diffusion」とStudio D-ID独自のジェネレーティブAI技術を融合させたサービスが提供されています。

詳しくはレビュー記事を参照ください。

HeyGen(旧:Movio)

テキストさえあれば、イラストや写真を喋らせることができるAIサービスです。

モデルは数十種類用意されていて、そのモデルを使うことですぐにでもアバター製作が可能です。

AI STUDIO

elai.

パワーポイントみたいなUIが特徴。アジア系のモデルは少ないが、日本語トークは可能。買い切りで、500ドル(6.5万円)と値段がそこそこするのが難点。

日本語のチュートリアルは作られていません。

Colossyan Creator

テキスト文章を入力するだけで、簡単に写真の人物を動画してしゃべらせることができます。

期間限定の無料アカウントでテストができます。本格利用するには、$30/月のBasicプランに加入する必要があります。

まとめ

日本語で操作しやすいのは「Creative Reality Studio」と「HeyGen」なので、実際のおすすめ候補はこの2択に絞られます。

トーキングフォト動画には、企業プロモーションや教育ビデオ、YouTube動画等、様々な活用法が眠っています。

ソフトの開発や改善の頻度も高いので、使い勝手の良いサービスがより廉価で登場することも期待できます。

今のうちから習熟しておくことをお勧めします。