初心者でもできる! DomoAI でアニメイラストを口パク動画にする方法

フルタニ

こんにちは、フルタニです。放送局で番組作りをしてました。 DomoAI でアニメイラストを口パク動画にする方法を書きます。

「HeyGen や Kling …“〇〇AIのリップシンクがすごい!”って聞くけど、結局どれがどうすごいの?」あなたもそう思ってませんか?僕も最初、情報量に圧倒されて「…で、結局自分でも使えるの?」とブラウザをそっと閉じました(笑)。

そんな中で、僕が「これはコスパいい&初心者向け」と感じたのが DomoAI。

  • アニメ/イラストに特化したリップシンク機能。
  • 静止画(イラスト)→「口が動く動画キャラ」へ変換可能。
  • 音声アップロード or テキスト→音声(TTS)→口パク生成の流れ。

「アニメもいけちゃうやつとかある?」という疑問に、まさに“Yes”を出してくれたツールです。

例えば、あなたが作ったLoFi動画の横に“AIおばあちゃんキャラ”を置いて、AI音声で「お茶どうぞ〜」って言わせる。そんな演出も、DomoAIなら意外とスムーズにできます。

DomoAI でアニメイラストを口パク動画にする方法

DomoAIとは

DomoAI(ドモエーアイ)は、
「イラストや写真、音声をAIが自動で動かしてくれるツール」です。

たとえば——

  • 静止画のキャラクターをしゃべらせたり
  • 写真を歌わせたり
  • アニメ風の映像を自動で作ったり

といったことが、専門知識ゼロでも数クリックでできるのが特徴です。

動画をアニメ風に変換する

実践ステップ:アニメイラストが喋る動画に変わるまで

では、僕が実際にやってみましょう。

ステップ①:イラストを準備

準備必須なのが主人公となるキャラクターの立ち絵です。

例えばあなたが「LoFi読書少女」のイラストを描いたとします。前景にキャラ、背景にバルコニー、夜の東京。

このイラストを DomoAI にアップロードするために、なるべく“正面顔・口元が分かる構図”が望ましいです。表情はなくてもかまいません。あとから解説しますが、残念ながら背景透過画像を用意する必要はありません。

静止画なので目線&肩の向きが固定だと成功率高めです。

ステップ②:音声を用意

キャラクターに喋らせる音声も必須。生声でも人工音声に喋らせた音声でもかまいません。

  • 自分で録音する:スマホでもOK。「こんばんは、今日も読書タイムだね」など短めに。
  • またはTTSを使う:英語・日本語どちらも対応。DomoAI 内で選択可能。 ℹ️ この時のコツ:音声冒頭/終わりに“無音”を1-2秒入れておくと、口の開閉が自然になります。

ステップ③:DomoAIで「Lip Sync Video(口パク動画)」を作る

さてここからが作業本番です。

DomoAI: video to video, video to animation and more

DomoAIにログイン → “AI アバター”を選択。

イラストと音声をアップロード 。

プロンプト欄にアクションさせたいポーズのイメージを言葉にして細かく指示します。

TTS=文字を自動で音声に変える機能のことです。たとえば、「こんにちは、今日もがんばろう!」と入力すると、AIがその文字を読んで“声”にしてくれる仕組みです。
つまり、あなたがマイクで録音しなくても、AIが代わりに話してくれるんです。
DomoAIなどのツールでは、この「TTSで作った声」を使って、キャラクターの口を動かす(=口パク動画を作る)ことができます。

生成ボタンを押して、レンダリング。数分〜数十分(動画長、解像度による)でデータ完成。最新モデルでは「5分以内で生成できた」という報告あり。

完成した動画をダウンロード。例えば、1920×1080で書き出して、YouTube・TikTok用に編集しましょう。

以上で完了です。無料版の場合生成は一回限りOK。左上にロゴが入ります。

商用利用が目的なら有償版が必要です。

演出の工夫:動画編集で“脇に置くキャラ”に活用

あなたがメインのLoFi読書動画を作っているとしたら、右下コーナーにこの“しゃべる少女キャラ”を挿入すると、画面がグッとプロ仕様になります。
例えば:

  • BGM入れて → “読書している手元”カット
  • 少女キャラ「ふふ、今日はおすすめ本があるよ」
  • 本のカット/テキスト情報 → キャラ「この本、これこれ××で…」
    こういう構成で「視聴者との距離感が縮まる演出」が可能です。

【裏技】DomoAIで“グリーン背景”にして書き出す裏技

これは少しテクニカルですが、背景を単色(緑など)に設定して後でクロマキー除去する方法です。

  1. DomoAIにアップロードする元イラストを、背景を緑一色にしておく(例:#00FF00)
  2. 口パク動画を生成
  3. 書き出した動画をPremiere ProやCapCutで読み込み
  4. 「クロマキー」または「グリーンスクリーン除去」を適用

すると、擬似的に透過背景として使えます。

メリット・デメリット

✅メリット

  • 低コスト&短時間で「イラストがしゃべる」演出ができる。従来のモーショングラフィックス/キャラクターアニメーションより圧倒的に簡易。
  • アニメ・イラスト特化だから、“それっぽさ”が出しやすい。DomoAI公式でも「anime & cartoon style support」明記。 (DomoAI)
  • 副業・クリエイター視点で魅力的:YouTubeサムネやTikTokでキャラを口パクさせるだけでバズるパターンあり。差別化できる。
  • 初心者も始めやすい:専門スキル不要、ボタン操作中心。
  • 多用途:YouTube用、SNS用、背景素材+キャラ演出、教材動画、Vtuberサブキャラ演出など活用幅広い。

⚠️デメリット

  • 表情・動きの自由度が制限される:口パクはOKでも“手を動かす”“歩く”“視線を大きく変える”など複雑な動きは別途アニメーション制作が必要。実ユーザーの声でも「手の動き・衣服の変形が少し不自然」という報告あり。 (Medium)
  • 著作権・利用規約の確認が必要:イラスト素材が自分のものでなければ、使用条件を要チェック。音声にクローン声を使う場合も慎重に。
  • レンダリング時間とクレジット消費:無料枠では使える回数・解像度に制限あり。量産には課金/投資が必要。
  • 技術的な“味付け”は必要:口パクだけでも「イントネーションに合ってない」「口の開き方がちょっと違う」と感じることあり。編集で微調整を入れるか、“演出”として割り切ることも。
  • 日本語のTTS音声/イントネーションが外国語寄りのことあり:日本語話者に“違和感”を与えないために録音自分で+編集で調整がオススメ。

課金について

数体程度のアバター作成のみの目的の場合、月額約10ドル(1,500円)のベーシック版がお勧めです。(Heygenは約29ドル。klingは約7ドル)一回15クレジットなので30体程度はアバターが作れます。

支払いは日本になじみのないStripe(クレカOK)、Alipay、Lipiのみなので微妙です。

注意:DomoAI単体では「透過動画(背景なし)」出力はできません

DomoAIの出力形式は現在(2025年10月時点)、

  • .mp4または.mov形式(背景込み)
    のみです。

つまり、グリーンバック(緑背景)や透過背景の設定機能はまだ非対応
背景を透明にしたい場合は、後処理(別ツールでの合成・除去)が必要になります。

💡解決策①:CapCutまたはAfter Effectsで「背景削除」する

DomoAIで書き出した動画を編集ツールに読み込み、背景を消します。

🪄方法A:CapCut(無料でOK)

  1. DomoAIで生成した動画を保存
  2. CapCutを開き、動画をタイムラインに置く
  3. クリップを選択 →「背景削除」または「AI背景除去」をクリック
  4. 自動的にキャラクターだけを残して透過(または別背景に差し替え)

📱スマホでも使えるし、AI除去の精度が高いので、初心者にもおすすめです。

🪄方法B:After Effects(プロ向け)

  1. DomoAI動画を読み込み
  2. 「Roto Brush 2(ロトブラシ)」ツールを使ってキャラを切り抜く
  3. 背景を透明(アルファチャンネル)にして書き出す
  4. .mov(ProRes 4444)形式で保存すれば完全な透過動画

🎥 DaVinci ResolveのFusionでも同様の処理は可能ですが、
最も安定してるのはAfter Effectsのロトブラシです。

💡解決策②:Remove.bgやRunwayで自動処理

もし動画が短い(5〜10秒程度)なら、オンラインのAI背景除去ツールも便利です。

ツール特徴
Runway ML動画対応、背景除去の精度が高い、無料枠あり
Unscreen.com短尺動画専用、完全自動で透過処理(最大5秒)
Remove.bg静止画用(動画の各フレームを抜きたい場合は分割が必要)

たとえば:

  1. DomoAIで生成した動画をUnscreenにアップロード
  2. 背景を自動削除
  3. .mov(透過)でダウンロード
    👉 これをPremiere ProやDaVinci Resolveに合成すれば完成です。

🔍補足:将来的なDomoAIの「透明背景出力」対応について

  • DomoAI公式のロードマップ(2025年10月更新)では、
    “Avatar transparent output support” が「開発中」と記載あり。
  • つまり、今後は「PNGシーケンス or アルファ付き動画」で出力できる可能性があります。
  • 現時点では、外部ツールを組み合わせるのが現実的な最適解です。

ちょっとしたコツ & Q&A

  • 口の動きが合わない時:音声のイントロ/アウトロをフェードイン・フェードアウトにしてみてください。無音→ちょっと息が入る音の流れを入れておくと自然。
  • キャラと背景のバランス:イラストキャラを背景映像(例:夕暮れの窓辺)に乗せる場合、キャラの輪郭が浮かないよう「薄く光を当てる」「少しシャドウを入れる」など編集で統一感を出すのがプロっぽくなります。
  • 音声/字幕の同期:口パクだけで動画完結させるなら「字幕あり+キャラ口パクあり」が視認性・理解率ともにグッと上がります。
  • ブランド化を意識するなら:キャラの表情バリエーション(微笑/ウインク/困り顔)を用意して、シリーズ動画として「毎回出てくるキャラクター」に昇格させるとファン化につながります。
  • 実験してから量産を:まずは30秒〜1分程度で「こういう感じか」を把握するのが◎。失敗しても痛手少ないです。

まとめ

僕自身、テレビドラマの制作現場から動画編集に転じて、「いかに効率よく・インパクト出して・収益化できるか」を常に考えてきました。今回、あなたが目指す「クリエイターとしてのパーソナルブランド構築」や「副業収益化」には、こうした“キャラクター+口パク演出”は非常に有効です。

例えば、あなたのチャンネルに「AIキャラクター編集講座」「週一編集チャレンジ」「アニメイラスト×副業ノウハウ」などのシリーズを加えて、この口パク技術をアイキャッチに使えば、視聴者は「お、このキャラ出てる=信頼できるコンテンツ」と認識してくれます。

最新情報:2025年10月時点で押さえておくべきアップデート

最新バージョンでは以下のような強化点があります。

  • “Talking Avatar”モデルの精度向上。コミュニティ報告で「目の動き・表情も前より自然」って声あり。
  • 静止画→動画(Image to Video)やアニメスタイル対応強化。こういう“イラストでOK”系が充実。
  • 音声入力&多言語対応の向上。日本語でもTTS音声を入れて口パクを作る実例が増えてます。
  • レンダー時間・クレジット制の改善(試用枠があり、まずは無料で触れる仕様)。