動画制作の“アプリ切り替え地獄”終わり。 Antigravity にVOICEVOX音声生成を丸投げする方法

動画編集やってると、地味に心を削ってくる作業があります。

「アプリの切り替え」です。

  • 台本はChatGPT
  • 音声はVOICEVOX
  • 編集はPremiere(またはDaVinci)
  • テロップは別プラグイン
  • 書き出しして、ファイル名整えて…

……いや、作る前に疲れるんよ。

僕も、雑学動画とか定型フォーマットの動画を量産してた時期、
この「切り替え」だけで体感30%くらいの時間が溶けてました。

そんな中で、最近ゾワっとしたのがこれ。

Antigravityを使うと、VOICEVOXのキャラボイス生成を“AIが操作してやってくれる”んですよ。

つまり、あなたはこう言うだけ。

「ずんだもんで“おはよう”作って、四国メタンで“こんにちは”作って、wavで保存して」

そしたら本当に、VOICEVOXを開いて、キャラ切り替えて、音声出力までやってくれる。

……うん。意味わからんでしょ?
僕も最初そうでした。
でも実際に動くと、「これ、動画制作の形変わるな」ってなります。

今日はそれを、初心者でもつまずかないように、超具体的に解説します。

Antigravity にVOICEVOX音声生成を丸投げする方法

VOICEVOXの立ち位置は「声担当」

今回のポイントはこれです。

  • VOICEVOXは起動しておくだけ
  • 声の選択もAntigravityがやる
  • テキスト入力→音声生成→wav書き出しまで自動で実行

つまり👇
「VOICEVOXを操作して」と言う必要すらない
(もちろん、指示してもOK)

効果的なシーン例(めちゃ現場で効く)

たとえばこんな時。

  • 雑学ショート:毎回同じ構成で、音声だけ差し替える
  • 掛け合い動画:A(ずんだもん)→B(四国メタン)→A…を量産
  • EC/商品紹介:キャラ別で同じ台本を読み分けてABテスト
  • YouTubeの固定コメント用音声:毎回同じ文面を別キャラで作る

地味に効くのは、“作業者の脳の消耗”が減ること。
切り替えが減ると、集中力が落ちない。
これが一番デカいです。

メリット / デメリット(現実ベースで)

メリット

  • 定型動画の量産が速い
    アプリを切り替えず、指示だけで進むので本当に時短。
  • Remotionと組むと編集まで一気通貫
    音声→テロップ→尺合わせ→書き出しまで“流れるように”繋がる。

デメリット

  • 発音やアクセントの違いは結局チェックが必要
    「え、そこそう読む?」問題は起きます。
    ここだけは完全自動化しづらい。
  • 最初のセットアップは詰まりやすい
    ただし、詰まってもスクショ投げれば解決できるのがAntigravityの良さ。

工程解説:ずんだもん&四国メタンが挨拶する音声ファイルを作る

この記事でやりたいことを整理します👇

  • PCにインストール済みの VOICEVOX を使って
  • ずんだもん四国メタン
  • 「おはよう」「こんにちは」と挨拶する
  • 音声ファイル(wav)をキャラ別に出力したい

さらに将来的には

  • Remotionで短い動画(out.mp4)にしたい
    という流れです。

ここからは、そのまま使える手順でいきます。

全体の流れ(俯瞰)

  1. VOICEVOXを起動して待機
  2. Antigravityに「やりたいこと」を日本語で指示
  3. Antigravityが
     - VOICEVOXを操作
     - 音声を生成
     - wavで保存
  4. (次の段階)Remotionで動画化
  5. out.mp4が出力される

👉 あなたは コードもRemotionのUI操作も不要 です。

STEP 1|VOICEVOXを先に起動する(重要)

まず、VOICEVOXを起動しておきます。

  • ずんだもん
  • 四国メタン

が選択できる状態ならOK。
(音声生成はAntigravityがやります)

⚠️ VOICEVOXを閉じたままだと
Antigravityは「操作できるアプリ」と認識できず、止まりやすいです。

STEP 2|Antigravityに出す「最初の指示」

右側の Antigravity Agent に、これをコピペ。

PCにインストール済みのVOICEVOXを使います。

・ずんだもんが「おはよう」
・四国メタンが「こんにちは」

と順番に話す音声を生成してください。

VOICEVOXを操作して、
それぞれの音声をwavファイルとして保存してください。

ここが大事で、まずは 動画化しません

👉 最初は「音声だけ」を確実に作らせる
このほうが成功率が高いです。

STEP 3|Antigravityの操作を「承認」していく

途中でこんな表示が出ます。

  • 「VOICEVOXを操作していいですか?」
  • 「ファイルを保存していいですか?」

👉 全部 Accept(承認) でOK。

するとAntigravityが勝手に

  • ずんだもんを選択
  • テキスト入力
  • 生成・書き出し
  • 四国メタンに切り替え
  • 同じことを実行

までやってくれます。

この瞬間、たぶんニヤけます。
「え、俺、何もしてないけど…?」ってなる。

もし止まったら(超重要)

万一、

  • VOICEVOXが動かない
  • キャラが見つからない
  • wavが保存されない

などが出たら👇をやってください。

その画面をスクショ → そのままこの入力欄に貼って

ここで止まりました。どう直せばいいですか?

と送るだけでOKです。

図のように回答が返ってきて、修正がはじまります。
👉 エラー対応も Antigravity の仕事です。

STEP 4|音声が“キャラ別”に分かれる理由(超重要)

VOICEVOXは基本的に

  • ずんだもん.wav
  • 四国メタン.wav

みたいに、キャラごとに音声が分かれて出力されます。

これは掛け合い動画を作る時に超便利です。

なぜなら編集では

  • ずんだもん=Aトラック
  • 四国メタン=Bトラック

のように分けた方が、修正がラクだから。

逆に言うと、掛け合いを一本の音声にまとめちゃうと
後から「こっちの声だけ直したい」ができなくなります。

STEP 5|(次の段階)Remotionで動画化する指示

音声ができたら、次にこう指示します。

今作成した2つのwavを使って、Remotionで短い動画を作ってください。

仕様:
・背景は白
・文字は黒
・画面中央に表示
・ずんだもんの「おはよう」→四国メタンの「こんにちは」の順
・音声が終わった瞬間に動画も終了
・出力ファイルは out.mp4

Remotionのいいところはここ。

  • テロップ
  • 尺合わせ
  • フェード
  • 書き出し

全部、言葉で直せる

編集ソフトを触るより速いです。

STEP 6|完成動画の場所

動画の保存場所はAntigravityをインストールする際デスクトップに作ったフォルダです。基本はこれ👇

antigravity-project
└ remotion-test
  └ out
    └ out.mp4

またはプロジェクト直下に out.mp4 が更新されます。
(あなたの画面だと、左のツリーに見えてる「out.mp4」がそれ)

完成した音声がたまに日本語になっていない場合があります。

その場合も「日本語が正しくありません」と返信するだけで修正版のファイルに上書きされます。

よくある失敗(先に潰す)

❌ VOICEVOXを起動していない

→ 音声生成で止まる。まず起動。

❌ いきなり「音声+動画」全部やらせる

→ 最初は
音声 → 動画
の2段階が成功率高い。

❌ 自動実行ONで暴走

→ 慣れるまで Request Review推奨
Acceptしながら進めるのが安全。

まとめ:これは「工程管理革命」です

動画制作って、実は編集技術よりも

  • 準備
  • 切り替え
  • 書き出し
  • ファイル管理

この“周辺作業”が重い。

Antigravityは、そこを一気に削ります。

特にVOICEVOXみたいな
「毎回同じ操作を繰り返すツール」は相性抜群。

そしてRemotionと繋げると
音声→動画編集→書き出しまで一本化できる。

だから僕はこれ、こう言いたい。

「動画制作の苦しさって、編集じゃなくて“工程”だったんだな」

もし今、あなたが
雑学・会話・定型ショートを量産しているなら、
この仕組みは一回触ったほうがいいです。