動画編集やってると、地味に心を削ってくる作業があります。
「アプリの切り替え」です。
- 台本はChatGPT
- 音声はVOICEVOX
- 編集はPremiere(またはDaVinci)
- テロップは別プラグイン
- 書き出しして、ファイル名整えて…
……いや、作る前に疲れるんよ。
僕も、雑学動画とか定型フォーマットの動画を量産してた時期、
この「切り替え」だけで体感30%くらいの時間が溶けてました。
そんな中で、最近ゾワっとしたのがこれ。
Antigravityを使うと、VOICEVOXのキャラボイス生成を“AIが操作してやってくれる”んですよ。
つまり、あなたはこう言うだけ。
「ずんだもんで“おはよう”作って、四国メタンで“こんにちは”作って、wavで保存して」
そしたら本当に、VOICEVOXを開いて、キャラ切り替えて、音声出力までやってくれる。
……うん。意味わからんでしょ?
僕も最初そうでした。
でも実際に動くと、「これ、動画制作の形変わるな」ってなります。
今日はそれを、初心者でもつまずかないように、超具体的に解説します。
Antigravity にVOICEVOX音声生成を丸投げする方法
VOICEVOXの立ち位置は「声担当」
今回のポイントはこれです。
- VOICEVOXは起動しておくだけ
- 声の選択もAntigravityがやる
- テキスト入力→音声生成→wav書き出しまで自動で実行
つまり👇
「VOICEVOXを操作して」と言う必要すらない
(もちろん、指示してもOK)
効果的なシーン例(めちゃ現場で効く)
たとえばこんな時。
- 雑学ショート:毎回同じ構成で、音声だけ差し替える
- 掛け合い動画:A(ずんだもん)→B(四国メタン)→A…を量産
- EC/商品紹介:キャラ別で同じ台本を読み分けてABテスト
- YouTubeの固定コメント用音声:毎回同じ文面を別キャラで作る
地味に効くのは、“作業者の脳の消耗”が減ること。
切り替えが減ると、集中力が落ちない。
これが一番デカいです。
メリット / デメリット(現実ベースで)
メリット
- 定型動画の量産が速い
アプリを切り替えず、指示だけで進むので本当に時短。 - Remotionと組むと編集まで一気通貫
音声→テロップ→尺合わせ→書き出しまで“流れるように”繋がる。
デメリット
- 発音やアクセントの違いは結局チェックが必要
「え、そこそう読む?」問題は起きます。
ここだけは完全自動化しづらい。 - 最初のセットアップは詰まりやすい
ただし、詰まってもスクショ投げれば解決できるのがAntigravityの良さ。
工程解説:ずんだもん&四国メタンが挨拶する音声ファイルを作る
この記事でやりたいことを整理します👇
- PCにインストール済みの VOICEVOX を使って
- ずんだもん と 四国メタン が
- 「おはよう」「こんにちは」と挨拶する
- 音声ファイル(wav)をキャラ別に出力したい
さらに将来的には
- Remotionで短い動画(out.mp4)にしたい
という流れです。
ここからは、そのまま使える手順でいきます。
全体の流れ(俯瞰)
- VOICEVOXを起動して待機
- Antigravityに「やりたいこと」を日本語で指示
- Antigravityが
- VOICEVOXを操作
- 音声を生成
- wavで保存 - (次の段階)Remotionで動画化
- out.mp4が出力される
👉 あなたは コードもRemotionのUI操作も不要 です。
STEP 1|VOICEVOXを先に起動する(重要)

まず、VOICEVOXを起動しておきます。
- ずんだもん
- 四国メタン
が選択できる状態ならOK。
(音声生成はAntigravityがやります)
⚠️ VOICEVOXを閉じたままだと
Antigravityは「操作できるアプリ」と認識できず、止まりやすいです。
STEP 2|Antigravityに出す「最初の指示」

右側の Antigravity Agent に、これをコピペ。
PCにインストール済みのVOICEVOXを使います。
・ずんだもんが「おはよう」
・四国メタンが「こんにちは」
と順番に話す音声を生成してください。
VOICEVOXを操作して、
それぞれの音声をwavファイルとして保存してください。
ここが大事で、まずは 動画化しません。
👉 最初は「音声だけ」を確実に作らせる
このほうが成功率が高いです。
STEP 3|Antigravityの操作を「承認」していく
途中でこんな表示が出ます。
- 「VOICEVOXを操作していいですか?」
- 「ファイルを保存していいですか?」
👉 全部 Accept(承認) でOK。
するとAntigravityが勝手に
- ずんだもんを選択
- テキスト入力
- 生成・書き出し
- 四国メタンに切り替え
- 同じことを実行
までやってくれます。
この瞬間、たぶんニヤけます。
「え、俺、何もしてないけど…?」ってなる。
もし止まったら(超重要)
万一、
- VOICEVOXが動かない
- キャラが見つからない
- wavが保存されない
などが出たら👇をやってください。
その画面をスクショ → そのままこの入力欄に貼って

ここで止まりました。どう直せばいいですか?
と送るだけでOKです。

図のように回答が返ってきて、修正がはじまります。
👉 エラー対応も Antigravity の仕事です。
STEP 4|音声が“キャラ別”に分かれる理由(超重要)
VOICEVOXは基本的に
- ずんだもん.wav
- 四国メタン.wav
みたいに、キャラごとに音声が分かれて出力されます。
これは掛け合い動画を作る時に超便利です。
なぜなら編集では
- ずんだもん=Aトラック
- 四国メタン=Bトラック
のように分けた方が、修正がラクだから。
逆に言うと、掛け合いを一本の音声にまとめちゃうと
後から「こっちの声だけ直したい」ができなくなります。
STEP 5|(次の段階)Remotionで動画化する指示

音声ができたら、次にこう指示します。
今作成した2つのwavを使って、Remotionで短い動画を作ってください。
仕様:
・背景は白
・文字は黒
・画面中央に表示
・ずんだもんの「おはよう」→四国メタンの「こんにちは」の順
・音声が終わった瞬間に動画も終了
・出力ファイルは out.mp4
Remotionのいいところはここ。
- テロップ
- 尺合わせ
- フェード
- 書き出し
全部、言葉で直せる。
編集ソフトを触るより速いです。
STEP 6|完成動画の場所

動画の保存場所はAntigravityをインストールする際デスクトップに作ったフォルダです。基本はこれ👇
antigravity-project
└ remotion-test
└ out
└ out.mp4
またはプロジェクト直下に out.mp4 が更新されます。
(あなたの画面だと、左のツリーに見えてる「out.mp4」がそれ)
完成した音声がたまに日本語になっていない場合があります。
その場合も「日本語が正しくありません」と返信するだけで修正版のファイルに上書きされます。

よくある失敗(先に潰す)
❌ VOICEVOXを起動していない
→ 音声生成で止まる。まず起動。
❌ いきなり「音声+動画」全部やらせる
→ 最初は
音声 → 動画
の2段階が成功率高い。
❌ 自動実行ONで暴走
→ 慣れるまで Request Review推奨
Acceptしながら進めるのが安全。
まとめ:これは「工程管理革命」です
動画制作って、実は編集技術よりも
- 準備
- 切り替え
- 書き出し
- ファイル管理
この“周辺作業”が重い。
Antigravityは、そこを一気に削ります。
特にVOICEVOXみたいな
「毎回同じ操作を繰り返すツール」は相性抜群。
そしてRemotionと繋げると
音声→動画編集→書き出しまで一本化できる。
だから僕はこれ、こう言いたい。
「動画制作の苦しさって、編集じゃなくて“工程”だったんだな」
もし今、あなたが
雑学・会話・定型ショートを量産しているなら、
この仕組みは一回触ったほうがいいです。









