正直、ここまできたか…って思いました。
ミュージックビデオ、もう全部AIで作れる時代きちゃいました。
「歌えないし、楽器も弾けないし、カメラもないんだけど!?」って人ほど、今回の話は刺さると思います。
この記事では、
- 作詞:ChatGPT(歌詞を秒で生成)
- 作曲:Suno(フル尺の楽曲をAIで生成)
- 映像:Kaiber(Audio to movieでMV化)
という“ほぼノー撮影・ノー楽器”の完全AIミュージックビデオ制作フローを、初心者向けにがっつり解説します。
🌸完全AIで作るミュージックビデオ|人間、もういらないかもしれない件。
0. 全体像:完全AIミュージックビデオのワークフロー
ざっくり流れはこんな感じです。
- コンセプトを決める
┗ テーマ・季節・ジャンル・世界観をざっくり決める - ChatGPTで歌詞を書く
┗ SNSでバズりそうな歌詞をプロンプトで指示 - Sunoで曲を生成する
┗ 歌詞+ジャンル指定でフル尺の楽曲を作る eesel AI+1 - Kaiberで「Audio to movie」的に映像を作る
┗ 曲をアップロードして、音楽のムードに合った映像をAI生成 Kaiber Help Center+2Kaiber+2 - 仕上げと公開
┗ 必要ならDaVinci Resolveなどで微調整して、YouTubeやShortsにアップ
今回は、
「辛い冬を超えて春を迎える」「サビ頭に“桜”」
みたいなテーマで作る想定で進めてみます。
1. まずはコンセプトを決める
AIに丸投げする前に、ざっくりでもいいので“方向性”だけは人間が決めておくと、仕上がりが一気に良くなります。
決めておきたいポイント
- 季節感:春/夏/秋/冬
- 感情:切ない・エモい・前向き・失恋・希望 etc.
- ジャンル:Lo-Fi、シティポップ、ロック、EDM、K-POP風…
- 映像の世界観:実写風?アニメ調?シネマティック?ドリーミー?
たとえば今回なら、
「長い冬を耐えたあと、桜が咲く頃にようやく前を向ける主人公」
「アニメ調の東京の街、夜明け〜昼〜夜へ移り変わるイメージ」
みたいな“物語の芯”を1行で書いておくと、
このあと歌詞 / 曲 / 映像すべての軸になります。
2|ChatGPTで「SNSバズ系の歌詞」を即興で作る
ここからAIフル稼働です。
まずは歌詞担当:ChatGPT。
今回はChatGPTに、こんな感じのプロンプトを入れてお願いしました👇
✅ プロンプト:
あなたはプロの作詞家です。
以下の条件で、日本語の歌詞を作ってください。
・SNSでバズりそうな、共感系の歌詞
・テーマ:長い冬を乗り越えて、春にやっと前向きになれる物語
・対象:仕事や人間関係で疲れた20〜30代
・構成:Verseが2小節、Chorusが2小節
・サビの最初の言葉は必ず「桜」で始める
・口ずさみやすい、シンプルな言葉を使う
ポイントは、
- ターゲット(誰に向けた歌か)
- テーマ(どんな気持ち・状況か)
- 構成(Aメロ / サビの長さ)
- キーワード(「桜」みたいなワード)
をきちんと指定すること。
ChatGPTが出してきた歌詞が「なんか違う…」と思ったら、
- 「もっと具体的な情景を入れて」
- 「語尾をやわらかくして」
- 「失恋要素は減らして、仕事の疲れ寄りにして」
みたいにフィードバックすると、どんどん自分好みに寄ってきます。
3|Sunoでメロディ&歌をAI生成
次は、生成AI音楽界の革命児「Suno」の出番。
作詞した歌詞をもとに曲を作ります。
Sunoは、テキストの説明や歌詞を入力するだけで
ボーカル・メロディ・伴奏まで含めたフル楽曲を自動生成してくれるAI音楽サービスです。eesel AI+1
最近のモデル(v5)では、
- 44.1kHzのスタジオクオリティ音源
- 最大8分程度までの長尺楽曲
- ステム書き出し(ボーカル/ドラム/ベースなど個別WAV)対応 Suno+2AudioCipher+2
など、普通に“商用レベルの曲”が出てきます。
Sunoでの基本ステップ
気に入らなければ、プロンプトを微調整して再生成
Sunoにログイン
歌詞をコピペ(さっきChatGPTで作ったやつ)
スタイル欄に、
「Emotional J-Pop ballad, spring, hopeful, mid tempo」
みたいな英語の説明を書く(日本語でもOKですが英語のほうが安定しやすい印象)
「Create」ボタンを押して待つ
✅ すごいところ:
- 歌詞をコピペするだけでOK
- 曲調も選べる(ポップ、EDM、バラードなど)
- 「歌」までAIが歌ってくれる(ボカロ的じゃない、ちゃんと人っぽい)
4|Kaiberで映像化(音楽から動画を自動生成)
音源ができたら、次は映像!
使ったのは「Kaiber」っていう音楽をベースに映像を作ってくれるAIツール。
これが本当にすごい。歌の盛り上がりに合わせて、勝手にカットが変わるんです。
✅ Kaiberのポイント:
- テキストや画像から動画を生成
- 音源に合わせて“ビート同期”したMVを作成
- テンプレート(High Energy / Cinematicなど)で自動カット Photography Tuts++3Kaiber Help Center+3Kaiber+3
といったことができるAI動画生成ツールで、
公式サイトでも「music videos に最適」と打ち出しています。Kaiber
音源をアップロード
- Kaiberにアクセスし、Superstudio(エディタ画面)を開く
- 「Audio to video」や音声入力対応のモードを選択
- Sunoで書き出した曲(WAV or MP3)をアップロード
映像のスタイルを決める
ここで、さっき決めたコンセプトが効いてきます。
例:
「アニメ調で、春の東京、夜明け前のブルーから桜色の朝に変わっていくシーン」
プロンプトのイメージ(英語例):
Anime style, soft pastel colors, cinematic lighting.
A lonely girl walking through a quiet Tokyo street at dawn,
cherry blossom petals slowly falling, gentle camera moves.
The mood is hopeful and emotional, like a new beginning after a long winter.
- 「Anime style」「cinematic lighting」などの画風
- 「cherry blossom petals」「Tokyo street at dawn」などの具体的なモチーフ
- 「hopeful and emotional」などの感情のトーン
を入れてあげると、曲のムードと映像が噛み合いやすくなります。
ビート同期・カット構成
最近のKaiberには、ビートに合わせて自動的にカットを切ってくれるテンプレートもあります。Kaiber
例えば、
- High Energy:テンポの速いダンス・ロック系に
- Cinematic:エモいバラード・Lo-Fi系に
- Time Skip:時間経過を表現したいときに
こういうテンプレートを指定して、
「サビに入るところでカメラを引き気味に」「アウトロは夕焼けから夜空に」
みたいなイメージを加えると、より“PVっぽく”なります。
5|キャラクターを Midjourney で作る
楽曲によっては、キャラクターを使った方が効果的なMVもあります。この場合キャラクターは Midjourney で作るのがベストです。
たとえば「深夜の東京を歩く青髪の少女、アニメ調」って入力すれば、それっぽいキャラが出てくる。
ここで「立ち絵」を作っておくと後のシーン作りが楽になるんです。実際、僕はキャラデザインに100枚くらい生成しましたね。
キャラクターができたら、キャラクターが活躍する世界観を作ります。
ここで活躍するのが、最近話題の Nano-banana っていう画像生成AI。 Nano Banana: AI画像ジェネレーター・エディターを無料で試す
「立ち絵」をベースに「雨の新宿でネオンを背に立っている」とか指示を出すと、そのキャラがちゃんとそのシチュエーションで描かれる。
これが本当に革命的で、以前は無理だった「統一感のある素材作り」が可能になったんです。
生成した静止画はMidjourneyの動画機能を使って動画化します。
こうすると、キャラクターが自然に動いて見えるんです。もちろん失敗も多くて、結構な確率で動画崩壊がおきます。使えば使うほどクレジット(課金)がガンガン溶けていくので注意。予算に余裕があればたまに神がかったシーンが出るんですよ。
例:
- 少女が雨粒を受け止める瞬間
- ネオンが光って表情が切り替わる瞬間
これが撮れたら「よっしゃ!」って声出ちゃいます。
🎁 完成:AIだけで作った1分のミュージックビデオ
というわけで、生成された音源と動画を編集ソフトで繋ぐとミュージックビデオが完成です。
クレジットは次のとおりです。
- 作詞:ChatGPT
- 作曲&歌唱:Suno
- 映像:Kaiber(音源から自動生成)もしくはMidjourney+Nano-banana
自分は何もしてない。だけど、作品ができてる。
私はクリエイターというよりプロデューサー的なポジションかもしれません。
この体験、ちょっと異常なんだけど、めちゃくちゃ希望がある。
⚠️ 公開前にチェックしておきたい「権利」と「注意点」
ここが一番気になるところ。 AIミュージックビデオは超楽しいんですが、
2025年時点では権利周りがかなり動いているジャンルでもあります。
それぞれのツールでの著作権の扱いと商用利用について、以下にまとめます。
✅ ChatGPT(作詞)
- 著作権:基本的にユーザーに帰属
- 商用利用:OK
- 補足:出力が既存の歌詞と酷似している場合は注意。オリジナリティのチェック推奨。
AI歌詞を使うときの3つのポイント
AIで生成された歌詞は、基本的に著作権フリーと言われることもありますが、100%安心とは言い切れません。
- 生成直後の歌詞をGoogle検索で一度チェックする
- 目立つフレーズは「“〇〇〇” 歌詞」で検索してみると◎
- Creative Commonsのガイドラインを確認
- 自動生成物に対する著作権の明確化はツール側でも記載があります。商用利用の場合は必ず確認を。
- ChatGPTに「この歌詞が既存の曲と酷似していないか確認して」と聞いてみる
- 100%ではないが、参考にはなる。
🟡 Suno(音楽)
Sunoは、基本的に有料プランで商用利用が可能な設計ですが、
利用規約やライセンスはアップデートされていくので、
収益化チャンネルや広告案件で使う前には必ず最新のTermsを確認してください。gaga.art
- 著作権:原則Suno(Sunobrain Inc.)が保有
- 商用利用:条件付きでOK(※有料プランの場合)
- 補足:YouTubeなどでは「第三者のコンテンツ」と判定される場合がある → 収益化できないことも。
歌詞・メロディの「似すぎ」に注意
ChatGPTやSunoに対して、「○○の曲みたいなサビを作って」「△△の歌詞を真似して」みたいな特定曲の模倣を直接指示するのは避けたほうが安全です。
ヨーロッパでは、AIと歌詞に関する裁判も進んでいて、
権利団体がAIに対して強い姿勢を見せている事例もあります。
✅ Kaiber(映像)
- 著作権:使用権はユーザーに付与(映像の再利用可)
- 商用利用:基本的にOK(無料プランでも)
📌 YouTube投稿やSNSシェアは問題ないケースが多いですが、 「販売」「広告動画」「企業案件」など本格的な商用利用を考える場合は、 念のため最新の利用規約を確認しましょう。
実際に作るときの“リアルなコツ”
最後に、実際にやってみて「あ、ここハマりがちだな」と思うポイントを。
コツ①:一発で神曲・神MVを狙わない
AIだからといって、
一発目から完璧な曲・映像が出ることはほぼないです。
- Suno → 「Aメロは良いけどサビが微妙」
- Kaiber → 「画風はいいけどカットが忙しすぎる」
みたいなのは日常茶飯事なので、
「1曲につき3〜5テイクくらいは試す」
くらいの気持ちで回していくと気が楽です。
コツ②:30秒〜60秒のショートMVから始める
フル尺のMVももちろん楽しいんですが、
最初のうちはショート(30〜60秒)で1本仕上げてみるのがおすすめです。
- Suno:ショート用に部分使い or 短めの曲
- Kaiber:サビ部分だけを映像化
- YouTube Shorts / TikTok向けに投稿
これで1本完成させる経験をすると、
フル尺MVへのハードルが一気に下がります。
コツ③:同じ曲で“世界観違い”を複数作る
これ、AIならではの楽しみ方です。
- 同じ曲 × 「春の夜桜バージョン」
- 同じ曲 × 「夏の海バージョン」
- 同じ曲 × 「冬の雪景色バージョン」
…みたいに、Kaiberのプロンプトだけ変えて複数MVを作ると、
プレイリスト感覚で世界観展開ができます。
🔚 まとめ
初めて完全AIでMVを作ったとき、 「え、これもう人間いらないじゃん…」って、ちょっと怖くなるレベルでした。 でも、やってみるとわかるのは、AIはあくまで“道具”だということ。
たとえば歌詞に込めたい感情、音楽のニュアンス、映像の間(ま)など、 人間のディレクションなしではやっぱり弱い。
だから今は、AIと人間の共作時代だと感じています。
| ツール | 用途 | 著作権 | 商用利用 |
|---|---|---|---|
| ChatGPT | 作詞 | ユーザーに帰属 | OK |
| Suno | 作曲・歌 | Suno側に著作権、使用権あり | 条件付きOK |
| Kaiber | 映像生成 | 使用権あり | OK |
📌最後に:未来のMVは“あなたの想像力”が主役になる
たぶんこれから、MVは「プロが作るもの」から「誰でも創れるもの」へと変わっていく。
大事なのは技術じゃなくて、“何を作りたいか”っていう想い。
ChatGPTに言葉を預けて、Sunoにメロディを託して、Kaiberに映像を描かせる。
その全部の中に、あなたの世界観が宿る。

















こんにちは、フルタニです。放送局で番組作りをしてました。 完全AIで ミュージックビデオ が作れるを書きます。