【完全AI時代】歌えなくてもOK! ミュージックビデオ をゼロから全部AIで作る方法

フルタニ

こんにちは、フルタニです。放送局で番組作りをしてました。 完全AIで ミュージックビデオ が作れるを書きます。

正直、ここまできたか…って思いました。

ミュージックビデオ、もう全部AIで作れる時代きちゃいました。
「歌えないし、楽器も弾けないし、カメラもないんだけど!?」って人ほど、今回の話は刺さると思います。

この記事では、

  • 作詞:ChatGPT(歌詞を秒で生成)
  • 作曲:Suno(フル尺の楽曲をAIで生成)
  • 映像:Kaiber(Audio to movieでMV化)

という“ほぼノー撮影・ノー楽器”の完全AIミュージックビデオ制作フローを、初心者向けにがっつり解説します。

🌸完全AIで作るミュージックビデオ|人間、もういらないかもしれない件。

0. 全体像:完全AIミュージックビデオのワークフロー

ざっくり流れはこんな感じです。

  1. コンセプトを決める
    ┗ テーマ・季節・ジャンル・世界観をざっくり決める
  2. ChatGPTで歌詞を書く
    ┗ SNSでバズりそうな歌詞をプロンプトで指示
  3. Sunoで曲を生成する
    ┗ 歌詞+ジャンル指定でフル尺の楽曲を作る eesel AI+1
  4. Kaiberで「Audio to movie」的に映像を作る
    ┗ 曲をアップロードして、音楽のムードに合った映像をAI生成 Kaiber Help Center+2Kaiber+2
  5. 仕上げと公開
    ┗ 必要ならDaVinci Resolveなどで微調整して、YouTubeやShortsにアップ

今回は、

「辛い冬を超えて春を迎える」「サビ頭に“桜”」
みたいなテーマで作る想定で進めてみます。

1. まずはコンセプトを決める

AIに丸投げする前に、ざっくりでもいいので“方向性”だけは人間が決めておくと、仕上がりが一気に良くなります。

決めておきたいポイント

  • 季節感:春/夏/秋/冬
  • 感情:切ない・エモい・前向き・失恋・希望 etc.
  • ジャンル:Lo-Fi、シティポップ、ロック、EDM、K-POP風…
  • 映像の世界観:実写風?アニメ調?シネマティック?ドリーミー?

たとえば今回なら、

「長い冬を耐えたあと、桜が咲く頃にようやく前を向ける主人公」
「アニメ調の東京の街、夜明け〜昼〜夜へ移り変わるイメージ」

みたいな“物語の芯”を1行で書いておくと、
このあと歌詞 / 曲 / 映像すべての軸になります。

2|ChatGPTで「SNSバズ系の歌詞」を即興で作る

ここからAIフル稼働です。
まずは歌詞担当:ChatGPT

今回はChatGPTに、こんな感じのプロンプトを入れてお願いしました👇

✅ プロンプト:

あなたはプロの作詞家です。
以下の条件で、日本語の歌詞を作ってください。

・SNSでバズりそうな、共感系の歌詞
・テーマ:長い冬を乗り越えて、春にやっと前向きになれる物語
・対象:仕事や人間関係で疲れた20〜30代
・構成:Verseが2小節、Chorusが2小節
・サビの最初の言葉は必ず「桜」で始める
・口ずさみやすい、シンプルな言葉を使う

ポイントは、

  • ターゲット(誰に向けた歌か)
  • テーマ(どんな気持ち・状況か)
  • 構成(Aメロ / サビの長さ)
  • キーワード(「桜」みたいなワード)

をきちんと指定すること。

ChatGPTが出してきた歌詞が「なんか違う…」と思ったら、

  • 「もっと具体的な情景を入れて」
  • 「語尾をやわらかくして」
  • 「失恋要素は減らして、仕事の疲れ寄りにして」

みたいにフィードバックすると、どんどん自分好みに寄ってきます。

3|Sunoでメロディ&歌をAI生成

次は、生成AI音楽界の革命児「Suno」の出番。

作詞した歌詞をもとに曲を作ります

Sunoは、テキストの説明や歌詞を入力するだけで
ボーカル・メロディ・伴奏まで含めたフル楽曲を自動生成してくれるAI音楽サービスです。eesel AI+1

最近のモデル(v5)では、

  • 44.1kHzのスタジオクオリティ音源
  • 最大8分程度までの長尺楽曲
  • ステム書き出し(ボーカル/ドラム/ベースなど個別WAV)対応 Suno+2AudioCipher+2

など、普通に“商用レベルの曲”が出てきます。

Sunoでの基本ステップ

気に入らなければ、プロンプトを微調整して再生成

Sunoにログイン

歌詞をコピペ(さっきChatGPTで作ったやつ)

スタイル欄に、

「Emotional J-Pop ballad, spring, hopeful, mid tempo」
みたいな英語の説明を書く(日本語でもOKですが英語のほうが安定しやすい印象)

「Create」ボタンを押して待つ

✅ すごいところ:

  • 歌詞をコピペするだけでOK
  • 曲調も選べる(ポップ、EDM、バラードなど)
  • 「歌」までAIが歌ってくれる(ボカロ的じゃない、ちゃんと人っぽい)

4|Kaiberで映像化(音楽から動画を自動生成)

音源ができたら、次は映像!

使ったのは「Kaiber」っていう音楽をベースに映像を作ってくれるAIツール

これが本当にすごい。歌の盛り上がりに合わせて、勝手にカットが変わるんです。

✅ Kaiberのポイント:

といったことができるAI動画生成ツールで、
公式サイトでも「music videos に最適」と打ち出しています。Kaiber

音源をアップロード

  1. Kaiberにアクセスし、Superstudio(エディタ画面)を開く
  2. 「Audio to video」や音声入力対応のモードを選択
  3. Sunoで書き出した曲(WAV or MP3)をアップロード

映像のスタイルを決める

ここで、さっき決めたコンセプトが効いてきます。

例:
「アニメ調で、春の東京、夜明け前のブルーから桜色の朝に変わっていくシーン」

プロンプトのイメージ(英語例):

Anime style, soft pastel colors, cinematic lighting.
A lonely girl walking through a quiet Tokyo street at dawn,
cherry blossom petals slowly falling, gentle camera moves.
The mood is hopeful and emotional, like a new beginning after a long winter.
  • 「Anime style」「cinematic lighting」などの画風
  • 「cherry blossom petals」「Tokyo street at dawn」などの具体的なモチーフ
  • 「hopeful and emotional」などの感情のトーン

を入れてあげると、曲のムードと映像が噛み合いやすくなります。

ビート同期・カット構成

最近のKaiberには、ビートに合わせて自動的にカットを切ってくれるテンプレートもあります。Kaiber

例えば、

  • High Energy:テンポの速いダンス・ロック系に
  • Cinematic:エモいバラード・Lo-Fi系に
  • Time Skip:時間経過を表現したいときに

こういうテンプレートを指定して、
「サビに入るところでカメラを引き気味に」「アウトロは夕焼けから夜空に」
みたいなイメージを加えると、より“PVっぽく”なります。

5|キャラクターを Midjourney で作

楽曲によっては、キャラクターを使った方が効果的なMVもあります。この場合キャラクターは Midjourney で作るのがベストです。

たとえば「深夜の東京を歩く青髪の少女、アニメ調」って入力すれば、それっぽいキャラが出てくる。

ここで「立ち絵」を作っておくと後のシーン作りが楽になるんです。実際、僕はキャラデザインに100枚くらい生成しましたね。

キャラクターができたら、キャラクターが活躍する世界観を作ります。

ここで活躍するのが、最近話題の Nano-banana っていう画像生成AI。 Nano Banana: AI画像ジェネレーター・エディターを無料で試す

「立ち絵」をベースに「雨の新宿でネオンを背に立っている」とか指示を出すと、そのキャラがちゃんとそのシチュエーションで描かれる。

これが本当に革命的で、以前は無理だった「統一感のある素材作り」が可能になったんです。

生成した静止画はMidjourneyの動画機能を使って動画化します。

こうすると、キャラクターが自然に動いて見えるんです。もちろん失敗も多くて、結構な確率で動画崩壊がおきます。使えば使うほどクレジット(課金)がガンガン溶けていくので注意。予算に余裕があればたまに神がかったシーンが出るんですよ。

例:

  • 少女が雨粒を受け止める瞬間
  • ネオンが光って表情が切り替わる瞬間

これが撮れたら「よっしゃ!」って声出ちゃいます。

🎁 完成:AIだけで作った1分のミュージックビデオ

というわけで、生成された音源と動画を編集ソフトで繋ぐとミュージックビデオが完成です。

クレジットは次のとおりです。

  • 作詞:ChatGPT
  • 作曲&歌唱:Suno
  • 映像:Kaiber(音源から自動生成)もしくはMidjourney+Nano-banana

自分は何もしてない。だけど、作品ができてる。

私はクリエイターというよりプロデューサー的なポジションかもしれません。

この体験、ちょっと異常なんだけど、めちゃくちゃ希望がある。

⚠️ 公開前にチェックしておきたい「権利」と「注意点」

ここが一番気になるところ。 AIミュージックビデオは超楽しいんですが、
2025年時点では権利周りがかなり動いているジャンルでもあります。

それぞれのツールでの著作権の扱いと商用利用について、以下にまとめます。

✅ ChatGPT(作詞)

  • 著作権:基本的にユーザーに帰属
  • 商用利用:OK
  • 補足:出力が既存の歌詞と酷似している場合は注意。オリジナリティのチェック推奨。

AI歌詞を使うときの3つのポイント

AIで生成された歌詞は、基本的に著作権フリーと言われることもありますが、100%安心とは言い切れません。

  1. 生成直後の歌詞をGoogle検索で一度チェックする
    • 目立つフレーズは「“〇〇〇” 歌詞」で検索してみると◎
  2. Creative Commonsのガイドラインを確認
    • 自動生成物に対する著作権の明確化はツール側でも記載があります。商用利用の場合は必ず確認を。
  3. ChatGPTに「この歌詞が既存の曲と酷似していないか確認して」と聞いてみる
    • 100%ではないが、参考にはなる。

🟡 Suno(音楽)

Sunoは、基本的に有料プランで商用利用が可能な設計ですが、
利用規約やライセンスはアップデートされていくので、
収益化チャンネルや広告案件で使う前には必ず最新のTermsを確認してください。gaga.art

  • 著作権:原則Suno(Sunobrain Inc.)が保有
  • 商用利用:条件付きでOK(※有料プランの場合)
  • 補足:YouTubeなどでは「第三者のコンテンツ」と判定される場合がある → 収益化できないことも。

歌詞・メロディの「似すぎ」に注意
ChatGPTやSunoに対して、「○○の曲みたいなサビを作って」「△△の歌詞を真似して」みたいな特定曲の模倣を直接指示するのは避けたほうが安全です。
ヨーロッパでは、AIと歌詞に関する裁判も進んでいて、
権利団体がAIに対して強い姿勢を見せている事例もあります。

✅ Kaiber(映像)

  • 著作権:使用権はユーザーに付与(映像の再利用可)
  • 商用利用:基本的にOK(無料プランでも)

📌 YouTube投稿やSNSシェアは問題ないケースが多いですが、 「販売」「広告動画」「企業案件」など本格的な商用利用を考える場合は、 念のため最新の利用規約を確認しましょう。

実際に作るときの“リアルなコツ”

最後に、実際にやってみて「あ、ここハマりがちだな」と思うポイントを。

コツ①:一発で神曲・神MVを狙わない

AIだからといって、
一発目から完璧な曲・映像が出ることはほぼないです。

  • Suno → 「Aメロは良いけどサビが微妙」
  • Kaiber → 「画風はいいけどカットが忙しすぎる」

みたいなのは日常茶飯事なので、

「1曲につき3〜5テイクくらいは試す」

くらいの気持ちで回していくと気が楽です。

コツ②:30秒〜60秒のショートMVから始める

フル尺のMVももちろん楽しいんですが、
最初のうちはショート(30〜60秒)で1本仕上げてみるのがおすすめです。

  • Suno:ショート用に部分使い or 短めの曲
  • Kaiber:サビ部分だけを映像化
  • YouTube Shorts / TikTok向けに投稿

これで1本完成させる経験をすると、
フル尺MVへのハードルが一気に下がります。

コツ③:同じ曲で“世界観違い”を複数作る

これ、AIならではの楽しみ方です。

  • 同じ曲 × 「春の夜桜バージョン」
  • 同じ曲 × 「夏の海バージョン」
  • 同じ曲 × 「冬の雪景色バージョン」

…みたいに、Kaiberのプロンプトだけ変えて複数MVを作ると、
プレイリスト感覚で世界観展開ができます。

🔚 まとめ

初めて完全AIでMVを作ったとき、 「え、これもう人間いらないじゃん…」って、ちょっと怖くなるレベルでした。 でも、やってみるとわかるのは、AIはあくまで“道具”だということ。

たとえば歌詞に込めたい感情、音楽のニュアンス、映像の間(ま)など、 人間のディレクションなしではやっぱり弱い。

だから今は、AIと人間の共作時代だと感じています。

ツール用途著作権商用利用
ChatGPT作詞ユーザーに帰属OK
Suno作曲・歌Suno側に著作権、使用権あり条件付きOK
Kaiber映像生成使用権ありOK

📌最後に:未来のMVは“あなたの想像力”が主役になる

たぶんこれから、MVは「プロが作るもの」から「誰でも創れるもの」へと変わっていく。

大事なのは技術じゃなくて、“何を作りたいか”っていう想い。

ChatGPTに言葉を預けて、Sunoにメロディを託して、Kaiberに映像を描かせる。

その全部の中に、あなたの世界観が宿る。