最近気づいたらね、ずっと nano banana で遊んでるんですよ。
いや、遊んでるっていうか…気づいたら「1枚の立ち絵」から無限にカットを生成して、
ちょっとした 実写アニメMV が作れちゃってるんですよ。怖い。ほんとに。
便利すぎて依存症まっしぐらです。(すでに手遅れ説あり)
でもこれ、難しそうに見えて やることはめちゃくちゃシンプル なんです。
コツさえ覚えれば、キャラを現実世界のど真ん中に自然に溶け込ませることができる。
背景を別で用意する必要もないし、マスク切り抜き地獄にも落ちない。
ただ “いい感じのプロンプト” を投げるだけ。それだけでMVの素材が量産されていくんですよ。やばくない?
というわけで今回は、初心者でも今日からサクッと使える、
「nano bananaでキャラクター×実写背景を合成する方法」 を、
瀬戸弘司テンションのまま、わかりやす〜く解説していきます。
nano banana でキャラと実写背景を合成するやり方
あなたも気をつけてください。
……たぶん、気づいたらハマってます。
nano banana でキャラクターと実写背景を合成するやり方を、先にざっくりまとめると、

「1枚の立ち絵 + 良いプロンプト」だけで、MV全部のカットを量産できちゃうよ、という話です。
ここからゆっくりいきましょう。
立ち絵とは、キャラクターが正面を向いて立っている姿を描いたイラストのことです。詳しい条件は巻末にまとめました。
nano banana ってそもそも何者?
nano banana は、Google の Gemini に組み込まれている「画像生成&画像編集用のAIモデル(正式名称:Gemini 2.5 Flash Image)」で、
1枚の写真やイラストから、無数のバリエーションを作ったり、背景を合成したりできるツールです。(Gemini)
最近は「1枚の写真から別のシーンにワープさせる」「複数の写真を合成して1つの世界にまとめる」みたいなことが得意で、
まさに今回やりたい 「アニメキャラ+実写背景の合成」 にピッタリなやつです。
今回やることの全体像
この記事でゴールにしたいのはこれです。
- 手元には「1枚の立ち絵イラスト」しかない
- そこから nano banana に プロンプトだけでカットを量産
- 出来上がった静止画カットを、動画編集ソフトに持っていって ミュージックビデオ(MV)っぽく仕上げる
ポイントは、
背景とキャラを別々に生成して合成するんじゃなくて、
最初から「実写背景込み」で1枚の絵として出してもらう
という発想です。これがめちゃくちゃ楽。
基本のプロンプト構成
プロンプトは ①+② の二段構え
- ① シチュエーション・構図を定義する
→ 何がどう写っているカットにしたいか、できるだけ具体的に書く - ② 実写アニメ合成用の「おまじない文」を足す
→ 「実写背景と馴染ませてね」とAIに伝える固定パーツ
ステップ1:シチュエーション・構図を書き出す
まずは ① の部分。
ここが カットの中身そのもの なので、いちばん大事です。
英語の方が安定しやすいことが多いので、英語例でいきますが、
日本語で書いてから翻訳してもOKです。
例1:隅田川の欄干にもたれるカット
たとえばこんな感じ。
She leans sideways against the metal railing along the Sumida River, both arms resting loosely on top.
Her upper body folds slightly forward; she shifts her weight onto one hip.
Behind her, trains cross the distant bridge, sunlight glancing off windows.
The shape of her posture mirrors the rhythm of the rails and horizon.
彼女は隅田川沿いの金属製の手すりに横向きに寄りかかり、両腕をゆるりと手すりの上に載せている。
上半身はわずかに前かがみになり、体重を片方の腰にかけている。
背後では電車が遠くの橋を渡り、窓に日光がきらめいている。
彼女の姿勢の輪郭は、線路と地平線のリズムを映し出している。
ここでやっているのは、
- どこにいる? → 隅田川のメタルの手すり
- 体はどうなってる? → 片側にもたれて、少し前かがみ、片足重心
- 背景は? → 遠くに電車と橋、窓に反射する光
- 全体のリズムは? → 体の傾きとレール・水平線のリズムが似ている
みたいな 「映像ディレクション」レベルの指定 です。
これを1~3文くらいで書ければOK。
ステップ2:実写背景と馴染ませる “おまじない文” を足す
ここで②をドンと足します。
この部分は 基本コピペでOK、変えないで使い回すブロック です。
Placed within a live-action background that matches the illustration’s posture and composition — while faithfully preserving the illustrated texture and style. Realistic lighting, depth of field, and subtle filming effects are applied to blend the illustration seamlessly with the real environment.
ざっくり日本語でいうと、
「立ち絵のポーズや構図に合った実写背景の中に配置して。
イラストとしての質感やタッチはちゃんと保ちつつ、
ライティングやボケ感、撮影っぽい質感で自然に馴染ませてね」
というお願いをしている感じです。
実際のフルプロンプト例
さっきの隅田川のカットを、①+②でつなぐとこんな感じ。
She leans sideways against the metal railing along the Sumida River, both arms resting loosely on top. Her upper body folds slightly forward; she shifts her weight onto one hip. Behind her, trains cross the distant bridge, sunlight glancing off windows. The shape of her posture mirrors the rhythm of the rails and horizon.
Placed within a live-action background that matches the illustration’s posture and composition — while faithfully preserving the illustrated texture and style. Realistic lighting, depth of field, and subtle filming effects are applied to blend the illustration seamlessly with the real environment.
この①のシチュエーション部分だけを毎回差し替えていけば、
同じ立ち絵から無限にカットが作れる、というわけですね。
依存症にならない自信がある人だけやってください。
(私はなりました😇)
nano banana 側の操作の流れ(ざっくり)
UI は使うサービスによって違いますが、
だいたいの流れはどこも同じなので、共通する部分だけを整理します。
(Gemini アプリや nano banana 対応サイトなど、どこで使っても考え方は一緒です)(Gemini)
① 1枚の立ち絵を用意する
- PNG or JPG 推奨
- 背景は透過か、単色(白やグレー)が扱いやすい
- キャラの全身がしっかり映っているものがベスト
② nano banana 対応サービスで「画像編集」モードにする
- 「画像をアップロード」→ 立ち絵を選択
- 「テキストで編集内容を指定」できるモードを選ぶ
(Gemini だと「画像を編集」的なボタンがあるはず)
③ ①+② のプロンプトを貼り付けて実行
- まずはそのまま生成
- 「ちょっと違うな」と思ったら、
→ ①のシチュエーション部分だけを書き換える
→ ②のおまじない部分は基本固定のまま
④ 気に入ったカットを保存
- 解像度が足りない場合は「アップスケール」系のツールで拡大してもOK
- 複数カットを一気に作っておくと、あとでMV編集が楽になります
3つの「効果的なシーン」具体例
ここからは、MVで使いやすいシーン例を3つ出します。
そのままコピペして、キャラや場所だけ変えて使ってもらってOKです。
例1:川沿いで黄昏れているシーン(MVのサビ前用)
こんな絵にしたい:
- 夕方の川沿い
- 少し風が吹いていて、髪が揺れている
- 遠くに走る電車
- ちょっと切ない表情
①シチュエーション案:
At sunset by a wide urban river, she leans sideways against a cool metal railing, both arms resting loosely on top. A soft breeze lifts a few strands of her hair as she gazes toward the distant bridge, where a train passes slowly across. The sky is painted in muted orange and pink, reflecting gently on the water below, adding a quiet, melancholic mood to the scene.
このあとに、さっきの②のおまじない文をそのまま足します。
例2:夜の繁華街を歩きながら歌うイメージ
こんな絵にしたい:
- ネオン看板の多い繁華街
- カメラはややローアングル(少しヒーローっぽく)
- 手前にボケたテールランプ
- MVのサビの「ドン!」で使う感じ
①シチュエーション案:
On a neon-lit city street at night, she walks forward in the center of the frame, captured from a slightly low angle that makes her feel larger-than-life. Blurred car tail lights streak across the foreground, while colorful shop signs glow behind her in red, blue, and purple. Her lips are slightly parted as if she’s singing, and the city lights reflect softly in her eyes.
ここに②を追加。
ローアングル指定を入れると、ちょっと3Dっぽく寄ることがあります。
そのときは、
- 「slightly low angle」→「eye-level shot」に変えてみる
- 体のひねりを減らして、シンプルなポーズにしてみる
など、①の構図指定をシンプルにするのがおすすめです。
例3:教室の窓辺でイヤホンをしているカット
こんな絵にしたい:
- 放課後の教室
- 窓際でイヤホンをして外を眺めている
- 机の上にスマホ
- ノスタルジー全開
①シチュエーション案:
In a quiet classroom after school, she sits by the window with one elbow resting on the desk and her cheek leaning lightly against her hand. She wears small white earphones, a phone lying unlocked on the wooden desk beside her. Outside the large window, the sky is turning pale orange, and soft light spills in, casting long shadows across the rows of empty desks behind her.
もちろんここにも②を追加。
学園モノのMVや、ボカロ系の映像などと相性バツグンです。
MVに仕上げるときの編集のコツ
「静止画だけだと、動きがなくて退屈になりそう…」
と思うかもしれませんが、動画編集側でかなりカバーできます。
1. ゆっくりしたカメラワークを足す
- カットごとに
- ゆっくりズームイン / ズームアウト
- パン(左右のスライド)
- 少しだけ回転
- これだけで「撮った映像」っぽさがグッと増します
2. ライトリークやフィルムノイズを重ねる
- 実写っぽさを出すために、
- フィルムグレイン
- ライトリーク
- 画面のうっすらしたフレア
- をうっすら乗せるのも効果的です。
3. カットの繋ぎをテンポよく
- サビでテンポよくカットを切り替える
- イントロやアウトロでは、1枚のカットをじっくり見せる
「1枚の立ち絵からこんなに世界が広がるのか…」という瞬間、
編集していてちょっと泣きそうになります。まじで。
よくある失敗と対処法
Q. キャラが急に3Dモデルっぽくなる…
A. ①のシチュエーションをシンプルに戻しましょう。
- アングル指定を減らす(「dramatic」系ワードを削る)
- 「figurine」「3D」っぽい単語が入っていないか確認する
- 体のポーズを “自然で日常的なもの” に寄せる
Q. 顔がたまに崩れる…
- 1文に情報を詰め込みすぎない
- 「表情」は1つに絞る(smiling / sad / surprised…)
- 「big eyes, detailed eyes, clean face」みたいな
顔に関する補助ワードを足してみるのもアリです
Q. カットごとにキャラの雰囲気がブレる…
- 毎回同じキーワードを入れる
例)- 「short black hair」
- 「school uniform」
- 「soft pastel anime style」
- ①の文章の最後にまとめて入れると管理しやすいです
まとめ:立ち絵1枚あれば、MVは作れる時代
というわけで、
- 立ち絵1枚
- ①シチュエーション・構図
- ②実写アニメ合成おまじない文
- +ちょっとした動画編集
この4つが揃えば、
「実写とアニメが溶け合ったMV」 は普通に作れるようになりました。
あとは本当に、どこまで依存するかだけです。
ほどほどにしつつ、良き実写アニメ合成ライフを!✨
【補足】立ち絵に求められる条件(ここだけ押さえればOK)
「立ち絵」の条件について、結論から言うと 「上半身だけでも全然OK!」 です。
というか、むしろ 上半身の立ち絵のほうが安定しやすい ことすらあります。
① 見せたい範囲が「しっかり画面内に収まっていること」
上半身だけの立ち絵なら、
上半身がしっかり描かれていて、切れてる部分が不自然じゃなければOK。
- 首だけ見切れてる
- 片腕の半分だけちぎれてる
- 胴体が途中で潰れている
こういう“構造が破損してる系”はちょっと不安定になりやすいです。
肩〜胸までしっかり描かれていれば十分。
② 手や顔が潰れてない、解像度がちゃんとある
nano banana って、立ち絵の情報を元に「これが同じキャラだ」と判断してくれるので、
- 顔のパーツがはっきりしている
- 手や服の線が綺麗
- ぼやけていない
このへんは超・大事。
とはいえ、めちゃくちゃ高解像度じゃなくても大丈夫。
1000〜2000px くらいあれば普通にいけます。
③ キャラのスタイルが“1枚で完結してる”こと
これ、わりと盲点ですが重要です。
- イラストの塗りが途中で終わってる
- ラフ線が残ってる
- 表情差分だけ差し替えた雑なPNG
こういうのはキャラの特徴をAIがうまく掴めず、
生成カットごとに「別人化」しやすいです。
「この絵1枚だけでその子のキャラが伝わるか?」
を目安にすると失敗しません。
④ “全身絵じゃないとダメ” は時代的にもう終了です
昔は、背景合成するなら全身絵のほうが扱いやすかったんですが、
nano banana 世代はもう 全身の必要ありません。
上半身の立ち絵でも、
- 座ってるシーン
- 窓辺にもたれてるシーン
- カフェでコーヒー飲んでるシーン
- 川沿いで夕日を見てるシーン
いくらでも合成してくれます。
むしろ 上半身だけの方が破綻しにくい ことも多いです。
⑤ ただし、こんなときは全身絵が有利
とはいえ、用途によっては「全身のほうが便利」なこともあります。
- 足元まで映したい構図が多い
- 遠景のショット(キャラが小さく映る)を作りたい
- ダンスMVみたいに動きのあるシーンを量産したい
こういう場合は、やっぱり全身絵がほしい。
でも普通のMVとか、情緒系のシーン主体なら 上半身だけの立ち絵で十分すぎます。
▼結論(めっちゃシンプル)
◆上半身だけでも問題なし
◆むしろ扱いやすくて崩れにくい
◆ただし、構造がちゃんと見える1枚を使う
という感じです!






こんにちは、フルタニです。放送局で番組作りをしてました。 nano banana でキャラと実写背景を合成するやり方を書きます。