動画生成界隈が慌ただしく動いてますね。私のよく使うSeaArtもその一つ。劇的に使い出が良くなりました。
まず結論から言うと──
SeaArtで作った1枚の写実的な静止画が、そのまま「ミニ映画」になります。
そのカギを握っているのが、SeaArtに統合された Veo 3.1 の Image-to-Video(I2V)ワークフロー です。(SeaArt)
ここでは、
「SeaArtで写真っぽい1枚は作れたけど、そこから先、どうやって“動かせば”いいの?」
という初心者さん向けに、
SeaArt → Veo 3.1 I2V で写実的な短尺動画を作る具体的な手順 を解説します。
SeaArt の静止画をVeo 3.1で動画化する方法
全体像:何をやるのかざっくり
やることはシンプルで、たったこれだけです。
- SeaArtで写実的な静止画を用意する
- SeaArtの「Veo 3.1 Video Generation」ワークフローを開く(SeaArt)
- 静止画を imageノード に接続する(I2V)(SeaArt)
- Veo 3.1のパラメータ(秒数・縦横・解像度・音声)を設定
- 「動的プロンプト」を書く(動き・カメラワーク・光・感情まで指定)(Skywork)
- 品質をチェックして、必要ならプロンプトや画像を微調整する
やってることはガチ映画制作っぽいのに、
UIはけっこう素直なので、慣れると 「1枚 → 8秒のショット」 をサクサク量産できます。
事前準備:SeaArt側で「写実的な1枚」をちゃんと仕上げる
いきなりVeoに投げる前に、まずは 静止画のクオリティが命 です。
SeaArtは「Realism」「Film Video Realistic Style」みたいな写実系スタイルが用意されていて、
肌、光、テクスチャの再現がかなり強いです。(lovart.ai)
写実的な静止画のチェックポイント
- 解像度は なるべく高め(最低でも長辺1024px以上を目安)
- 被写体が途中で切れていない(頭や手がフレームアウトしてない)
- 背景と人物の境界が ハッキリしている
- 顔はできれば 正面〜ややナナメ のはっきりした表情
- シーンの光源が「どこから当たっているか」が分かる
ここがグダグダだと、
- Veoで顔が溶ける
- 謎の腕が増える
- カメラを動かした瞬間に世界観が崩壊
…みたいな「AIホラー映画」になるので(笑)、
静止画の時点で“勝負は半分決まっている” と思ってください。
SeaArtで「Veo 3.1 I2V」ワークフローを開く
ここからが実際の操作になります。
- SeaArtにログイン
- 上部メニューから 「Workflow」や「Film Video」系のタブ を開く
- 一覧の中から
Veo 3.1 Video Generation Workflow- または
Veo 3.1 Image-to-Video Special Edition
といった名前のワークフローを選びます。(SeaArt)
開くと、ノードベースの画面が出てきて、
- 左側:image入力ノード
- 中央:Veo 3.1 ノード
- 右側:出力 or プレビュー
みたいな構成になっているはずです。
SeaArtで作った静止画を image ノードに接続する
1. 画像の渡し方
やり方は環境によって少し違いますが、基本はどれかです。
- すでにSeaArtギャラリーにある画像を 「Use as input」 みたいなボタンでワークフローに送る
- ローカルに保存したPNG/JPEGを、imageノードの アップロード欄にドラッグ&ドロップ
これで imageノードに 「SeaArt製の写実静止画」 が差し込まれます。
2. Veo 3.1 ノードとの接続
- imageノードの 出力ポート を
- Veo 3.1ノードの image / reference_image っぽい入力ポートにドラッグしてつなぐだけです。(SeaArt)
これで「この1枚を基準に動かす」というI2Vの準備が完了。
Veo 3.1 側の設定 基本設定を決める
SeaArt上のVeo 3.1ノードには、だいたいこんなパラメータがあります。(SeaArt)
duration_seconds:動画の長さ(4 / 6 / 8 秒)aspect_ratio:アスペクト比(9:16/16:9)resolution:解像度(720p/1080p)generate_audio:ネイティブ音声を生成するかenhance_prompt:プロンプトのポリッシュ(補正)を有効化するかseed:ランダムシード(同じ結果を再現したい時に固定)
このパラメーターを好みに合わせて調整します。
とはいえはじめての人は「普通プラン」から始めた方が安全なので、おすすめプランから始めましょう。
おすすめ設定(まずはこれでOK)
- duration_seconds:8秒
→ Veo 3.1は 8秒を基準 に設計されていて、動きの自然さと構成の安定感が高いです。(Romptn) - aspect_ratio:9:16(縦長)
→ TikTok/リール/ショート狙いならコレ。
YouTube横長なら 16:9 に変更。 - resolution:1080p
→ PCが重い場合は720pスタートでもOKですが、
写実系はディテール命なので、最終的には1080p推奨。 - generate_audio:ON推奨
→ Veo 3.1は セリフ・音楽・環境音をまとめて生成 できるので、
まずはONで「世界観付きのラフ映像」を出してみるのがおすすめ。(Google DeepMind) - enhance_prompt:最初はONでOK
→ 変な英語でもそれなりに解釈してくれる救済機能。
精度を詰めたくなったらOFF+自力でプロンプトを整えていく、という順番で。
Veo3.1に注文する「動的プロンプト」を書く — ここが一番楽しい
ここからが本番です。
Veo 3.1の強みは、動きとカメラと感情まで一気に指示できるプロンプト設計 にあります。(Skywork)
動的プロンプトのテンプレ
基本の型はこんな感じ:
被写体 + 動作 + 時間帯・場所 + カメラの動き + 視覚スタイル + 光と色 + ムード + 音
日本語+英語を混ぜてもOKです。
例として、昭和喫茶店の写実静止画なら…
A young woman sits alone at a wooden table in a retro Japanese coffee shop at dusk,
softly turning pages of a book and occasionally looking out the window as neon lights
flicker outside. subtle breathing, gentle eye movements, steam slowly rising from a coffee cup.
steadycam slow push-in from medium shot to close-up on her face.
photo-realistic, cinematic, detailed skin texture, soft warm lighting, rich shadows, film grain.
calm and nostalgic mood, light cafe ambience and distant city rain sounds.
ポイントは:
- 動きは「小さく」「具体的に」
- 目線が少し動く
- ページをめくる
- コーヒーの湯気が揺れる
- カメラの動きは1つだけ に絞る
slow push-in(ゆっくり寄る)slow pan left(ゆっくりパン)gentle handheld subtle swayなど
極端に複雑にすると破綻しやすいです。
- スタイルには
photo-realisticcinematicdetailed textures
など「写実」であることを明示し、cartoonanimeillustrationといった単語は避けます。
具体的シーン例 3パターン
1. 雨の交差点で立ち止まるビジネスマン
静止画のイメージ
- 夜の大きな交差点(渋谷・新宿っぽい)
- 雨で路面が濡れてネオンが反射
- スーツ姿の男性が傘をさして立ち止まっている1枚
Veo 3.1用プロンプト例
A Japanese businessman stands still at a rainy city crosswalk at night,
holding a transparent umbrella as neon signs reflect on the wet asphalt.
He slowly looks left and right, eyes slightly narrowing as he thinks,
then exhales a small white breath in the cold air.
steadycam lateral tracking from his right side, ending with a gentle push-in to a close-up of his face.
photo-realistic, cinematic night lighting, wet reflections, detailed raindrops, soft depth of field.
moody and introspective atmosphere, distant traffic sounds and soft rain ambience.
おすすめ設定
- duration:8秒
- aspect_ratio:9:16(ショート動画向き)
- resolution:1080p
- audio:ON(雨音+街のアンビエンスがいい感じに乗ることが多い)
2. 夕暮れの昭和喫茶店で本を読む女性
さっきのテンプレそのままですが、
Lo-Fi BGM用の背景映像 にもめちゃくちゃ相性がいいです。
- duration:8秒
- aspect_ratio:16:9(YouTube背景用)
- audio:OFF(自分でBGMを載せる前提)
音はあとでDaVinci ResolveやCapCutで足せばOKなので、
「動きだけ欲しい背景素材」として量産すると、
自分専用の“映像ループ素材ライブラリ”がどんどん増えていきます
3. ベランダから夜景を見下ろす一人暮らし
静止画イメージ
- 高層マンションのベランダ
- 若い女性(または男性)が街の夜景を見下ろしている後ろ姿
- 部屋の中の暖色と外の寒色の対比
プロンプト例
A young woman stands on a small apartment balcony at night, seen from behind,
quietly looking down at the glowing city below.
Her hair and loose T-shirt move slightly in the evening breeze.
The room behind her glows with warm light while the city is cool blue and purple.
slow orbiting camera move around her from behind to a soft three-quarter profile,
keeping the city lights beautifully blurred in the background.
photo-realistic, cinematic bokeh, detailed fabric, subtle camera grain.
calm, slightly lonely mood, distant city hum and faint wind ambience.
ここでのコツ
- 後ろ姿なら、顔崩れのリスクがほぼゼロ
- 「風で髪と服だけ動く」ように指示すると、写実系でもかなり自然
品質アップ&トラブルシューティング
1. 顔が崩れる・漂流する
- 原因
- 元画像の顔が小さすぎる/ボケている
- カメラの動きが激しすぎる
- 対策
- 顔をもう少し大きく写した静止画を使う
- カメラは
slow push-inなどシンプルに - 必要なら別角度の画像も参考にできるワークフローを使う(Veo 3.1は複数リファレンス画像を扱えるAPI/Flow機能を持っています)(SeaArt)
2. 写実のはずが急に“イラストっぽく”なる
- プロンプト内に
animeillustrationcartoonなどが混ざっていないか確認 - 逆に
photo-realisticrealistic skin texturecinematic lightingを追加して、
スタイルを強めてあげる - 元のSeaArt画像も、 写実寄りスタイルを選び直す と安定します(lovart.ai)
3. 画面がガチャガチャ揺れる・不自然にカットが変わる
- 一つの8秒の中で
「やることを詰め込みすぎ」 なのが原因のことが多いです。- カメラ移動+被写体の大きな移動+光の大変化…はNG。
- アクションは
- 被写体:1〜2個の小さな動き
- カメラ:1種類のゆっくりした動き
- 光:ほんの少し揺らぐ程度
くらいに絞ると、Veo 3.1本来の「シネマティックな滑らかさ」が出てきます。(Skywork)
ちょっと上級者向け:1枚から“複数ショットのミニ映画”にする
Veo 3.1は、8秒ショットをベースに 複数のカットをつなげたマルチショット動画 を作る機能(Flow / multi-prompt)が強化されています。(TechRadar)
SeaArt側もワークフロー機能を使えば、
- 同じ静止画をベースに、
- 「引きのショット」
- 「中くらい」
- 「アップ」
みたいにプロンプトだけ変えた8秒動画を3本作る
- DaVinci ResolveやCapCutで 24秒の1本のVlog風カット として編集する
…といったことが簡単にできます。
「1枚のSeaArt写真から、3カット構成のミニ映画」
これ、やってみるとめちゃくちゃ楽しいです。
まとめ:まずは「1枚 → 8秒」を量産してみよう
- SeaArtの写実スタイルで “ちゃんとした1枚” を作る
- SeaArtの Veo 3.1 I2Vワークフロー を開いて、その1枚をimageノードへ(SeaArt)
- Veo 3.1ノードで
- 8秒 / 9:16 or 16:9 / 1080p / 音声ON
をセット
- 8秒 / 9:16 or 16:9 / 1080p / 音声ON
- 「小さな動き+シンプルなカメラ1つ」だけを指定した動的プロンプトを書く
- 顔や動きが破綻したら、
画像側・プロンプト側のどちらかを少しずつ修正
最初の1本は「なんか惜しい」感じになるかもしれません。
でも2〜3本作ると、
“どのくらい動かすとちょうどいいか” が体感で分かってきます。
記事の作成にあたっては公式が精選するガイドSeaArt AI で作成されたVeo 3.1 が SeaArt で公開されました。を参照しました。
SeaArtで作ったお気に入りの写実画像を、
ぜひVeo 3.1に放り込んで、
自分だけの「8秒映画」コレクション を作ってみてください。












こんにちは、フルタニです。放送局で番組作りをしてました。 SeaArt の静止画をVeo 3.1で動画化する方法を書きます。