最近X(旧Twitter)を見てると、
「静止画から6秒くらいの動画が一瞬で出てきたんだけど!?」「しかも音まで付いてるんだけど!?」
みたいなポスト、流れてきません?
あれの正体が xAIの「Grok Imagine」 です。
今日は「Grokでイラストを“自然に動かす”ショート動画をつくるには?」を、がっつり解説していきます
Grok でイラストをヌルッと動かす方法
そもそも「Grok Imagine」って何者?
xAIの「Grok Imagine」 はテキストや画像から約6秒のショート動画を自動で生成する機能です。
- 静止画(イラストでもOK)をアップロード
- 「こう動いてほしい」とテキストで指示
- 数秒で、6〜10秒くらいの動画+簡単な効果音/環境音つきクリップが生成される (Analytics Vidhya)
エンジンには「Aurora」という新しい画像・動画モデルが使われていて、フォトリアルだけじゃなく アニメ・イラスト系のスタイルも対応。(Analytics Vidhya)
さらに最近は、XのGrokアプリの中から
- テキスト→画像
- 画像→動画
まで一気通貫で触れるようになってきています。(Skywork)
この記事のゴール
この記事で目指すのはココです。
「同じイラストキャラを、一貫した見た目のまま、自然に動かすショート動画」を作れるようになること。
- Xに上げる縦動画
- YouTubeショート
- 自分のチャンネルのイントロ動画
このあたりを想定して話します。
準備:何があれば始められる?
必要なもの
- Xアカウント + Grokが使えるプラン
- 2025年末時点だと、Grok Imagineのフル機能(特に動画生成)は
X Premium / Premium+ / SuperGrokユーザー向けに順次ロールアウト中です。 - 無料で利用可能ですが、無料プランでは生成回数や機能に制限があり、より多く使いたい場合は有料プランへの加入が必要です。
- 2025年末時点だと、Grok Imagineのフル機能(特に動画生成)は
- スマホ or PC
- iOSアプリが一歩リード、Androidは動画機能が一部まだ限定的という報告もあります。(The Verge)
- 簡単な動画編集アプリ
- CapCut / VN / Premiere / DaVinci など、なんでもOK
- Grokだけで完結させるより、最後は編集ソフトで“人間の手”を入れた方が仕上がりが一気に良くなります
ステップ1:キャラクターの「設定テキスト」を作る
いきなりGrokに投げる前に、まずは キャラの仕様書(テキスト版) を作っておくと、後々の一貫性がめちゃくちゃラクになります。
例:ゆる系男子キャラの設定
試しに作ったのがこの画像。絵が描けない私でもこんな絵が簡単に作れました。

この絵を作るために必要なのが下記の情報。
このテキストを丸ごとGrokに突っ込んだらこの絵ができました。
・20代前半の男性キャラクター
・薄い茶色のボサボサ髪、右目の前髪だけ少し長い
・大きめの黒ぶちメガネ
・白いパーカーにネイビーのパーカー重ね着、グレーのスウェットパンツ
・丸っこい線で描かれた、やさしい雰囲気のイラスト
・パステルカラー、フラットでアニメ調の塗り、シンプルな背景
実はこれ、ベースとなるキャラクターをつくるための基礎情報。
これをベースに、毎回のプロンプトにコピペして使います。
「毎回ちょっとずつ違う言い方をする」と、キャラの見た目がブレやすくなります。
ステップ2:Grokで“ベースのイラスト”を作る
1. Imagineタブを開く
Grokアプリ(またはX上のGrok)で
「Imagine」タブ → テキストから画像生成 を選びます。(Skywork)
2. プロンプトの基本フォーマット
海外の解説でもよく紹介されているのが、
「行動(Action) + 光(Lighting) + スタイル(Style)」の3点セット。(Skywork)
たとえば:
行動(Action):机に座ってノートPCで作業している
光(Lighting):昼のやわらかい自然光、デスクライトは弱め
スタイル(Style):パステルカラーのフラットなアニメイラスト、太めの線、16:9
これにさっきの「キャラ設定テキスト」を足して、こんな感じのプロンプトになります:

20代前半の男性キャラクター。
薄い茶色のボサボサ髪で、右目の前髪だけ少し長い。
大きめの黒ぶちメガネ。
白いパーカーにネイビーのパーカーを重ね着し、グレーのスウェットパンツを履いている。
丸っこい線で描かれた、やさしい雰囲気のパステルカラーのアニメイラスト。
机に座ってノートPCで作業している。
昼のやわらかい自然光で、デスクライトは弱め。
フラットな塗り、太めの線、シンプルな背景、16:9の構図。
これでまず 1枚の「決定版キャラ」イラスト を作ります。
ステップ3:キャラシートを作る(ここが一貫性のカギ)
RedditのGrokユーザーたちが口をそろえて言っているのが、
「最初に“キャラシート”を作ると後の動画が安定する」という話。(Reddit)
具体的にはこんな構図を作る
- 正面・全身
- バストアップ(胸から上)
- 横向き or 斜め45度
それぞれ、同じキャラ設定・同じ色味・同じスタイルで、
プロンプトの「行動」と「構図」だけ変えて生成します。
例:バストアップ用
同じキャラクター設定。
カメラは胸から上のバストアップ。
カメラ目線で、少しだけ微笑んでいる。
背景は薄い水色のグラデーションでシンプルに。
この 3〜4枚を、あとで全部「動画化の元ネタ」に使うイメージです。
ステップ4:イラストを自然に動かす(Grok Imagineの動画化)
いよいよ本題。ここから 画像→動画 に変換していきます。(Analytics Vidhya)
1. Grok Imagineの動画機能にアクセス
動画にするための大まかな流れはこんな感じです:(Analytics Vidhya)
Grokアプリを最新にアップデート(動画にするためにはGrok ImagineはSuperGrokまたはPremium+サブスクリプションが必要です)
「Imagine」セクションを開く
表示された画像を長押し(ロングプレス)。メニューがポップアップします。「Make Video with Grok」をタップ
オプションから「Make Video with Grok」(または「Grokで動画作成」)を選択。
- ここでプロンプトを追加可能(例: 「猫が踊るようにアニメーション化して」「ボーイフレンドを追加してムuppet風に」)。
- プロンプトなしでデフォルト(自然な動き)でもOK。
- 「Spicy mode」をオンにすると、よりダイナミック(またはエッジの効いた)動画に。
「動画にする」的なボタン(長押し or メニュー)を選ぶ
数秒待つと、6秒前後の動画+音声つきクリップが生成
2. モーションの指定のコツ
イラストを「不自然にグニャグニャさせない」ために、
動きは1〜2個に絞る のがおすすめです。
例1:デスクで作業するシーン
キャラクターは机に向かってタイピングしている。
2秒後に、ふと顔を上げてカメラの方を見て、口角を少しだけ上げて微笑む。
目の瞬きは自然な頻度で。
カメラは固定。動きは控えめで自然に。
アニメ調のやわらかい動きで。
例2:立ち絵がちょっとだけ動くループ動画
キャラクターは立ったまま、体をほんの少し前後にゆらす。
髪とパーカーのフードが、ゆっくり揺れる。
軽く瞬きを続けている。
シームレスにループするように、動きの始まりと終わりを滑らかに。
Grok Imagineは、ディズニー風の誇張された動きやカートゥーン寄りのアニメーションも得意と言われていますが、イラスト系なら最初は「控えめ」「ゆっくり」を意識した方が破綻しにくいです。(Analytics Vidhya)
3. 動画モードの選び方
報道では、Grok Imagineには
「Custom / Normal / Fun / Spicy」などのモードがあるとされています。(The Verge)
- Normal:まずはここ。自然で破綻が少なめ
- Fun:ちょっとオーバーリアクションで、TikTok向きの動き
- Spicy:NSFW寄りのコンテンツ用とされ、かなり倫理的・法的な問題が指摘されています。普通のクリエイティブ用途では避けた方が安全です(The Verge)
ステップ5:複数カットを作って、編集ソフトでつなぐ
Grok Imagine自体は 6〜10秒くらいの短いクリップ作りに特化しています。(Analytics Vidhya)
なので、長めの動画を作りたいときは:
- 1シーン=1クリップとして、Grok Imagineで何本か作る
- それをCapCutなどに全部持っていく
- カットを並べて、BGM・効果音・テロップを足す
という「AIでパーツを作って、人間の手で仕上げる」流れが超おすすめです。
Redditでは「前の動画の“最後のフレーム”を次の動画のスタートにすると、色がどんどんおかしくなる」という声もあるので、毎回ちゃんと静止画から動画を作り直す方が安全です。(Reddit)
一貫性を保つためのテクニックまとめ
ここまでを、ポイントだけギュッとまとめます。
- キャラ設定テキストを作って、毎回コピペ
- 髪型・髪色・服装・小物(メガネ・イヤホンなど)を必ず書く
- キャラシート(正面・バストアップ・横向き)を最初に作る
- それぞれを動画化に使い回すことで、キャラの顔・体型が安定しやすい(Reddit)
- 「Expertモード+Grok 4本体」を選んでみる
- Redditのユーザーから「Fast版より本体モデルの方がキャラがブレにくい」という報告あり(Reddit)
- 1クリップに盛り込む動きは少なめに
- 瞬き+ちょっとした体の揺れ、くらいから始める
- 動画同士を直接つなげず、編集ソフトで“人間が監督”する
- カット割り、テロップ、BGMで「作品感」を出す
具体的に使えるシーン例 3パターン
ここからは「こういうシーンにすると、Grok×イラストがめっちゃ映えるよ!」という具体例を3つ。
① チャンネル自己紹介用:デスク作業→カメラ目線で一言
用途
- YouTubeチャンネルの冒頭数秒
- Xに固定ポストで貼る自己紹介動画
流れ
- デスクで作業しているバストアップイラストを用意
- Grok Imagineでこんな感じのモーションを指定:
最初の2秒間、キャラクターは真剣な表情でキーボードを打っている。
そのあと、ふと手を止めてカメラの方を見る。
少し照れくさそうに笑って、右手を軽く上げて小さく手を振る。
瞬きは自然な頻度で。
背景はぼんやりとした部屋のまま、カメラは固定。
- 生成された動画を編集ソフトに持ち込み、
テロップで「どうも、○○です。」と一言を載せる。 - BGMは軽めのローファイ系を下に薄く敷く。
これだけで “AIっぽさ”より“キャラの人格”を感じる自己紹介映像になります。
② 日常Vlog風ショート:同じキャラが一日を過ごす
用途
- X・ショート動画で回す「1日のルーティーン」企画
必要なイラスト
- 朝:パジャマ姿でコーヒーを飲んでいる
- 昼:PCの前で作業している
- 夜:ソファでスマホを見ながらだらけている
それぞれ、同じキャラ設定・同じ描き方でイラストを作っておきます。
各シーンのモーション例
- 朝:
コーヒーカップを両手で持ち、ゆっくりと口元に運ぶ。 少し目を細めて「ほっ」としたような表情を浮かべる。 湯気がふわっと上がり続けている。 - 昼:
キーボードを打ちながら、たまに首をコキコキと横に倒して伸ばす。 表情は少し真剣だけど、疲れすぎてはいない。 画面の光が顔をほんのり照らす。 - 夜:
ソファにだらっと座り、スマホを右手で持って親指でスクロールしている。 たまにふふっと笑って、目を細める。 足を小さくゆらゆらと揺らしている。
3本の6秒動画をつなげると、
「AIイラストだけど、ちゃんと生活してる感」があるVlog風ショートができます。
③ 商品紹介:イラストキャラがグッズを見せてくれるCM風
Analytics Vidhyaの例でも、Grok Imagineは商品CMみたいな動画に強いとされています。(Analytics Vidhya)
これをイラストに応用してみます。
想定シーン
- 自作のマグカップやステッカーの宣伝動画
イラスト
- キャラがオリジナルマグカップを手に持っている全身 or バストアップ
モーション例
キャラクターは右手でマグカップを持ち、カメラの前に少しだけ差し出す。
カップに描かれたイラストがよく見えるように、手首をゆっくりとひねって左右に傾ける。
そのあと、カメラ目線でニコッと笑う。
背景はやわらかいボケの入ったカフェ風の室内。
アニメ調のやさしい動きで。
ここに、編集ソフトで
- 「新作マグ、つくりました。」
- 「概要欄のリンクからどうぞ!」
みたいなテロップを入れると、完全にCMです。
最後に:安全面とマナーも一応おさえておこう
Grok Imagineは「Spicyモード」などを含めて、NSFWコンテンツ周りでかなり批判も出ているツールです。(The Verge)
- 実在の人物(アイドル・俳優・配信者など)の画像を勝手に使わない
- 著作権のあるキャラクター(既存アニメ・ゲーム)を丸パクリしない
- 特に性的・暴力的な表現は避ける
このあたりを守りつつ、自分のオリジナルキャラや、自分で描いたイラストを動かす方向で遊ぶのが、いちばん健全で長く続けやすいです。
まとめ
- Grok Imagineは、イラスト1枚から6〜10秒の動画+音を作れる新しいAIツール
- 最初に キャラ設定テキスト+キャラシート(正面・バストアップ・横向き) を整えると、一貫性がかなり上がる
- 動きは「瞬き+ちょっとした仕草」くらいの 控えめスタートがおすすめ
- 複数クリップを作って、最後は編集ソフトで 人間が監督をする のがプロっぽい仕上がりへの近道
「AIなのに、ちゃんとそのキャラが“生きてる”感じが出たとき」、
編集していてめちゃくちゃ楽しいので、ぜひ一度やってみてください。










こんにちは、フルタニです。放送局で番組作りをしてました。 Grok でイラストをヌルッと動かすを書きます。