Grok でイラストをヌルッと動かす!キャラクターの見た目を崩さない画像→動画の作り方まとめ

フルタニ

こんにちは、フルタニです。放送局で番組作りをしてました。 Grok でイラストをヌルッと動かすを書きます。

最近X(旧Twitter)を見てると、
「静止画から6秒くらいの動画が一瞬で出てきたんだけど!?」「しかも音まで付いてるんだけど!?」
みたいなポスト、流れてきません?

あれの正体が xAIの「Grok Imagine」 です。

今日は「Grokでイラストを“自然に動かす”ショート動画をつくるには?」を、がっつり解説していきます

Grok でイラストをヌルッと動かす方法

そもそも「Grok Imagine」って何者?

xAIの「Grok Imagine」テキストや画像から約6秒のショート動画を自動で生成する機能です。

  • 静止画(イラストでもOK)をアップロード
  • 「こう動いてほしい」とテキストで指示
  • 数秒で、6〜10秒くらいの動画+簡単な効果音/環境音つきクリップが生成される (Analytics Vidhya)

エンジンには「Aurora」という新しい画像・動画モデルが使われていて、フォトリアルだけじゃなく アニメ・イラスト系のスタイルも対応。(Analytics Vidhya)

さらに最近は、XのGrokアプリの中から

  • テキスト→画像
  • 画像→動画
    まで一気通貫で触れるようになってきています。(Skywork)

この記事のゴール

この記事で目指すのはココです。

「同じイラストキャラを、一貫した見た目のまま、自然に動かすショート動画」を作れるようになること。

  • Xに上げる縦動画
  • YouTubeショート
  • 自分のチャンネルのイントロ動画

このあたりを想定して話します。

準備:何があれば始められる?

必要なもの

  1. Xアカウント + Grokが使えるプラン
    • 2025年末時点だと、Grok Imagineのフル機能(特に動画生成)は
      X Premium / Premium+ / SuperGrokユーザー向けに順次ロールアウト中です。
    • 無料で利用可能ですが、無料プランでは生成回数や機能に制限があり、より多く使いたい場合は有料プランへの加入が必要です。
  2. スマホ or PC
    • iOSアプリが一歩リード、Androidは動画機能が一部まだ限定的という報告もあります。(The Verge)
  3. 簡単な動画編集アプリ
    • CapCut / VN / Premiere / DaVinci など、なんでもOK
    • Grokだけで完結させるより、最後は編集ソフトで“人間の手”を入れた方が仕上がりが一気に良くなります

ステップ1:キャラクターの「設定テキスト」を作る

いきなりGrokに投げる前に、まずは キャラの仕様書(テキスト版) を作っておくと、後々の一貫性がめちゃくちゃラクになります。

例:ゆる系男子キャラの設定

試しに作ったのがこの画像。絵が描けない私でもこんな絵が簡単に作れました。

この絵を作るために必要なのが下記の情報。
このテキストを丸ごとGrokに突っ込んだらこの絵ができました。

・20代前半の男性キャラクター
・薄い茶色のボサボサ髪、右目の前髪だけ少し長い
・大きめの黒ぶちメガネ
・白いパーカーにネイビーのパーカー重ね着、グレーのスウェットパンツ
・丸っこい線で描かれた、やさしい雰囲気のイラスト
・パステルカラー、フラットでアニメ調の塗り、シンプルな背景

実はこれ、ベースとなるキャラクターをつくるための基礎情報。
これをベースに、毎回のプロンプトにコピペして使います。
「毎回ちょっとずつ違う言い方をする」と、キャラの見た目がブレやすくなります。

ステップ2:Grokで“ベースのイラスト”を作る

1. Imagineタブを開く

Grokアプリ(またはX上のGrok)で
「Imagine」タブ → テキストから画像生成 を選びます。(Skywork)

2. プロンプトの基本フォーマット

海外の解説でもよく紹介されているのが、
「行動(Action) + 光(Lighting) + スタイル(Style)」の3点セット。(Skywork)

たとえば:

行動(Action):机に座ってノートPCで作業している
光(Lighting):昼のやわらかい自然光、デスクライトは弱め
スタイル(Style):パステルカラーのフラットなアニメイラスト、太めの線、16:9

これにさっきの「キャラ設定テキスト」を足して、こんな感じのプロンプトになります:

20代前半の男性キャラクター。
薄い茶色のボサボサ髪で、右目の前髪だけ少し長い。
大きめの黒ぶちメガネ。
白いパーカーにネイビーのパーカーを重ね着し、グレーのスウェットパンツを履いている。
丸っこい線で描かれた、やさしい雰囲気のパステルカラーのアニメイラスト。

机に座ってノートPCで作業している。
昼のやわらかい自然光で、デスクライトは弱め。
フラットな塗り、太めの線、シンプルな背景、16:9の構図。

これでまず 1枚の「決定版キャラ」イラスト を作ります。

ステップ3:キャラシートを作る(ここが一貫性のカギ)

RedditのGrokユーザーたちが口をそろえて言っているのが、
最初に“キャラシート”を作ると後の動画が安定する」という話。(Reddit)

具体的にはこんな構図を作る

  1. 正面・全身
  2. バストアップ(胸から上)
  3. 横向き or 斜め45度

それぞれ、同じキャラ設定・同じ色味・同じスタイルで、
プロンプトの「行動」と「構図」だけ変えて生成します。

例:バストアップ用

同じキャラクター設定。
カメラは胸から上のバストアップ。
カメラ目線で、少しだけ微笑んでいる。
背景は薄い水色のグラデーションでシンプルに。

この 3〜4枚を、あとで全部「動画化の元ネタ」に使うイメージです。

ステップ4:イラストを自然に動かす(Grok Imagineの動画化)

いよいよ本題。ここから 画像→動画 に変換していきます。(Analytics Vidhya)

1. Grok Imagineの動画機能にアクセス

動画にするための大まかな流れはこんな感じです:(Analytics Vidhya)

Grokアプリを最新にアップデート(動画にするためにはGrok ImagineはSuperGrokまたはPremium+サブスクリプションが必要です)

「Imagine」セクションを開く

表示された画像を長押し(ロングプレス)。メニューがポップアップします。「Make Video with Grok」をタップ

オプションから「Make Video with Grok」(または「Grokで動画作成」)を選択。

  • ここでプロンプトを追加可能(例: 「猫が踊るようにアニメーション化して」「ボーイフレンドを追加してムuppet風に」)。
  • プロンプトなしでデフォルト(自然な動き)でもOK。
  • 「Spicy mode」をオンにすると、よりダイナミック(またはエッジの効いた)動画に。

「動画にする」的なボタン(長押し or メニュー)を選ぶ

数秒待つと、6秒前後の動画+音声つきクリップが生成

2. モーションの指定のコツ

イラストを「不自然にグニャグニャさせない」ために、
動きは1〜2個に絞る のがおすすめです。

例1:デスクで作業するシーン

キャラクターは机に向かってタイピングしている。
2秒後に、ふと顔を上げてカメラの方を見て、口角を少しだけ上げて微笑む。
目の瞬きは自然な頻度で。
カメラは固定。動きは控えめで自然に。
アニメ調のやわらかい動きで。

例2:立ち絵がちょっとだけ動くループ動画

キャラクターは立ったまま、体をほんの少し前後にゆらす。
髪とパーカーのフードが、ゆっくり揺れる。
軽く瞬きを続けている。
シームレスにループするように、動きの始まりと終わりを滑らかに。

Grok Imagineは、ディズニー風の誇張された動きやカートゥーン寄りのアニメーションも得意と言われていますが、イラスト系なら最初は「控えめ」「ゆっくり」を意識した方が破綻しにくいです。(Analytics Vidhya)

3. 動画モードの選び方

報道では、Grok Imagineには
「Custom / Normal / Fun / Spicy」などのモードがあるとされています。(The Verge)

  • Normal:まずはここ。自然で破綻が少なめ
  • Fun:ちょっとオーバーリアクションで、TikTok向きの動き
  • Spicy:NSFW寄りのコンテンツ用とされ、かなり倫理的・法的な問題が指摘されています。普通のクリエイティブ用途では避けた方が安全です(The Verge)

ステップ5:複数カットを作って、編集ソフトでつなぐ

Grok Imagine自体は 6〜10秒くらいの短いクリップ作りに特化しています。(Analytics Vidhya)

なので、長めの動画を作りたいときは:

  1. 1シーン=1クリップとして、Grok Imagineで何本か作る
  2. それをCapCutなどに全部持っていく
  3. カットを並べて、BGM・効果音・テロップを足す

という「AIでパーツを作って、人間の手で仕上げる」流れが超おすすめです。

Redditでは「前の動画の“最後のフレーム”を次の動画のスタートにすると、色がどんどんおかしくなる」という声もあるので、毎回ちゃんと静止画から動画を作り直す方が安全です。(Reddit)

一貫性を保つためのテクニックまとめ

ここまでを、ポイントだけギュッとまとめます。

  1. キャラ設定テキストを作って、毎回コピペ
    • 髪型・髪色・服装・小物(メガネ・イヤホンなど)を必ず書く
  2. キャラシート(正面・バストアップ・横向き)を最初に作る
    • それぞれを動画化に使い回すことで、キャラの顔・体型が安定しやすい(Reddit)
  3. 「Expertモード+Grok 4本体」を選んでみる
    • Redditのユーザーから「Fast版より本体モデルの方がキャラがブレにくい」という報告あり(Reddit)
  4. 1クリップに盛り込む動きは少なめに
    • 瞬き+ちょっとした体の揺れ、くらいから始める
  5. 動画同士を直接つなげず、編集ソフトで“人間が監督”する
    • カット割り、テロップ、BGMで「作品感」を出す

具体的に使えるシーン例 3パターン

ここからは「こういうシーンにすると、Grok×イラストがめっちゃ映えるよ!」という具体例を3つ。

① チャンネル自己紹介用:デスク作業→カメラ目線で一言

用途

  • YouTubeチャンネルの冒頭数秒
  • Xに固定ポストで貼る自己紹介動画

流れ

  1. デスクで作業しているバストアップイラストを用意
  2. Grok Imagineでこんな感じのモーションを指定:
最初の2秒間、キャラクターは真剣な表情でキーボードを打っている。
そのあと、ふと手を止めてカメラの方を見る。
少し照れくさそうに笑って、右手を軽く上げて小さく手を振る。
瞬きは自然な頻度で。
背景はぼんやりとした部屋のまま、カメラは固定。
  1. 生成された動画を編集ソフトに持ち込み、
    テロップで「どうも、○○です。」と一言を載せる。
  2. BGMは軽めのローファイ系を下に薄く敷く。

これだけで “AIっぽさ”より“キャラの人格”を感じる自己紹介映像になります。

② 日常Vlog風ショート:同じキャラが一日を過ごす

用途

  • X・ショート動画で回す「1日のルーティーン」企画

必要なイラスト

  1. 朝:パジャマ姿でコーヒーを飲んでいる
  2. 昼:PCの前で作業している
  3. 夜:ソファでスマホを見ながらだらけている

それぞれ、同じキャラ設定・同じ描き方でイラストを作っておきます。

各シーンのモーション例

  • 朝: コーヒーカップを両手で持ち、ゆっくりと口元に運ぶ。 少し目を細めて「ほっ」としたような表情を浮かべる。 湯気がふわっと上がり続けている。
  • 昼: キーボードを打ちながら、たまに首をコキコキと横に倒して伸ばす。 表情は少し真剣だけど、疲れすぎてはいない。 画面の光が顔をほんのり照らす。
  • 夜: ソファにだらっと座り、スマホを右手で持って親指でスクロールしている。 たまにふふっと笑って、目を細める。 足を小さくゆらゆらと揺らしている。

3本の6秒動画をつなげると、
「AIイラストだけど、ちゃんと生活してる感」があるVlog風ショートができます。

③ 商品紹介:イラストキャラがグッズを見せてくれるCM風

Analytics Vidhyaの例でも、Grok Imagineは商品CMみたいな動画に強いとされています。(Analytics Vidhya)

これをイラストに応用してみます。

想定シーン

  • 自作のマグカップやステッカーの宣伝動画

イラスト

  • キャラがオリジナルマグカップを手に持っている全身 or バストアップ

モーション例

キャラクターは右手でマグカップを持ち、カメラの前に少しだけ差し出す。
カップに描かれたイラストがよく見えるように、手首をゆっくりとひねって左右に傾ける。
そのあと、カメラ目線でニコッと笑う。
背景はやわらかいボケの入ったカフェ風の室内。
アニメ調のやさしい動きで。

ここに、編集ソフトで

  • 「新作マグ、つくりました。」
  • 「概要欄のリンクからどうぞ!」

みたいなテロップを入れると、完全にCMです。

最後に:安全面とマナーも一応おさえておこう

Grok Imagineは「Spicyモード」などを含めて、NSFWコンテンツ周りでかなり批判も出ているツールです。(The Verge)

  • 実在の人物(アイドル・俳優・配信者など)の画像を勝手に使わない
  • 著作権のあるキャラクター(既存アニメ・ゲーム)を丸パクリしない
  • 特に性的・暴力的な表現は避ける

このあたりを守りつつ、自分のオリジナルキャラや、自分で描いたイラストを動かす方向で遊ぶのが、いちばん健全で長く続けやすいです。

まとめ

  • Grok Imagineは、イラスト1枚から6〜10秒の動画+音を作れる新しいAIツール
  • 最初に キャラ設定テキスト+キャラシート(正面・バストアップ・横向き) を整えると、一貫性がかなり上がる
  • 動きは「瞬き+ちょっとした仕草」くらいの 控えめスタートがおすすめ
  • 複数クリップを作って、最後は編集ソフトで 人間が監督をする のがプロっぽい仕上がりへの近道

「AIなのに、ちゃんとそのキャラが“生きてる”感じが出たとき」、
編集していてめちゃくちゃ楽しいので、ぜひ一度やってみてください。