初心者でも簡単!GoogleのAIツール Whisk で画像からアイデアを形にする方法

フルタニ

こんにちは、フルタニです。放送局で番組作りをしてました。 Whisk で画像からアイデアを形にする方法を書きます。

「こういうビジュアルがあったらいいな」というアイデアが浮かんても、頭に浮かんだイメージを伝えられず悔しい思いをしたことありませんか。

「あれ?これ、使えそうじゃん?」と触った瞬間に感じたのがWhiskでした。

なにせ、画像が3枚あれば「こんなイメージが欲しい」と思った画像が作れるのです。

従来のテキスト入力型のAIツールとは一線を画し、画像を使って直感的にクリエイティブな作品を生み出すことができるのがWhiskの魅力です。

今回は、Googleが開発した新しいAIツール「Whisk(ウィスク)」について、初心者の方でもわかりやすく解説します。

画像からアイデアを形にする次世代クリエイティブAI「 Whisk 」の使い方

🎨 Whiskとは?—画像から生まれる新しいクリエイティブ体験

Whiskは、Google Labsが開発した生成AIツールで、2024年12月に発表されました。

Whisk – labs.google/fx

特徴的なのは、従来のようにテキストで指示を出すのではなく、画像をアップロードすることでAIが自動的に画像を生成してくれる点です。

具体的には、以下の3つの要素を組み合わせて新しい画像を作り出します。

  • モデル:キャラクターやオブジェクトの元となる画像
  • シーン:背景や環境を表す画像
  • スタイル:イラスト風、写真風、ぬいぐるみ風などのスタイルを表す画像

これらを組み合わせることで、例えば「ぬいぐるみ風の猫がカフェでお茶を飲んでいるシーン」といった具合に、直感的に画像を生成することができます。

🛠️ Whiskの使い方—初心者でも簡単に始められるステップ

1. アクセスとログイン

まず、Whiskの公式サイトにアクセスします。Googleアカウントでログインすることで、すぐに使用を開始できます。

画面をクリックするとトップページに切り替わります。

2. 画像のアップロード

ツールを開くをクリックすると編集画面が出てきます。

次に、生成したい画像の要素となる3つの画像を用意します。例えば:

  • モデル:猫の画像
  • シーン:カフェの店内の画像
  • スタイル:こんな世界観の画像にしたい参照イラスト画像

これらの画像を左サイドバーを表示してそれぞれ対応する場所にドラッグ&ドロップします。

3. 画像の生成

画像をアップロードしたら、説明欄に作りたいイメージの説明文を「猫の顔をした人間がコーヒーを飲んでいる。」と日本語で入力し、矢印ボタンをクリックします。

すると、瞬時にAIが自動的に二枚の画像を生成します。

生成された画像は、気に入ったものをダウンロードしたり、さらに編集を加えることができます。

基本の使い方は以上。

複雑なプロンプトを使わずに、画像をもとに直感的な操作で画像を生成できるクリエイティブツールです。

「プロンプトを学ぶ必要がない」ことを目指して設計されているため、詳細なテキストプロンプトを入力することなく、画像をアップロードするだけで生成できます。

さらに、Whiskでは生成した画像をアニメーションさせることもできます。

生成した画像をクリックするとガイドが現れるので「アニメーション化」を選択します。

質問欄に入力するとエラーが多発するので、何も入力せずに矢印キーを押します。数分すると動画が背景音付きで生成されます。

https://www.tumblr.com/crookedphantombread/796666414863925248

画像のアップロード回数に制限はなく、生成した画像の保存や再利用も自由に行えます。

一日の動画生成可能回数は5回で、生成されたアニメーションの端っこに『Veo』という、マークがつきます。

デメリットは指示に対する追従性が低いため、凝ったアニメーションをさせたいのであればGoogle AI Studioなどの力を借りた方がよいです。

オリジナルの人物の全身写真から“別人が踊る”透過動画を作るワークフロー

例えば、「写真を参考に別人のモデルを生成して、そのモデルを動画の編集用に透過画像にしてダンスさせたい」という動画を作ることも可能です。

🔧用意するもの(再確認)

  • 人物写真:本人許諾済み or ライセンスフリー素材
  • 別人にする参照画像:顔立ち・髪型・服装が違う写真(権利処理済み)
  • ダンスポーズ動画:ライセンスフリー、720〜1080p、カメラ固定
  • 出力仕様:SNS向け(1080p/30fps/MP4 H.264)

🪄STEP 1:Whiskで“別人”をつくる

  1. Whisk(Google Labs)にアクセス → ログイン。
  2. Subject画像に人物写真をアップロード。
  3. 参照画像(Reference)に「別人っぽくしたい素材」を追加。
    • 例:「髪型が違う」「服が違う」「表情が違う」写真。
  4. Styleで「Realistic」または「Photo」などを選択。
  5. 生成結果の中から、全身・正面がはっきりしたものを保存(PNG形式)

💡コツ:背景が無地(白・グレー)だと後工程がラク。

✂️STEP 2:背景を消す(透過PNGに)

Whiskの出力に背景がある場合は以下のどれかで除去:

  • remove.bg(無料・自動)
  • Photoshop「選択とマスク」機能
  • ClipDrop「Remove Background」

出力した透過PNGを保存しておきます。

💡保存名例:「dance_person_clean.png」

🕺STEP 3:モーション転送で“踊らせる”

ダンスポーズ動画の動きを別人画像に転送します。

初心者向けの代表的な方法:

▶️ツール:DeepMotion(Web)
  1. DeepMotion にアクセス。
  2. 無料アカウントを作成し、
    • Character Image:Whiskで作った透過PNG
    • Motion Video:ダンスポーズ動画 をアップロード。
  3. 自動で「別人が踊る」アニメーションを生成。
  4. 出力形式を「Video(透明背景)」または「FBX/GLB」で保存。

💡有料プランで透過MP4が使えるが、無料でも十分テスト可能。

🖥️STEP 4:動画編集で調整・仕上げ

Premiere Pro や DaVinci Resolve などの編集ソフトに読み込むことで、背景の動画と合成させることができます。

✅ Whiskのメリットとデメリット

メリット

  • 直感的な操作:画像をアップロードするだけで、誰でも簡単に画像を生成できます。
  • 多彩なスタイル:イラスト風、写真風、ぬいぐるみ風など、様々なスタイルで画像を生成できます。
  • クリエイティブな表現:自分のアイデアを視覚的に表現することができます。

デメリット

  • 精度の限界:AIが生成する画像は必ずしも完璧ではなく、期待通りの結果が得られないこともあります。
  • 画像の品質依存:アップロードする元画像の品質が低いと、生成される画像の品質も低くなります。
  • 利用制限:無料プランでは、1日の使用回数に制限があります。

🔧 Whiskをさらに活用するためのポイント

  • 高品質な元画像を使用する:生成される画像の品質は、アップロードする元画像の品質に大きく依存します。できるだけ高解像度で鮮明な画像を使用しましょう。
  • スタイルを工夫する:同じモデルとシーンでも、スタイルを変えることで全く異なる印象の画像を生成することができます。
  • 繰り返し試す:一度で完璧な画像が生成されるとは限りません。何度も試行錯誤を重ねることで、より満足のいく結果が得られます。

まとめ

Whisk は発展途上のツールです。でも、「手が止まったときのブレスト素材」「静止画をちょっと動かした演出素材」に使えるポテンシャルは十分に感じました。

最初から「完璧」な動画を作ろうとせず、一歩ずつ “足し算的に使いこなす” 感覚で触ってみてください。