画像生成AI Stable Diffusion の衝撃&使い方

フルタニ

こんにちは、フルタニです。放送局で番組作りをしてました。 Stable Diffusion を書きます。

この夏、クリエイター界隈に走った衝撃をあなたは知ってますか。

  • 「いや、ヤバイでしょ」
  • 「いや、これはチャンス」

プロの画家やデザイナーだけでなく、絵が描けないアマチュアの間に衝撃と波紋を呼んだサービスがあります。

画像生成AI「Stable Diffusion」です。

初心者にはハードルが高そうに見えますが、絶対触れておいた方がいいニュースです。

知っておくと得するテクノロジーなので深掘りします。

#StableDiffusionの使い方

画像生成AI「Stable Diffusion」とはひとことで言うとAI画家のこと。

作画を注文を依頼するにはルールに則った命令が必要です。

誰でもしゃれた命令🟰呪文をぶち込むだけで、勝手にクオリティの高い絵画表現を作ってくれるのです。

仕上がった作品は独創的で高いクオリティ。

無料でしかも著作権フリーというのだからたまりません。

両AIを使ってみて、Midjourneyは油絵や水彩画っぽい画像を生成するのが得意なのに対し、Stable Diffusionは写真のような、もしくはカートゥーンっぽい画像を作るのが得意そうな印象を受けました。

「Stable Diffusion」の画像生成力ならヘタクソマンガ家の助けになるか?:サダタローのゆるっと4コマ劇場 – ITmedia NEWS

全世界のクリエイターが即反応、反応がSNS上で飛び交い始めました。

これまでの職業が大きく影響を受ける点では、アートの産業革命といっても過言ではないでしょう。

静止画のみならず動画生成できるといいます。すごいですね。

言葉で指示した画像を凄いAIが描き出す「Stable Diffusion」 ~画像は商用利用も可能(Impress Watch) – Yahoo!ニュース

画像生成AI「Stable Diffusion」とは

初心者にとっての直接的なメリットは、素材を好きなだけつくれることかもしれません。

静止画や動画の素材は動画制作に欠かせません。

でも、使える素材は限られています。

自分で素材を作るには、才能やスキルが求められるので、絵心のない自分にははっきりいってムリです。

有料素材サイトを探すにしても、お金がかかるしイメージ通りの素材が見つかるとは限りません。

金欠才能なしの初心者にも、タダで権利フリーの素材が手に入る。

そんな夢を、英Stability AIが発表した画像生成AI「Stable Diffusion」が叶えてくれたのです。

ラッキー&サンクス。

でも、実は、この夏、画像生成AIの発表が相次ぎました。

8月「MidJourney」という別の画像生成AIが先行して登場しました。

画像生成AI Midjourney の使い方 | ぶいろぐ

MidJourneyはクオリティこそ高かったものの、操作のめんどくささや有料であることがネックとなり、初心者ユーザーのハートを捉えきれませんでした。

そこに、無料で使えるStable Diffusionが、MidJourneyをさらに上回る作画力を抱えて登場。

界隈の注目を独り占めしてしまったのです。

なんといっても、

  • 画像生成AIが無料で使える
  • 画才のない人でも楽々映像作品が作れる

というのは大きいですね。

さらに使ってみると、ゴッホ風の肖像画とか、ワンピース風キャラクター、見たこともないドレスなんてものが無限に作れるのです。

作家のなかには、AIでアイデア出しをし、下敷きにして自作をつくるという声まで聞こえるようになりました。

AIの生成物には著作権がないためやり放題。

ゴールドラッシュ現象が起きるかもしれません。

言い換えれば、アートの世界に産業革命をもたらすかもしれないツールかもしれません。

クリエイター界隈で起きた衝撃はどのようなものがあるのでしょうか。

まず刺さったのがエンジニアです。

映像産業ではここ数年、商品やサービスの開発が加速してきました。

高画質・軽量化がすすんだことで、iPhoneで劇場用映画が撮れたり、DJI Osmo でジンバル撮影ができたり、ドローンで空撮ができたりできるようになりました。

つまり、映像産業界ではハードを中心にローコスト化が進んできましたのです。

ところが今回はハードではなくソフト面で革命的な動きが起きました。

画像生成AIは、アートやエンタメに限らず、フアッションや建築デザインなどの世界にも広がり始めています。

エンジニアの動きは要注意かもしれません。

制作会社がプロデュースするクリエイティブ・アカデミー nests(ネスト) 6ヶ月で未経験から動画クリエイターになる!【デジタルハリウッド STUDIO by LIG】

では、どうすれば利用できるのでしょうか。

画像生成AI「Stable Diffusion」の利用手順

もともと理系のスキルを持たない私たち初心者にもStable Diffusionは触ることができます。

Googleの「Python実行環境」である「Colaboratory」から無料で利用できます

とりあえず検索ワードを入力して作画体験したい人はこちらのお試し版から体験できます。「Stable Diffusion Demo」

利用方法はNoteやGigaZineで詳しくリポートされています。

Google Colab で はじめる Stable Diffusion v1.4|npaka|note

画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ – GIGAZINE

[Stable Diffusion] AIでテキストから画像を生成する使い方を解説 [text2img] – TeDokology

ざっくりした流れは

デモではなく、本気でStable Diffusionを使い倒したい人には、無料で使える環境が用意されています。

手順は結構複雑で、実際に体験したい人は攻略サイトがかなりの数できています。

攻略手順を要約すると下記のような流れになります。

Hugging Face_Stable Diffusionに掲載された解説文(Google翻訳)

・AI関連コミュニティサイト「Hugging Face」を開く
・同サイトに公開されているStable Diffusionのページにアクセス
・アカウントを取得
・再度Stable Diffusionのページにアクセスして「Hugging Face」のトークンを発行
Colaboratory へようこそ – Colaboratoryにアクセスし、画面右上の「ログイン」をクリック
・ログインに用いるGoogleアカウントを選択
・パスワードを入力してColaboratoryにログイン
・「ノートブックを新規作成」をクリック
・ハードウェアアクセラレータの欄で「GPU」を選択して保存
・ノートブック内にStable Diffusionをインストール
・コマンドからHugging Faceで発行したトークンを置き換えて実行するなど手続きを行う
・緑色のチェックマークが表示されれば、Stable Diffusionを使う準備は完了

Colaboratoryに入ってからは専門用語とコマンド操作がむき出しという様相です。

初心者にはハードルが高いかもですね。

サービスは無料とはいえ、じっさいに利用し始めるとサーバー代がかかるという点には注意が必要です。

サービス開始の翌日、グーグルのクラウドサービス「Firebase」の請求書を見た時だった。その日、メールで届いた請求書の金額は、1日で利用料金が1万円を突破していた。その後も請求金額はさらに増加傾向を示していた。

無料の「画像生成AIサービス」を国内最速で作ったら、クラウド料金が1日10万円になりかけた話【Stable Diffusion】 | Business Insider Japan

同じ画像生成AIの「Midjourney」と異なるのは「Discord」に入る必要がないことです。

画像の生成

Stable diffusionで画像を生成するには大きな壁があります。

大変なのがAIに自分が作りたい映像のイメージを伝えることです。

イメージは「獣の耳が生えたかわいい女の子」のように具体的に指示する必要があります。

しかも、英語です。

「japanese anime style」なんて書きます。

さらに、複雑な映像が欲しい場合はAIに通じる文章を英語で追加します。

たとえば、こんな具合。

beautiful! mage woman portrait, challenging, 3 0 years, japanese anime style, golden tears, dark strands, digital painting part by wlop and mucha, unreal engine, 8 k, artstation, deviantart, f 1. 4, smooth, cinematic light, duotone orange blue tones, dawn volumetric light

するとこんな画像が生成されます。

なので、この英語テキストを生成するのは外国人の日常感覚が詰まった語学力が必要になります。

なのでこの世界では注文のことを「呪文」と呼んでいます。

初心者が気軽に触って楽しめるようなレベルとは言えませんね。

呪文の書き方

日本人ユーザーにとっては、この「呪文」がとても厄介です。

外国人でない日本人が、ロコつまり外国人になり切ってAIにわかるようなテキストを英語で書く必要があります。

並び順によっては全く異なるイメージが出力されるので注文の付け方にも工夫が必要です。

外国人になり切るのってかなりハードル高いですよね。

そんな人におススメなのが、テキストもAIに頼むことです。

そんな便利なツールあるかって。

あるんです。それが、DeepL翻訳(Web版)

ディープラーニングの手法を用いた自動翻訳AIに日本語で質問を入力すると、Stable diffusionが理解しやすい英語テキストにしてくれるのです。

今話題の画像生成AI「Stable Diffusion」と自動翻訳「DeepL」を組み合わせて遊んでみた | 数学・統計教室の和から株式会社

【ニュース】「Stable Diffusion」は、かなり優秀な画像圧縮能力がある

「Stable Diffusion」は、画像生成AIだけではなく強力な非可逆画像圧縮コーデックとして使うことができます。

JPEG形式やWebP形式よりノイズが少なく、なおかつ圧縮後のファイルサイズが最も小さくなるというリポート。

画像生成AI「Stable Diffusion」が実はかなり優秀な画像圧縮を実現できることが判明 – GIGAZINE

【ニュース】日本語の指示に特化した画像生成AI「Stable Diffusion」

AIキャラクター開発企業rinna株式会社は9月9日、「Stable Diffusion」を日本語に特化させた画像生成モデル「Japanese Stable Diffusion」を開発したことを発表しました。

小型家電回収

画像生成AIの波紋

画像生成AIは、まずは商品のデザイン開発を中心に実用化が進むと思われます。

高額なデザイン料がタダ同然になるわけですから、メーカとしてはほっておくわけにいかないでしょう。

クライアントの意向を確認するために、まずはじめに無料のデザインを複数作って方向性を確認する。

というのが依頼者にも制作側にもメリットが得られる使われ方のような気がします。

今ネット上を賑わしているのが二次元キャラクターのデザインです。

キーワードを入れるだけで、人間の想像を超えたコンテンツを数秒で作ってしまうのが驚きです。

キーワード職人がすぐにでも登場しそうです。

写真や絵画などの現代アートのクリエイターにとっては試練の時代の幕開けかもしれません。

現代美術への影響は災害級と言われていますが、古典的な作品も影響を免れないように思います。

架空の画像やフェイク画像も作れそうです。

大量に生成ができることからNFTアートへの影響も注目です。

コミックの世界にも深刻な影響を与えそうです。

マンガの背景画もAI絵師に置き換わるとアシスタントの仕事はどうなるのでしょうか。

建築デザインにもインパクトが

界隈は呪文祭りで盛り上がっています。

呪文を商売にする人がそろそろ現れてもいいころです。

構図に強いimg2imgの作例。

AI著作と権利の行方

近からぬ将来議論がまきおこるのが権利問題の行方です。

現行法では、おおまかに言って著作権は人間が著作した作品に発生します。

人間以外のAIが生産した作品に著作権はない。というわけです。

AIソフトウェア2を生成するために他人の画像や文章などの著作物を勝手に収集して利用することができるか(論点1)
▼ 自動生成された画像に著作権が発生するか(論点2)
▼ 学習に用いられた画像と同一の画像が『偶然』自動生成された場合、著作権侵害に該当するか(論点3)

Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権 | STORIA法律事務所

画像生成AIは過去に公開された著作物などを大量に読み込むことで、独自の作品を作り出します。

ならば、意図的に著名コンテンツを読み込ませ、著名コンテンツの検索ワードでAIに作らせたらどんな作品ができるのでしょうか。

オリジナルの作品にきわめて類似した作品ができるはずです。

ディズニーのようでいてディズニーでない世界観

18禁のようでいて18禁ではないコンテンツ。

法整備が進むまでが勝負とみて、お金の集まる場所を中心に、思わぬサービスや商売が登場するかもしれません。

これから、まだ公開されてない、MicrosoftのNuwa Infinity、MetaのMake-A-Scene(スケッチインプットができる。)、GoogleのImagen、Partiあたりも公開されるでしょう。そして、これからも他のもどんどんいっぱい…

やばすぎるAI画像生成サービス「Stable Diffusion」始まる。 【簡単解説 & 応用 & Prompt付生成事例集】|やまかず|note

まさに文明衝突から生み出されるブルーオーシャンの出現です。

Stable Diffusionには、すでに画像生成の手法としてさまざまな応用例が出始めている。例えば、ある画像を参考にして指示文(プロンプト)に沿って変化させていく「img2img(イメージ・トゥ・イメージ)」や、生成させた画像を再び初期状態として入力してプロンプトによる修正を繰り返す「ループバック」と呼ばれるテクニックなどが話題になった。変化が早すぎて時間軸が分からなくなるが、Stable Diffusionがこの世に出てきたのは8月23日。わずか3週間程度前の話だということを忘れないでほしい。

無料の「画像生成AIサービス」を国内最速で作ったら、クラウド料金が1日10万円になりかけた話【Stable Diffusion】 | Business Insider Japan

成り行きに注目です。

まとめ

画像生成AIの作品の凄さは、パッと見人の手で描いたリアルな絵と見分けがつかない出来栄えなことです。

画面をつぶさに見ると意味不明な部分が見つかることから、人の手で作られたものとの区別はできます。

しかし、情報処理技術の革新はとどまることなく進むので、いずれ問題も解決されるでしょう。

Midjourneyにはじまった画像生成AIブームからしばらく目が離せません。

アートの世界でも始まった産業革命に巻き込まれないよう、制作者は防衛策を取る必要があることを痛感します。

MacでWindowsを使えるソフトウェア【Parallels】

久しぶりに八千文字の記事を書きました。

ここまでお読みいただきありがとうございました。