画像生成AI Stable Diffusion の衝撃&使い方

Stable Diffusion
フルタニ

こんにちは、フルタニです。放送局で番組作りをしてました。 Stable Diffusion を書きます。

クリエイター界隈に衝撃が走りました。

  • 「いや、ヤバイでしょ」
  • 「いや、これはチャンス」

プロの画家やデザイナー、さらに絵が描けないアマチュアまで騒然となったのが「画像生成AI」という新技術でした。

なかでも画像生成AI「Stable Diffusion」の登場は、産業革命ともいわれています。

急速に進むAIの進化についていくのは、初心者には正直ハードルが高すぎます。

でも絶対知っておいた方がいいのでまとめました。

大ブレイクStableDiffusionの使い方

画像生成AI「Stable Diffusionとはひとことで言うとAI画家のこと。

人間の画家と違うのは「こんな絵を描いてね」と注文すれば限りなく絵を描いてくれる点です。

ただし、作画を注文を依頼するにはルールに則った命令が必要です。

命令といっても素人には理解不能なプログラムを組む必要は一ミリもありません。

誰でもしゃれた命令や呪文をぶち込むだけでOK。

勝手にクオリティの高い絵画表現を作ってくれるのです。

仕上がった作品は独創的。しかも無料著作権もフリーというのだからたまりません。

両AIを使ってみて、Midjourneyは油絵や水彩画っぽい画像を生成するのが得意なのに対し、Stable Diffusionは写真のような、もしくはカートゥーンっぽい画像を作るのが得意そうな印象を受けました。

「Stable Diffusion」の画像生成力ならヘタクソマンガ家の助けになるか?:サダタローのゆるっと4コマ劇場 – ITmedia NEWS

全世界のクリエイターが即反応。アップロードされた作品例がSNS上に飛び交い始めました。

グーテンベルグが活版印刷を始めたころはこんな騒ぎだったのかもしれません。

絵描きという仕事は才能や技術を持つ人の聖域ではなくなったのです。

これまでの職業が大きく影響を受ける点では、アートの産業革命といっても過言ではないでしょう。

静止画のみならず動画生成できるといいます。すごいですね。

言葉で指示した画像を凄いAIが描き出す「Stable Diffusion」 ~画像は商用利用も可能(Impress Watch) – Yahoo!ニュース

ハイエンドゲーミングPCを用意し、どのくらい高速に画像を生成できるのか

ハイエンドゲーミングPCで「Stable Diffusion」を動かすと凄い! 高解像度画像を数秒で生成【特集・集中企画】 – 窓の杜

画像生成AI「Stable Diffusion」とは

世界に衝撃を与えた画像生成AI「Stable Diffusion」を徹底解説! – Qiita

初心者にとって最大のメリットは敷居が低いこと。

誰でも簡単に、好きなだけ「お絵描き」できる点です。

動画制作を続けていると、編集する素材に困ることがあります。

安く大量の使える素材が欲しくなるのです。

でも、使える素材は限られています。

では自分で絵が描けるかというと、それは大きな問題です。

自分で素材を作るには、才能やスキルが求められるので、絵心のない自分にははっきりいってムリです。

有料素材サイトを探すにしても、お金がかかるしイメージ通りの素材が見つかるとは限りません。

金欠才能なしの初心者にも、タダで権利フリーの素材が手に入る。

そんな夢を、英Stability AIが発表した画像生成AI「Stable Diffusion」が叶えてくれたのです。

ラッキー&サンクス。

でも、実は、この夏、画像生成AIの発表が相次ぎました。

8月「MidJourney」という別の画像生成AIが先行して登場しました。

画像生成AI Midjourney の使い方 | ぶいろぐ

MidJourneyはクオリティこそ高かったものの、操作のめんどくささや有料であることがネックとなり、初心者ユーザーのハートを捉えきれませんでした。

そこに、無料で使えるStable Diffusionが、MidJourneyをさらに上回る作画力を抱えて登場。

界隈の注目を独り占めしてしまったのです。

なんといっても、

  • 画像生成AIが無料で使える
  • 画才のない人でも楽々映像作品が作れる

というのは大きいですね。

さらに使ってみると、ゴッホ風の肖像画とか、ワンピース風キャラクター、見たこともないドレスなんてものが無限に作れるのです。

作家のなかには、AIでアイデア出しをし、下敷きにして自作をつくるという声まで聞こえるようになりました。

AIの生成物には著作権がないためやり放題。

ゴールドラッシュ現象が起きるかもしれません。

言い換えれば、アートの世界に産業革命をもたらすかもしれないツールです。

クリエイター界隈で起きた衝撃はどのようなものがあるのでしょうか。

まず刺さったのがエンジニアです。

映像産業ではここ数年、商品やサービスの開発が加速してきました。

高画質・軽量化がすすんだことで、iPhoneで劇場用映画が撮れたり、DJI Osmo でジンバル撮影ができたり、ドローンで空撮ができたりできるようになりました。

つまり、映像産業界ではハードを中心にローコスト化が進んできましたのです。

ところが今回はハードではなくソフト面で革命的な動きが起きました。

画像生成AIは、アートやエンタメに限らず、フアッションや建築デザインなどの世界にも広がり始めています。

エンジニアの動きは要注意かもしれません。

制作会社がプロデュースするクリエイティブ・アカデミー nests(ネスト) 6ヶ月で未経験から動画クリエイターになる!【デジタルハリウッド STUDIO by LIG】

画像の生成

Stable diffusionで画像を生成するには大きな壁があります。

大変なのがAIに自分が作りたい映像のイメージを伝えることです。

イメージは「獣の耳が生えたかわいい女の子」のように具体的に指示する必要があります。

しかも、英語です。

「japanese anime style」なんて書きます。

さらに、複雑な映像が欲しい場合はAIに通じる文章を英語で追加します。

たとえば、こんな具合。

beautiful! mage woman portrait, challenging, 3 0 years, japanese anime style, golden tears, dark strands, digital painting part by wlop and mucha, unreal engine, 8 k, artstation, deviantart, f 1. 4, smooth, cinematic light, duotone orange blue tones, dawn volumetric light

するとこんな画像が生成されます。

なので、この英語テキストを生成するのは外国人の日常感覚が詰まった語学力が必要になります。

なのでこの世界では注文のことを「呪文」と呼んでいます。

初心者が気軽に触って楽しめるようなレベルとは言えませんね。

Stable diffusionを使いこなす”呪文”の書き方

日本人ユーザーにとっては、この「呪文」がとても厄介です。

外国人でない日本人が、ロコつまり外国人になり切ってAIにわかるようなテキストを英語で書く必要があります。

並び順によっては全く異なるイメージが出力されるので注文の付け方にも工夫が必要です。

呪文の基本は

  • 後ろの文ほど無視されやすい。
  • (テキスト)とすると、その部分をより意識される。
  • [テキスト]とすると、その部分をより重視しないようになる。
【AIアート】呪文生成のノウハウ【Stable Diffusion web UI(AUTOMATIC1111版) / プロンプト / ネガティブプロンプト】 – 忘却まとめ

などの独特なルールがあります。なのでルールを探りながらリクエストを作成します。

  • 描いてほしい対象物の英語名をリスト化する
  • 必要なキーワード、除きたいキーワードが入ったテンプレ呪文を入れる

ポジティブキーワードは

(masterpiece), high quality, very_high_resolution, large_filesize, full color

ネガティブキーワードは

lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry, artist name, multiple legs, malformation,

などです。

外国人になり切るのってかなりハードル高いですよね。

そんな人におススメなのが、テキストもAIに頼むことです。

そんな便利なツールあるかって。

あるんです。それが、DeepL翻訳(Web版)

ディープラーニングの手法を用いた自動翻訳AIに日本語で質問を入力すると、Stable diffusionが理解しやすい英語テキストにしてくれます。
今話題の画像生成AI「Stable Diffusion」と自動翻訳「DeepL」を組み合わせて遊んでみた | 数学・統計教室の和から株式会社

それも面倒な人は、テンプレ集を参考に応用してみましょう。

「素敵な画像を出力したいけど、なかなか呪文詠唱がうまくいかない・・・」とお悩みの召喚士さんのために、高レベル「呪文詠唱」パターン&召喚画像を300枚以上
Stable Diffusion「呪文詠唱」パターン集!見習い召喚士必見!これでコツを掴もう

ネット上に散らばってるプロンプト情報を適当に集めて詰め込みました。
使用法は使い方シートを確認ください。
Stable DiffusionやNovelAIなどで使う呪文を集めたスプレッドシート(またはテキスト)|火月@ryon3kag|note

ニュース

【ニュース】「Stable Diffusion」は、かなり優秀な画像圧縮能力がある

「Stable Diffusion」は、画像生成AIだけではなく強力な非可逆画像圧縮コーデックとして使うことができます。

JPEG形式やWebP形式よりノイズが少なく、なおかつ圧縮後のファイルサイズが最も小さくなるというリポート。

画像生成AI「Stable Diffusion」が実はかなり優秀な画像圧縮を実現できることが判明 – GIGAZINE

【ニュース】日本語の指示に特化した画像生成AI「Stable Diffusion」

AIキャラクター開発企業rinna株式会社は9月9日、「Stable Diffusion」を日本語に特化させた画像生成モデル「Japanese Stable Diffusion」を開発したことを発表しました。

小型家電回収

画像生成AIの波紋

画像生成AIは、まずは商品のデザイン開発を中心に実用化が進むと思われます。

高額なデザイン料がタダ同然になるわけですから、メーカとしてはほっておくわけにいかないでしょう。

クライアントの意向を確認するために、まずはじめに無料のデザインを複数作って方向性を確認する。

というのが依頼者にも制作側にもメリットが得られる使われ方のような気がします。

今ネット上を賑わしているのが二次元キャラクターのデザインです。

キーワードを入れるだけで、人間の想像を超えたコンテンツを数秒で作ってしまうのが驚きです。

キーワード職人がすぐにでも登場しそうです。

写真や絵画などの現代アートのクリエイターにとっては試練の時代の幕開けかもしれません。

現代美術への影響は災害級と言われていますが、古典的な作品も影響を免れないように思います。

架空の画像やフェイク画像も作れそうです。

大量に生成ができることからNFTアートへの影響も注目です。

コミックの世界にも深刻な影響を与えそうです。

マンガの背景画もAI絵師に置き換わるとアシスタントの仕事はどうなるのでしょうか。

建築デザインにもインパクトが

界隈は呪文祭りで盛り上がっています。

呪文を商売にする人がそろそろ現れてもいいころです。

構図に強いimg2imgの作例。

AI著作と権利の行方

近からぬ将来議論がまきおこるのが権利問題の行方です。

現行法では、おおまかに言って著作権は人間が著作した作品に発生します。

人間以外のAIが生産した作品に著作権はない。というわけです。

AIソフトウェア2を生成するために他人の画像や文章などの著作物を勝手に収集して利用することができるか(論点1)
▼ 自動生成された画像に著作権が発生するか(論点2)
▼ 学習に用いられた画像と同一の画像が『偶然』自動生成された場合、著作権侵害に該当するか(論点3)

Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権 | STORIA法律事務所

画像生成AIは過去に公開された著作物などを大量に読み込むことで、独自の作品を作り出します。

ならば、意図的に著名コンテンツを読み込ませ、著名コンテンツの検索ワードでAIに作らせたらどんな作品ができるのでしょうか。

オリジナルの作品にきわめて類似した作品ができるはずです。

ディズニーのようでいてディズニーでない世界観

18禁のようでいて18禁ではないコンテンツ。

法整備が進むまでが勝負とみて、お金の集まる場所を中心に、思わぬサービスや商売が登場するかもしれません。

これから、まだ公開されてない、MicrosoftのNuwa Infinity、MetaのMake-A-Scene(スケッチインプットができる。)、GoogleのImagen、Partiあたりも公開されるでしょう。そして、これからも他のもどんどんいっぱい…

やばすぎるAI画像生成サービス「Stable Diffusion」始まる。 【簡単解説 & 応用 & Prompt付生成事例集】|やまかず|note

まさに文明衝突から生み出されるブルーオーシャンの出現です。

Stable Diffusionには、すでに画像生成の手法としてさまざまな応用例が出始めている。例えば、ある画像を参考にして指示文(プロンプト)に沿って変化させていく「img2img(イメージ・トゥ・イメージ)」や、生成させた画像を再び初期状態として入力してプロンプトによる修正を繰り返す「ループバック」と呼ばれるテクニックなどが話題になった。変化が早すぎて時間軸が分からなくなるが、Stable Diffusionがこの世に出てきたのは8月23日。わずか3週間程度前の話だということを忘れないでほしい。

無料の「画像生成AIサービス」を国内最速で作ったら、クラウド料金が1日10万円になりかけた話【Stable Diffusion】 | Business Insider Japan

成り行きに注目です。

特集「THE WORLD IN 2023」 

あらゆるデザインのやり方を変えるAI画像生成ツール。

雑誌「Wired日本版Vol47」では「ジェネレーティブAIが無限のメタバースを生み出す」と題してケヴィン・ケリー氏の特集記事が掲載されています。

わたしたちはこれまでずっと、コンピューターには真の創造性はないと言い聞かされてきた。それが突如として、何百万人もの人々が新種のAIを使うことで、これまで見たこともないような息をのむ画像を生成している。こうしたユーザーのほとんどは、プロのアーティストではない。プロである必要がないのだ。スクリーンに表示される画像のリアルさとディテールの細かさには感嘆するばかりだ。「Midjourney」「Stable Diffusion」「Artbreeder」「DALL・E」の4つのサービスだけをとってみても、人々は毎日2,000万枚以上の画像をAIと共同制作している。絵筆を手にしたAIは、人々に「すごい」と言わせるエンジンになったのだ。

Stable Diffusion 2.0

2022年11月公開された、Stable Diffusionのバージョン2.0。

LAIONが開発した新しいテキストエンコーダーが使用されていて、画像の品質が大幅に向上しました。

  • 生成される画像のデフォルトの解像度が512×512ピクセルとなるモデルと、768×768ピクセルとなるモデルを提供
  • 画像を入力すると4倍の大きさにアップスケール可能なモデル
  • 入力された画像の深度を推測し、深度とプロンプトから新たな画像を生成可能なモデル
  • 画像(および変更したい部分を示すマスク画像)とプロンプトを入力すると、画像の一部だけをプロンプトに応じて書き換えるモデル
Stable Diffusion 2.0で追加された機能を試してみよう:Stable Diffusion入門(1/2 ページ) – @IT

AIが瞬時に回答chatGPTが次に来る

インスタグラムの普及速度を圧倒的速さで上回る驚異のウェブツール「chatGPT」が大ブレイク中です。

この仕組みもAIが膨大な情報の中から最適解を見つけ出してくれるというもの。

導入は簡単です。別記事にまとめました。

まとめ

画像生成AIの作品の凄さは、パッと見人の手で描いたリアルな絵と見分けがつかない出来栄えなこと。

アートの世界でも始まった産業革命に巻き込まれないよう、制作者は防衛策を取る必要があることを痛感します。

画面をつぶさに見ると意味不明な部分が見つかることから、人の手によるコンテンツの優位性は揺るがないものと思います。

画像生成AIブームからしばらく目が離せません。

Stable Diffusionに関するよくある質問

コンテンツ生成系のAIサービスは他にどのようなものがありますか?
プログラミング・プラグイン・イラスト・アート・写真・文章・記事・作曲・ナレーションター・・・サービスは急成長しています。日本語でも利用できます。使いやすいものを見つけたら早めに飛び付きましょう。
世界初!イメージを画像にしてくれるAI素材サイト AI素材.com の衝撃 | ぶいろぐ
画像生成AIにじジャーニー( nijijourney )の衝撃&使い方 | ぶいろぐ
AIがどんな質問にも答えてくれる ChatGPT アカウント作成と質問のやり方 | ぶいろぐ
画像生成AI Midjourney の使い方 感想 | ぶいろぐ
nijijourney
AI素材.com
MacでWindowsを使えるソフトウェア【Parallels】