画像生成AI Stable Diffusion の衝撃&使い方

こんにちは、フルタニです。放送局で番組作りをしてました。 Stable Diffusion を書きます。

クリエイター界隈に衝撃が走りました。

「いや、ヤバイでしょ」
「いや、これはチャンス」

プロの画家やデザイナー、さらに絵が描けないアマチュアまで騒然となったのが「画像生成AI」という新技術でした。

なかでも画像生成AI「Stable Diffusion」の登場は、産業革命ともいわれています。

急速に進むAIの進化についていくのは、初心者には正直ハードルが高すぎます。

でも絶対知っておいた方がいいのでまとめました。

Contents

大ブレイクStableDiffusionの使い方
画像生成AI「Stable Diffusion」とは
- 画像の生成
Stable diffusionを使いこなす”呪文”の書き方
ニュース
画像生成AIの波紋
AI著作と権利の行方
特集「THE WORLD IN 2023」
Stable Diffusion 2.0
AIが瞬時に回答chatGPTが次に来る
まとめ
Stable Diffusionに関するよくある質問

大ブレイクStableDiffusionの使い方

画像生成AI「Stable Diffusion」とはひとことで言うとAI画家のこと。

人間の画家と違うのは「こんな絵を描いてね」と注文すれば限りなく絵を描いてくれる点です。

ただし、作画を注文を依頼するにはルールに則った命令が必要です。

命令といっても素人には理解不能なプログラムを組む必要は一ミリもありません。

誰でもしゃれた命令や呪文をぶち込むだけでＯＫ。

勝手にクオリティの高い絵画表現を作ってくれるのです。

仕上がった作品は独創的。しかも無料。著作権もフリーというのだからたまりません。

両AIを使ってみて、Midjourneyは油絵や水彩画っぽい画像を生成するのが得意なのに対し、Stable Diffusionは写真のような、もしくはカートゥーンっぽい画像を作るのが得意そうな印象を受けました。
「Stable Diffusion」の画像生成力ならヘタクソマンガ家の助けになるか？：サダタローのゆるっと4コマ劇場 – ITmedia NEWS

全世界のクリエイターが即反応。アップロードされた作品例がSNS上に飛び交い始めました。

グーテンベルグが活版印刷を始めたころはこんな騒ぎだったのかもしれません。

絵描きという仕事は才能や技術を持つ人の聖域ではなくなったのです。

これまでの職業が大きく影響を受ける点では、アートの産業革命といっても過言ではないでしょう。

いま流行の #MidJourney よりも高性能の汎用画像AI #StableDiffusion（サービス名は #DreamStudio）が、世界中にフリーで配布されるという衝撃のニュース
プロのクリエイターに頼まずとも
あらゆる映像がつくれる時代は
上級作家にとっては悪夢かもしれないが
初心者にとっては下克上のチャンスだ https://t.co/IE5a7tDkLN
— フルタニケンジ@動画制作者 (@kenfru3) August 25, 2022

静止画のみならず動画生成できるといいます。すごいですね。

画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ

著:GIGAZINE

¥99 （2025/08/16 12:16時点 | Amazon調べ）

口コミを見る

Amazon

楽天市場

Yahooショッピング

ポチップ

言葉で指示した画像を凄いAIが描き出す「Stable Diffusion」～画像は商用利用も可能（Impress Watch） – Yahoo!ニュース

ハイエンドゲーミングPCを用意し、どのくらい高速に画像を生成できるのか

ハイエンドゲーミングPCで「Stable Diffusion」を動かすと凄い！高解像度画像を数秒で生成【特集・集中企画】 – 窓の杜

画像生成AI「Stable Diffusion」とは

世界に衝撃を与えた画像生成AI「Stable Diffusion」を徹底解説！ – Qiita

初心者にとって最大のメリットは敷居が低いこと。

誰でも簡単に、好きなだけ「お絵描き」できる点です。

動画制作を続けていると、編集する素材に困ることがあります。

安く大量の使える素材が欲しくなるのです。

でも、使える素材は限られています。

では自分で絵が描けるかというと、それは大きな問題です。

自分で素材を作るには、才能やスキルが求められるので、絵心のない自分にははっきりいってムリです。

有料素材サイトを探すにしても、お金がかかるしイメージ通りの素材が見つかるとは限りません。

金欠才能なしの初心者にも、タダで権利フリーの素材が手に入る。

そんな夢を、英Stability AIが発表した画像生成AI「Stable Diffusion」が叶えてくれたのです。

ラッキー&サンクス。

でも、実は、この夏、画像生成AIの発表が相次ぎました。

8月「MidJourney」という別の画像生成AIが先行して登場しました。

画像生成AI Midjourney の使い方 | ぶいろぐ

MidJourneyはクオリティこそ高かったものの、操作のめんどくささや有料であることがネックとなり、初心者ユーザーのハートを捉えきれませんでした。

そこに、無料で使えるStable Diffusionが、MidJourneyをさらに上回る作画力を抱えて登場。

界隈の注目を独り占めしてしまったのです。

なんといっても、

画像生成AIが無料で使える
画才のない人でも楽々映像作品が作れる

というのは大きいですね。

さらに使ってみると、ゴッホ風の肖像画とか、ワンピース風キャラクター、見たこともないドレスなんてものが無限に作れるのです。

作家のなかには、AIでアイデア出しをし、下敷きにして自作をつくるという声まで聞こえるようになりました。

AIの生成物には著作権がないためやり放題。

ゴールドラッシュ現象が起きるかもしれません。

言い換えれば、アートの世界に産業革命をもたらすかもしれないツールです。

クリエイター界隈で起きた衝撃はどのようなものがあるのでしょうか。

3Dエンジニアとして一番やべえなって思ったのは人物でも風景でもなくてこの手の素材が無限に生えてくる所ですね

材質名 texture photo,directly above,detail,loop material#stablediffusion pic.twitter.com/rRCAmWtMsf
— ビームマンＰ ver4.1 (@BeamManP) August 23, 2022

まず刺さったのがエンジニアです。

映像産業ではここ数年、商品やサービスの開発が加速してきました。

高画質・軽量化がすすんだことで、iPhoneで劇場用映画が撮れたり、DJI Osmo でジンバル撮影ができたり、ドローンで空撮ができたりできるようになりました。

つまり、映像産業界ではハードを中心にローコスト化が進んできましたのです。

ところが今回はハードではなくソフト面で革命的な動きが起きました。

画像生成AIは、アートやエンタメに限らず、フアッションや建築デザインなどの世界にも広がり始めています。

エンジニアの動きは要注意かもしれません。

制作会社がプロデュースするクリエイティブ・アカデミー nests（ネスト） 6ヶ月で未経験から動画クリエイターになる！【デジタルハリウッド STUDIO by LIG】

画像の生成

Stable diffusionで画像を生成するには大きな壁があります。

大変なのがAIに自分が作りたい映像のイメージを伝えることです。

イメージは「獣の耳が生えたかわいい女の子」のように具体的に指示する必要があります。

しかも、英語です。

「japanese anime style」なんて書きます。

さらに、複雑な映像が欲しい場合はAIに通じる文章を英語で追加します。

たとえば、こんな具合。

beautiful! mage woman portrait, challenging, 3 0 years, japanese anime style, golden tears, dark strands, digital painting part by wlop and mucha, unreal engine, 8 k, artstation, deviantart, f 1. 4, smooth, cinematic light, duotone orange blue tones, dawn volumetric light

するとこんな画像が生成されます。

なので、この英語テキストを生成するのは外国人の日常感覚が詰まった語学力が必要になります。

なのでこの世界では注文のことを「呪文」と呼んでいます。

初心者が気軽に触って楽しめるようなレベルとは言えませんね。

リンク

Stable diffusionを使いこなす”呪文”の書き方

日本人ユーザーにとっては、この「呪文」がとても厄介です。

外国人でない日本人が、ロコつまり外国人になり切ってAIにわかるようなテキストを英語で書く必要があります。

並び順によっては全く異なるイメージが出力されるので注文の付け方にも工夫が必要です。

呪文の基本は

後ろの文ほど無視されやすい。

(テキスト)とすると、その部分をより意識される。

[テキスト]とすると、その部分をより重視しないようになる。

【AIアート】呪文生成のノウハウ【Stable Diffusion web UI(AUTOMATIC1111版) / プロンプト / ネガティブプロンプト】 – 忘却まとめ

などの独特なルールがあります。なのでルールを探りながらリクエストを作成します。

描いてほしい対象物の英語名をリスト化する
必要なキーワード、除きたいキーワードが入ったテンプレ呪文を入れる

ポジティブキーワードは

(masterpiece), high quality, very_high_resolution, large_filesize, full color

ネガティブキーワードは

lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry, artist name, multiple legs, malformation,

などです。

外国人になり切るのってかなりハードル高いですよね。

そんな人におススメなのが、テキストもAIに頼むことです。

そんな便利なツールあるかって。

あるんです。それが、DeepL翻訳(Web版)。

ディープラーニングの手法を用いた自動翻訳AIに日本語で質問を入力すると、Stable diffusionが理解しやすい英語テキストにしてくれます。
今話題の画像生成AI「Stable Diffusion」と自動翻訳「DeepL」を組み合わせて遊んでみた | 数学・統計教室の和から株式会社

それも面倒な人は、テンプレ集を参考に応用してみましょう。

「素敵な画像を出力したいけど、なかなか呪文詠唱がうまくいかない・・・」とお悩みの召喚士さんのために、高レベル「呪文詠唱」パターン＆召喚画像を300枚以上
Stable Diffusion「呪文詠唱」パターン集！見習い召喚士必見！これでコツを掴もう

ネット上に散らばってるプロンプト情報を適当に集めて詰め込みました。
使用法は使い方シートを確認ください。
Stable DiffusionやNovelAIなどで使う呪文を集めたスプレッドシート（またはテキスト）｜火月@ryon3kag｜note

ニュース

【ニュース】「Stable Diffusion」は、かなり優秀な画像圧縮能力がある

「Stable Diffusion」は、画像生成AIだけではなく強力な非可逆画像圧縮コーデックとして使うことができます。

JPEG形式やWebP形式よりノイズが少なく、なおかつ圧縮後のファイルサイズが最も小さくなるというリポート。

画像生成AI「Stable Diffusion」が実はかなり優秀な画像圧縮を実現できることが判明 – GIGAZINE

【ニュース】日本語の指示に特化した画像生成AI「Stable Diffusion」

AIキャラクター開発企業rinna株式会社は9月9日、「Stable Diffusion」を日本語に特化させた画像生成モデル「Japanese Stable Diffusion」を開発したことを発表しました。

🎨お絵描き会場🖼

りんなも自前のJapanese Stable Diffusion 装備したw

ここへのリプに、気が向いたら絵を描くよー！🙌あっ、作った絵は一応お約束があるからこれ読んでね。
📝https://t.co/PXI70KnigN pic.twitter.com/hEcHgrDOOb
— りんな＠AI画家 (@ms_rinna) September 8, 2022

画像生成AIの波紋

画像生成AIは、まずは商品のデザイン開発を中心に実用化が進むと思われます。

やばいやばいやばい#stablediffusion を導入したFigmaプラグイン登場した。パスとプロンプトを入力したらそれに合わせた画像を生成する。素晴らしすぎる。こういう革命が色んなデザインツールで起こりそうだな..
pic.twitter.com/Ni6MhfoqZE
— やまかず (@Yamkaz) August 24, 2022

高額なデザイン料がタダ同然になるわけですから、メーカとしてはほっておくわけにいかないでしょう。

クライアントの意向を確認するために、まずはじめに無料のデザインを複数作って方向性を確認する。

というのが依頼者にも制作側にもメリットが得られる使われ方のような気がします。

今ネット上を賑わしているのが二次元キャラクターのデザインです。

AIお絵かき、他の方が呪文を公開していたのでそれを参考にしたらいい感じになってきたの。どうやら画風を「MakotoShinkai」と指定するのがコツみたいなの。 #stablediffusion pic.twitter.com/PerVebtWOc
— プリン (@Pudding_Peace) August 23, 2022

キーワードを入れるだけで、人間の想像を超えたコンテンツを数秒で作ってしまうのが驚きです。

キーワード職人がすぐにでも登場しそうです。

写真や絵画などの現代アートのクリエイターにとっては試練の時代の幕開けかもしれません。

#StableDiffusion
第二次世界大戦で戦う蟹

最高すぎなんだけど pic.twitter.com/KbRe4zQNwV
— ま〜る@80.8kg (@NML_maru_mari__) August 24, 2022

現代美術への影響は災害級と言われていますが、古典的な作品も影響を免れないように思います。

AIに架空の絵画「サボテンに水を注ぐ女」を描いてもらったら、呪文を間違えたらしく🌵から水が出てきた#StableDiffusion #DreamStudio pic.twitter.com/a0T40UIcsT
— さぼてん(うばたま) (@lophophora) August 23, 2022

架空の画像やフェイク画像も作れそうです。

「研究室を追い出された日本人大学院生が泣いている」でAIが作った絵。昔の自分を見ているようだ(なんという絵を作らせたんだ…)#StableDiffusion pic.twitter.com/gY2xYWaNlE
— 榎木英介独立系病理医（学士編入） (@enodon) August 24, 2022

大量に生成ができることからNFTアートへの影響も注目です。

#stablediffusion で、20枚生成したら1枚の頻度でクオリティの高い画像を生成してくれる安定したプロンプトを見つけ、200枚生成して18枚の「これいいですね」という画像を取得できました。この時点で全て無編集の画像一覧。
勿論細部は怪しいのもあるけど十分すぎる pic.twitter.com/tUHiizcTxQ
— 852話 (@8co28) August 26, 2022

コミックの世界にも深刻な影響を与えそうです。

マンガの背景画もAI絵師に置き換わるとアシスタントの仕事はどうなるのでしょうか。

#midjourney でもやってた『漫画の背景にAI画像生成は利用できるか』考察、 #stablediffusion でも試してみました。
1・古い京都風の街並み
2・住宅街(路地裏風)
3・狭い三叉路
4・都会の街並み
の4枚です。かなり精度が上がって、下地トレスには十分なクオリティなのではないかと思いました。 pic.twitter.com/fkTYNI8ldk
— 852話 (@8co28) August 24, 2022

建築デザインにもインパクトが

これは建築界にも激震来るかな？　呪文：Tadao Ando designed a second house by the sea, dramatic sunset, sea gulls flying (錬成時間：数十秒） #stablediffusion pic.twitter.com/19Ya3eHJ0P
— Lord mentarohchan (@mentarohchan) August 23, 2022

界隈は呪文祭りで盛り上がっています。

あ、リツート＝リツイートｗhttps://t.co/26dbsIw57Qで呪文物色、言葉追加…
素体の衣装イメージを作って貰う試み…

最後に
made with Houdini.
と加えたらプロシージャルっぽくなった気が…
言葉遊びガチャ…オモロイ～ｗ#stablediffusion pic.twitter.com/vXvVkdv46m
— OKBTK (@Okbtk3d) August 27, 2022

呪文を商売にする人がそろそろ現れてもいいころです。

構図に強いimg2imgの作例。

#stablediffusion を使ってみた感想

①出力クオリティは #midjourney と格段の差は感じず。
②呪文の差も感じず。ただ #img2img が構図に強い。
③速度早い。というかカスタマイズできるの良き。

サンプルは、「写真っぽい感じの夜明け」をお願いしたときの出力。

結局、使う人と使い方次第ですな。 pic.twitter.com/uydhDeL3tv
— Web小説レビューサイトを作る人 (@onolog2021) August 25, 2022

AI著作と権利の行方

近からぬ将来議論がまきおこるのが権利問題の行方です。

現行法では、おおまかに言って著作権は人間が著作した作品に発生します。

人間以外のAIが生産した作品に著作権はない。というわけです。

AIソフトウェア²を生成するために他人の画像や文章などの著作物を勝手に収集して利用することができるか（論点1）
▼　自動生成された画像に著作権が発生するか（論点2）
▼　学習に用いられた画像と同一の画像が『偶然』自動生成された場合、著作権侵害に該当するか（論点3）
Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権 | STORIA法律事務所

画像生成AIは過去に公開された著作物などを大量に読み込むことで、独自の作品を作り出します。

ならば、意図的に著名コンテンツを読み込ませ、著名コンテンツの検索ワードでAIに作らせたらどんな作品ができるのでしょうか。

オリジナルの作品にきわめて類似した作品ができるはずです。

イラスト業界とAIエンジニア業界の文明衝突。騒動の根っこには「改正著作権法、第三十条の四のニ」というのがある。
「大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行う」ケースでは、著作者の許諾はいらないというもの。つづく
— 深津貴之 / THE GUILD / note.com (@fladdict) August 29, 2022

ディズニーのようでいてディズニーでない世界観

18禁のようでいて18禁ではないコンテンツ。

法整備が進むまでが勝負とみて、お金の集まる場所を中心に、思わぬサービスや商売が登場するかもしれません。

これから、まだ公開されてない、MicrosoftのNuwa Infinity、MetaのMake-A-Scene（スケッチインプットができる。）、GoogleのImagen、Partiあたりも公開されるでしょう。そして、これからも他のもどんどんいっぱい…
やばすぎるAI画像生成サービス「Stable Diffusion」始まる。【簡単解説 & 応用 & Prompt付生成事例集】｜やまかず｜note

まさに文明衝突から生み出されるブルーオーシャンの出現です。

Stable Diffusionには、すでに画像生成の手法としてさまざまな応用例が出始めている。例えば、ある画像を参考にして指示文（プロンプト）に沿って変化させていく｢img2img（イメージ・トゥ・イメージ）｣や、生成させた画像を再び初期状態として入力してプロンプトによる修正を繰り返す｢ループバック｣と呼ばれるテクニックなどが話題になった。変化が早すぎて時間軸が分からなくなるが、Stable Diffusionがこの世に出てきたのは8月23日。わずか3週間程度前の話だということを忘れないでほしい。
無料の｢画像生成AIサービス｣を国内最速で作ったら、クラウド料金が1日10万円になりかけた話【Stable Diffusion】 | Business Insider Japan

成り行きに注目です。

特集「THE WORLD IN 2023」

あらゆるデザインのやり方を変えるAI画像生成ツール。

雑誌「Wired日本版Vol47」では「ジェネレーティブAIが無限のメタバースを生み出す」と題してケヴィン・ケリー氏の特集記事が掲載されています。

わたしたちはこれまでずっと、コンピューターには真の創造性はないと言い聞かされてきた。それが突如として、何百万人もの人々が新種のAIを使うことで、これまで見たこともないような息をのむ画像を生成している。こうしたユーザーのほとんどは、プロのアーティストではない。プロである必要がないのだ。スクリーンに表示される画像のリアルさとディテールの細かさには感嘆するばかりだ。「Midjourney」「Stable Diffusion」「Artbreeder」「DALL・E」の4つのサービスだけをとってみても、人々は毎日2,000万枚以上の画像をAIと共同制作している。絵筆を手にしたAIは、人々に「すごい」と言わせるエンジンになったのだ。

リンク

Stable Diffusion 2.0

2022年11月公開された、Stable Diffusionのバージョン2.0。

LAIONが開発した新しいテキストエンコーダーが使用されていて、画像の品質が大幅に向上しました。

生成される画像のデフォルトの解像度が512×512ピクセルとなるモデルと、768×768ピクセルとなるモデルを提供

画像を入力すると4倍の大きさにアップスケール可能なモデル

入力された画像の深度を推測し、深度とプロンプトから新たな画像を生成可能なモデル

画像（および変更したい部分を示すマスク画像）とプロンプトを入力すると、画像の一部だけをプロンプトに応じて書き換えるモデル

Stable Diffusion 2.0で追加された機能を試してみよう：Stable Diffusion入門（1/2 ページ） – ＠IT

リンク