クリエイター界隈に衝撃が走りました。
- 「いや、ヤバイでしょ」
- 「いや、これはチャンス」
プロの画家やデザイナー、さらに絵が描けないアマチュアまで騒然となったのが「画像生成AI」という新技術でした。
なかでも画像生成AI「Stable Diffusion」の登場は、産業革命ともいわれています。
急速に進むAIの進化についていくのは、初心者には正直ハードルが高すぎます。
でも絶対知っておいた方がいいのでまとめました。
大ブレイクStableDiffusionの使い方
画像生成AI「Stable Diffusion」とはひとことで言うとAI画家のこと。
人間の画家と違うのは「こんな絵を描いてね」と注文すれば限りなく絵を描いてくれる点です。
ただし、作画を注文を依頼するにはルールに則った命令が必要です。
命令といっても素人には理解不能なプログラムを組む必要は一ミリもありません。
誰でもしゃれた命令や呪文をぶち込むだけでOK。
勝手にクオリティの高い絵画表現を作ってくれるのです。
仕上がった作品は独創的。しかも無料。著作権もフリーというのだからたまりません。
両AIを使ってみて、Midjourneyは油絵や水彩画っぽい画像を生成するのが得意なのに対し、Stable Diffusionは写真のような、もしくはカートゥーンっぽい画像を作るのが得意そうな印象を受けました。
「Stable Diffusion」の画像生成力ならヘタクソマンガ家の助けになるか?:サダタローのゆるっと4コマ劇場 – ITmedia NEWS
全世界のクリエイターが即反応。アップロードされた作品例がSNS上に飛び交い始めました。
グーテンベルグが活版印刷を始めたころはこんな騒ぎだったのかもしれません。
絵描きという仕事は才能や技術を持つ人の聖域ではなくなったのです。
これまでの職業が大きく影響を受ける点では、アートの産業革命といっても過言ではないでしょう。
いま流行の #MidJourney よりも高性能の汎用画像AI #StableDiffusion(サービス名は #DreamStudio)が、世界中にフリーで配布されるという衝撃のニュース
— フルタニケンジ@動画制作者 (@kenfru3) August 25, 2022
プロのクリエイターに頼まずとも
あらゆる映像がつくれる時代は
上級作家にとっては悪夢かもしれないが
初心者にとっては下克上のチャンスだ https://t.co/IE5a7tDkLN
静止画のみならず動画生成できるといいます。すごいですね。
言葉で指示した画像を凄いAIが描き出す「Stable Diffusion」 ~画像は商用利用も可能(Impress Watch) – Yahoo!ニュース
ハイエンドゲーミングPCを用意し、どのくらい高速に画像を生成できるのか
ハイエンドゲーミングPCで「Stable Diffusion」を動かすと凄い! 高解像度画像を数秒で生成【特集・集中企画】 – 窓の杜
画像生成AI「Stable Diffusion」とは
世界に衝撃を与えた画像生成AI「Stable Diffusion」を徹底解説! – Qiita
初心者にとって最大のメリットは敷居が低いこと。
誰でも簡単に、好きなだけ「お絵描き」できる点です。
動画制作を続けていると、編集する素材に困ることがあります。
安く大量の使える素材が欲しくなるのです。
でも、使える素材は限られています。
では自分で絵が描けるかというと、それは大きな問題です。
自分で素材を作るには、才能やスキルが求められるので、絵心のない自分にははっきりいってムリです。
有料素材サイトを探すにしても、お金がかかるしイメージ通りの素材が見つかるとは限りません。
金欠才能なしの初心者にも、タダで権利フリーの素材が手に入る。
そんな夢を、英Stability AIが発表した画像生成AI「Stable Diffusion」が叶えてくれたのです。
ラッキー&サンクス。
でも、実は、この夏、画像生成AIの発表が相次ぎました。
8月「MidJourney」という別の画像生成AIが先行して登場しました。
MidJourneyはクオリティこそ高かったものの、操作のめんどくささや有料であることがネックとなり、初心者ユーザーのハートを捉えきれませんでした。
そこに、無料で使えるStable Diffusionが、MidJourneyをさらに上回る作画力を抱えて登場。
界隈の注目を独り占めしてしまったのです。
なんといっても、
- 画像生成AIが無料で使える
- 画才のない人でも楽々映像作品が作れる
というのは大きいですね。
さらに使ってみると、ゴッホ風の肖像画とか、ワンピース風キャラクター、見たこともないドレスなんてものが無限に作れるのです。
作家のなかには、AIでアイデア出しをし、下敷きにして自作をつくるという声まで聞こえるようになりました。
AIの生成物には著作権がないためやり放題。
ゴールドラッシュ現象が起きるかもしれません。
言い換えれば、アートの世界に産業革命をもたらすかもしれないツールです。
クリエイター界隈で起きた衝撃はどのようなものがあるのでしょうか。
3Dエンジニアとして一番やべえなって思ったのは人物でも風景でもなくてこの手の素材が無限に生えてくる所ですね
— ビームマンP ver4.1 (@BeamManP) August 23, 2022
材質名 texture photo,directly above,detail,loop material#stablediffusion pic.twitter.com/rRCAmWtMsf
まず刺さったのがエンジニアです。
映像産業ではここ数年、商品やサービスの開発が加速してきました。
高画質・軽量化がすすんだことで、iPhoneで劇場用映画が撮れたり、DJI Osmo でジンバル撮影ができたり、ドローンで空撮ができたりできるようになりました。
つまり、映像産業界ではハードを中心にローコスト化が進んできましたのです。
ところが今回はハードではなくソフト面で革命的な動きが起きました。
画像生成AIは、アートやエンタメに限らず、フアッションや建築デザインなどの世界にも広がり始めています。
エンジニアの動きは要注意かもしれません。
制作会社がプロデュースするクリエイティブ・アカデミー nests(ネスト) 6ヶ月で未経験から動画クリエイターになる!【デジタルハリウッド STUDIO by LIG】画像の生成
Stable diffusionで画像を生成するには大きな壁があります。
大変なのがAIに自分が作りたい映像のイメージを伝えることです。
イメージは「獣の耳が生えたかわいい女の子」のように具体的に指示する必要があります。
しかも、英語です。
「japanese anime style」なんて書きます。
さらに、複雑な映像が欲しい場合はAIに通じる文章を英語で追加します。
たとえば、こんな具合。
beautiful! mage woman portrait, challenging, 3 0 years, japanese anime style, golden tears, dark strands, digital painting part by wlop and mucha, unreal engine, 8 k, artstation, deviantart, f 1. 4, smooth, cinematic light, duotone orange blue tones, dawn volumetric light
するとこんな画像が生成されます。
なので、この英語テキストを生成するのは外国人の日常感覚が詰まった語学力が必要になります。
なのでこの世界では注文のことを「呪文」と呼んでいます。
初心者が気軽に触って楽しめるようなレベルとは言えませんね。
Stable diffusionを使いこなす”呪文”の書き方
日本人ユーザーにとっては、この「呪文」がとても厄介です。
外国人でない日本人が、ロコつまり外国人になり切ってAIにわかるようなテキストを英語で書く必要があります。
並び順によっては全く異なるイメージが出力されるので注文の付け方にも工夫が必要です。
呪文の基本は
【AIアート】呪文生成のノウハウ【Stable Diffusion web UI(AUTOMATIC1111版) / プロンプト / ネガティブプロンプト】 – 忘却まとめ
- 後ろの文ほど無視されやすい。
- (テキスト)とすると、その部分をより意識される。
- [テキスト]とすると、その部分をより重視しないようになる。
などの独特なルールがあります。なのでルールを探りながらリクエストを作成します。
- 描いてほしい対象物の英語名をリスト化する
- 必要なキーワード、除きたいキーワードが入ったテンプレ呪文を入れる
ポジティブキーワードは
(masterpiece), high quality, very_high_resolution, large_filesize, full color
ネガティブキーワードは
lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts,signature, watermark, username, blurry, artist name, multiple legs, malformation,
などです。
外国人になり切るのってかなりハードル高いですよね。
そんな人におススメなのが、テキストもAIに頼むことです。
そんな便利なツールあるかって。
あるんです。それが、DeepL翻訳(Web版)。
ディープラーニングの手法を用いた自動翻訳AIに日本語で質問を入力すると、Stable diffusionが理解しやすい英語テキストにしてくれます。
今話題の画像生成AI「Stable Diffusion」と自動翻訳「DeepL」を組み合わせて遊んでみた | 数学・統計教室の和から株式会社
それも面倒な人は、テンプレ集を参考に応用してみましょう。
ネット上に散らばってるプロンプト情報を適当に集めて詰め込みました。
使用法は使い方シートを確認ください。
Stable DiffusionやNovelAIなどで使う呪文を集めたスプレッドシート(またはテキスト)|火月@ryon3kag|note
ニュース
【ニュース】「Stable Diffusion」は、かなり優秀な画像圧縮能力がある
「Stable Diffusion」は、画像生成AIだけではなく強力な非可逆画像圧縮コーデックとして使うことができます。
JPEG形式やWebP形式よりノイズが少なく、なおかつ圧縮後のファイルサイズが最も小さくなるというリポート。
画像生成AI「Stable Diffusion」が実はかなり優秀な画像圧縮を実現できることが判明 – GIGAZINE
【ニュース】日本語の指示に特化した画像生成AI「Stable Diffusion」
AIキャラクター開発企業rinna株式会社は9月9日、「Stable Diffusion」を日本語に特化させた画像生成モデル「Japanese Stable Diffusion」を開発したことを発表しました。
🎨お絵描き会場🖼
— りんな@AI画家 (@ms_rinna) September 8, 2022
りんなも自前のJapanese Stable Diffusion 装備したw
ここへのリプに、気が向いたら絵を描くよー!🙌あっ、作った絵は一応お約束があるからこれ読んでね。
📝https://t.co/PXI70KnigN pic.twitter.com/hEcHgrDOOb
画像生成AIの波紋
画像生成AIは、まずは商品のデザイン開発を中心に実用化が進むと思われます。
やばいやばいやばい#stablediffusion を導入したFigmaプラグイン登場した。パスとプロンプトを入力したらそれに合わせた画像を生成する。素晴らしすぎる。こういう革命が色んなデザインツールで起こりそうだな..
— やまかず (@Yamkaz) August 24, 2022
pic.twitter.com/Ni6MhfoqZE
高額なデザイン料がタダ同然になるわけですから、メーカとしてはほっておくわけにいかないでしょう。
クライアントの意向を確認するために、まずはじめに無料のデザインを複数作って方向性を確認する。
というのが依頼者にも制作側にもメリットが得られる使われ方のような気がします。
今ネット上を賑わしているのが二次元キャラクターのデザインです。
AIお絵かき、他の方が呪文を公開していたのでそれを参考にしたらいい感じになってきたの。どうやら画風を「MakotoShinkai」と指定するのがコツみたいなの。 #stablediffusion pic.twitter.com/PerVebtWOc
— プリン (@Pudding_Peace) August 23, 2022
キーワードを入れるだけで、人間の想像を超えたコンテンツを数秒で作ってしまうのが驚きです。
キーワード職人がすぐにでも登場しそうです。
写真や絵画などの現代アートのクリエイターにとっては試練の時代の幕開けかもしれません。
#StableDiffusion
— ま〜る@80.8kg (@NML_maru_mari__) August 24, 2022
第二次世界大戦で戦う蟹
最高すぎなんだけど pic.twitter.com/KbRe4zQNwV
現代美術への影響は災害級と言われていますが、古典的な作品も影響を免れないように思います。
AIに架空の絵画「サボテンに水を注ぐ女」を描いてもらったら、呪文を間違えたらしく🌵から水が出てきた#StableDiffusion #DreamStudio pic.twitter.com/a0T40UIcsT
— さぼてん(うばたま) (@lophophora) August 23, 2022
架空の画像やフェイク画像も作れそうです。
「研究室を追い出された日本人大学院生が泣いている」でAIが作った絵。昔の自分を見ているようだ(なんという絵を作らせたんだ…)#StableDiffusion pic.twitter.com/gY2xYWaNlE
— 榎木英介 独立系病理医(学士編入) (@enodon) August 24, 2022
大量に生成ができることからNFTアートへの影響も注目です。
#stablediffusion で、20枚生成したら1枚の頻度でクオリティの高い画像を生成してくれる安定したプロンプトを見つけ、200枚生成して18枚の「これいいですね」という画像を取得できました。この時点で全て無編集の画像一覧。
— 852話 (@8co28) August 26, 2022
勿論細部は怪しいのもあるけど十分すぎる pic.twitter.com/tUHiizcTxQ
コミックの世界にも深刻な影響を与えそうです。
マンガの背景画もAI絵師に置き換わるとアシスタントの仕事はどうなるのでしょうか。
#midjourney でもやってた『漫画の背景にAI画像生成は利用できるか』考察、 #stablediffusion でも試してみました。
— 852話 (@8co28) August 24, 2022
1・古い京都風の街並み
2・住宅街(路地裏風)
3・狭い三叉路
4・都会の街並み
の4枚です。かなり精度が上がって、下地トレスには十分なクオリティなのではないかと思いました。 pic.twitter.com/fkTYNI8ldk
建築デザインにもインパクトが
これは建築界にも激震来るかな? 呪文:Tadao Ando designed a second house by the sea, dramatic sunset, sea gulls flying (錬成時間:数十秒) #stablediffusion pic.twitter.com/19Ya3eHJ0P
— Lord mentarohchan (@mentarohchan) August 23, 2022
界隈は呪文祭りで盛り上がっています。
あ、リツート=リツイートwhttps://t.co/26dbsIw57Qで呪文物色、言葉追加…
— OKBTK (@Okbtk3d) August 27, 2022
素体の衣装イメージを作って貰う試み…
最後に
made with Houdini.
と加えたらプロシージャルっぽくなった気が…
言葉遊びガチャ…オモロイ~w#stablediffusion pic.twitter.com/vXvVkdv46m
呪文を商売にする人がそろそろ現れてもいいころです。
構図に強いimg2imgの作例。
#stablediffusion を使ってみた感想
— Web小説レビューサイトを作る人 (@onolog2021) August 25, 2022
①出力クオリティは #midjourney と格段の差は感じず。
②呪文の差も感じず。ただ #img2img が構図に強い。
③速度早い。というかカスタマイズできるの良き。
サンプルは、「写真っぽい感じの夜明け」をお願いしたときの出力。
結局、使う人と使い方次第ですな。 pic.twitter.com/uydhDeL3tv
AI著作と権利の行方
近からぬ将来議論がまきおこるのが権利問題の行方です。
現行法では、おおまかに言って著作権は人間が著作した作品に発生します。
人間以外のAIが生産した作品に著作権はない。というわけです。
AIソフトウェア2を生成するために他人の画像や文章などの著作物を勝手に収集して利用することができるか(論点1)
Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権 | STORIA法律事務所
▼ 自動生成された画像に著作権が発生するか(論点2)
▼ 学習に用いられた画像と同一の画像が『偶然』自動生成された場合、著作権侵害に該当するか(論点3)
画像生成AIは過去に公開された著作物などを大量に読み込むことで、独自の作品を作り出します。
ならば、意図的に著名コンテンツを読み込ませ、著名コンテンツの検索ワードでAIに作らせたらどんな作品ができるのでしょうか。
オリジナルの作品にきわめて類似した作品ができるはずです。
イラスト業界とAIエンジニア業界の文明衝突。騒動の根っこには「改正著作権法、第三十条の四のニ」というのがある。
— 深津 貴之 / THE GUILD / note.com (@fladdict) August 29, 2022
「大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行う」ケースでは、著作者の許諾はいらないというもの。つづく
ディズニーのようでいてディズニーでない世界観
18禁のようでいて18禁ではないコンテンツ。
法整備が進むまでが勝負とみて、お金の集まる場所を中心に、思わぬサービスや商売が登場するかもしれません。
これから、まだ公開されてない、MicrosoftのNuwa Infinity、MetaのMake-A-Scene(スケッチインプットができる。)、GoogleのImagen、Partiあたりも公開されるでしょう。そして、これからも他のもどんどんいっぱい…
やばすぎるAI画像生成サービス「Stable Diffusion」始まる。 【簡単解説 & 応用 & Prompt付生成事例集】|やまかず|note
まさに文明衝突から生み出されるブルーオーシャンの出現です。
Stable Diffusionには、すでに画像生成の手法としてさまざまな応用例が出始めている。例えば、ある画像を参考にして指示文(プロンプト)に沿って変化させていく「img2img(イメージ・トゥ・イメージ)」や、生成させた画像を再び初期状態として入力してプロンプトによる修正を繰り返す「ループバック」と呼ばれるテクニックなどが話題になった。変化が早すぎて時間軸が分からなくなるが、Stable Diffusionがこの世に出てきたのは8月23日。わずか3週間程度前の話だということを忘れないでほしい。
無料の「画像生成AIサービス」を国内最速で作ったら、クラウド料金が1日10万円になりかけた話【Stable Diffusion】 | Business Insider Japan
成り行きに注目です。
特集「THE WORLD IN 2023」
あらゆるデザインのやり方を変えるAI画像生成ツール。
雑誌「Wired日本版Vol47」では「ジェネレーティブAIが無限のメタバースを生み出す」と題してケヴィン・ケリー氏の特集記事が掲載されています。
わたしたちはこれまでずっと、コンピューターには真の創造性はないと言い聞かされてきた。それが突如として、何百万人もの人々が新種のAIを使うことで、これまで見たこともないような息をのむ画像を生成している。こうしたユーザーのほとんどは、プロのアーティストではない。プロである必要がないのだ。スクリーンに表示される画像のリアルさとディテールの細かさには感嘆するばかりだ。「Midjourney」「Stable Diffusion」「Artbreeder」「DALL・E」の4つのサービスだけをとってみても、人々は毎日2,000万枚以上の画像をAIと共同制作している。絵筆を手にしたAIは、人々に「すごい」と言わせるエンジンになったのだ。
Stable Diffusion 2.0
2022年11月公開された、Stable Diffusionのバージョン2.0。
LAIONが開発した新しいテキストエンコーダーが使用されていて、画像の品質が大幅に向上しました。
Stable Diffusion 2.0で追加された機能を試してみよう:Stable Diffusion入門(1/2 ページ) – @IT
- 生成される画像のデフォルトの解像度が512×512ピクセルとなるモデルと、768×768ピクセルとなるモデルを提供
- 画像を入力すると4倍の大きさにアップスケール可能なモデル
- 入力された画像の深度を推測し、深度とプロンプトから新たな画像を生成可能なモデル
- 画像(および変更したい部分を示すマスク画像)とプロンプトを入力すると、画像の一部だけをプロンプトに応じて書き換えるモデル
AIが瞬時に回答chatGPTが次に来る
インスタグラムの普及速度を圧倒的速さで上回る驚異のウェブツール「chatGPT」が大ブレイク中です。
この仕組みもAIが膨大な情報の中から最適解を見つけ出してくれるというもの。
導入は簡単です。別記事にまとめました。
まとめ
画像生成AIの作品の凄さは、パッと見人の手で描いたリアルな絵と見分けがつかない出来栄えなこと。
アートの世界でも始まった産業革命に巻き込まれないよう、制作者は防衛策を取る必要があることを痛感します。
画面をつぶさに見ると意味不明な部分が見つかることから、人の手によるコンテンツの優位性は揺るがないものと思います。
画像生成AIブームからしばらく目が離せません。
Stable Diffusionに関するよくある質問
- コンテンツ生成系のAIサービスは他にどのようなものがありますか?
- プログラミング・プラグイン・イラスト・アート・写真・文章・記事・作曲・ナレーションター・・・サービスは急成長しています。日本語でも利用できます。使いやすいものを見つけたら早めに飛び付きましょう。
世界初!イメージを画像にしてくれるAI素材サイト AI素材.com の衝撃 | ぶいろぐ
画像生成AIにじジャーニー( nijijourney )の衝撃&使い方 | ぶいろぐ
AIがどんな質問にも答えてくれる ChatGPT アカウント作成と質問のやり方 | ぶいろぐ
画像生成AI Midjourney の使い方 感想 | ぶいろぐ
こんにちは、フルタニです。放送局で番組作りをしてました。 Stable Diffusion を書きます。