【中級者】パソコンでグラビアAI画像を作るテクニック | Stable Diffusion webUI AUTOMATIC1111

Stable Diffusion
フルタニ

こんにちは、フルタニです。放送局で番組作りをしてました。 Stable Diffusion を書きます。

2022年夏、クリエイター界隈に衝撃が走りました。

  • 「いや、ヤバイでしょ」
  • 「いや、これはチャンス」

プロの画家やデザイナー、さらに絵が描けないアマチュアまで騒然となった「画像生成AI」Stable Diffusion。

初心者向けにはgooglecolabで画像生成する方法もありますが、GoogleCokabには容量制限があります。

気にせず作り続けたいなら自分のPCに環境をつくる方法がお勧めです。

自分のPCに環境をつくるにはPython と呼ばれるシステムを扱う必要があります。

この記事ではローカル環境を使ってStable Diffusionを設定する手順と簡単な使い方をご紹介します。

Stable Diffusionの利用手順

まず、初心者向けのgooglecolabで画像生成する方法をサクッと説明します。

①初心者向け googlecolabで画像生成する方法

初心者向けには無料で、しかも手のかかる設定抜きで利用できるGoogleColab「を使う方法をおすすめします。

とりあえず検索ワードを入力して作画体験したい人はこちらのお試し版から体験できます。

「Stable Diffusion Demo」

GoogleColabでは、あらかじめ画像生成には必須のPythonが組み込まれているため何も考えずに生成できます。

画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ – GIGAZINE

[Stable Diffusion] AIでテキストから画像を生成する使い方を解説 [text2img] – TeDokology

\楽天ポイント4倍セール!/
楽天市場
\ポイント5%還元!/
Yahooショッピング

GoogleColabでは無料で使える容量が限られているため、モデルを使って凝った画像を生成するなどすると容量が足りなくなる場合があります。

Googleの有料サービスを利用したくない場合は、自分のPCつまりローカル環境に組み込む方法を選びましょう。

②自分のPCをグラビアAI画像生成工場にする方法

ローカル環境に組み込むには、Stable Diffusion webUI AUTOMATIC1111を使う方法があります。

ざっくりした流れは以下の手順です。

  • WindowsPCにSSDドライブを接続して専用のフォルダをつくる
  • 画像生成AI『Stable Diffusion webUI AUTOMATIC1111』(ローカル版)をダウンロード【詳細は下記参照】
  • Python 3.10.6のインストール【詳細は下記参照】
  • gitのインストール【詳細は下記参照】
  • モデルの入手とインストール【詳細は下記参照】
  • 以上の段取りが済んだら、SSDドライブの「webui-user.bat」を起動
  • URLからStable Diffusion webUI AUTOMATIC1111を起動する
「webui-user.bat」からWindowsCMDを立ち上げた画面

CMDが起動すると、しばらくしてローカルURLが表示されるので、コピーしてブラウザに貼り付けることでStable Diffusion webUI AUTOMATIC1111が起動する。

プロンプトを入力することでイラストや写真のような画像が生成できるようになります。

Stable Diffusion webUI AUTOMATIC1111 とは

まず必要なものからご案内します。

Stable diffusionをゼロから設定するのは大変です。その手間を省くため開発されたのがStable Diffusion webUI AUTOMATIC1111です。

これは、Stable Diffusion の作者といわれるAutomatic1111さんが公開したサービスです。

webUI とは業界用語。「リッチなWebユーザーインターフェース」とよばれているStable Diffusion の操作ツールです。

Automatic1111を使うことで、Stable diffusionを初心者でも手軽に様々な機能を利用することができます。

ダウンロードからインストールまでは下記の流れです。

『Stable Diffusion webUI AUTOMATIC1111』(ローカル版)をダウンロード手順
・AI関連コミュニティサイト「Hugging Face」を開く
・同サイトに公開されているStable Diffusionのページにアクセス
・アカウントを取得
・再度Stable Diffusionのページにアクセスして「Hugging Face」のトークンを発行
Colaboratory へようこそ – Colaboratoryにアクセスし、画面右上の「ログイン」をクリック
・ログインに用いるGoogleアカウントを選択
・パスワードを入力してColaboratoryにログイン
・「ノートブックを新規作成」をクリック
・ハードウェアアクセラレータの欄で「GPU」を選択して保存
・ノートブック内にStable Diffusionをインストール
・コマンドからHugging Faceで発行したトークンを置き換えて実行するなど手続きを行う
・緑色のチェックマークが表示されれば、Stable Diffusionを使う準備は完了

使うのはWindowsPCとWindows10以降のOS、それにハイスペックのグラフィックボードです。

Macでも使えますが、Windowsベースで開発されたツールの数などからWindowsが使いやすいでしょう。

グラフィックボード(GPU)は作業時間に大きくかかわります。Stable diffusionを使うにはNvidiaが推奨されています。 

GPUのメモリは最低限4GBが必要です。学習機能を利用するには12GBは欲しいところです。動画編集でもグラボ次第で作業時間は大きく影響を受けるので予算に余裕があればグラボはケチらないようにしましょう。

グラフィックボードは動画編集の作業効率向上に大きく影響するので、見直しを考えているのであれば過去記事↓を参考にしてください。

グラフィックボード

ストレージはSSD推奨です。空き容量は最低30GBは必要です。

Stable diffusionで画像生成する場合、拡張子を表示しておくとファイルの識別がたやすくなるので表示設定にしておきましょう。

必要なプログラム

Stable Diffusion webUI AUTOMATIC1111の設定には三つのプログラムが必要です。

イラストに特化した画像とか、日本人の画像などのように自分が作りたいイメージの画像を作るには別途モデルと呼ばれる学習済みファイルも必要です。

  • 画像生成AI『Stable Diffusion webUI AUTOMATIC1111』(ローカル版)
  • Python 3.10.6のインストール
  • gitのインストール
  • モデルの入手とインストール

自分の好みの顔やポーズを絞り込むにはLoRAと呼ばれる学習ファイルも別途必要になります。オプション機能のようなものです。

どれひとつかけても目指す画像生成はできないので注意しましょう。

順を追って説明します。

インストール前の準備

Stable Diffusion webUI AUTOMATIC1111は自分のPCの中にプログラムを置いて、クラウド上のAIに画像生成を命じ、結果となる画像をPC上で生成するというものです。

そのためPCにSSDを増設し、このSSDを「Stable Diffusion webUI AUTOMATIC1111」、言い換えればAI画像生成専用として使います。

フォーマットしたあと、新規フォルダを作成し、英文で任意の名前をつけましょう。

ここでは「Stable Diffusion」とします。

続いてプログラムを入手しましょう。

モデル以外のプログラムは三つともAUTOMATIC1111氏のサイトに用意されています。

GitHub – AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI

サイトを開いてプログラムをダウンロードしましょう。

ダウンロードするファイルはページを下にスクロールすると見つかります。

Automatic Installation on Windowsに

  1. Python
  2. git
  3. stable=diffusion

以上のダウンロードリンクが並んでいます。

Stable Diffusion webUI AUTOMATIC1111はフォルダ構造ごと丸コピーする必要があるので、まずPython とgitという二つのプログラムをインストールします。

Python Releases for Windows | Python.org

Python をダウンロードします。

Pythonは1991年に開発されたスクリプト言語です。数値計算能力と連携可能なシステムが多いことから、人工知能や機械学習の開発に引っ張りだこになっています。

インストールに際して守ってほしい注意点が三つあります。

  • Python 3.10.6(64-bit)を選択すること
  • ファイルやフォルダ名などは英文で綴ること
  • “Add Python to PATH”にチェック入れること
“Add Python to PATH”にチェック入れる

“Add Python to PATH”にチェック入れることでフォルダ指定の手間を省くことができます。

次にgitをダウンロードします

Git – Downloading Package

Gitとは、分散型バージョン管理システムです。

ファイルのバージョン管理が簡単にできるツールで、何か不具合が起きたときに元のバージョンに戻したりするなど開発者必須のツールです。

このページの上にある「Click here to download」をクリックするとダウンロードができます。

インストール中に説明書きがたくさん出てきますが、基本そのままOKを押して先に進みます。

Python とGitのダウンロードファイルを開いてインストールが済んだら、

Stable Diffusionのインストールをおこないます。

Stable Diffusionのインストール

冒頭に述べたように、Stable Diffusionはフォルダ構造ごとコピーします。インストーラーがないため手動でのコピーです。

フォルダを構造ごと丸コピーするのは大変な手間です。なのでWindowsに備わっているコマンドプロンプトのコピー機能を使って行います。

まずSSDドライブに作った「Stable Diffusion」のフォルダの空欄にCMDと入力してEnterを押します。

すると、「Stable Diffusion」のフォルダの位置でコマンドプロンプトが開きます。そのまま開いておきます。

AUTOMATIC1111さんのページを開きます。(Python とgitをダウンロードしたページです)

GitHub – AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI

画面をスクロールダウンするとAutomatic Installation on Windowsという項目が現れます。(2023.04時点)

git clone ~ .git までをコピーして

開いておいたフォルダにペーストしエンターを押します。

するとAUTOMATIC1111がフォルダごと新しく作ったフォルダ内にクローンコピーされます。

コマンドプロンプトでDone と表示されたらコピー完了。

exitと入力してエンターを押すと完了です。

モデルを導入する

「Stable Diffusion」で画像生成を行うためには、最低一つのモデルを入力する必要があります。

「モデル」とは、AIが学習してきた知識の塊というべきもので、このモデルの中に過去に学んだ画像の情報が含まれています。
このモデル選びもとても重要で、イラストが得意なモデルもあれば、実写のようなリアルな画像を得意とするモデルもあります。
各エンジンによりモデルも異なりますので、求める分野のモデルを探す必要があります。
画像生成AIの流れをみてみよう(stable diffusion) | Vook(ヴック)

モデルを作る絵師と呼ばれる人たちは増えています。

イラストに特化した作品や、実写に力を入れた作品などさまざまです。

絵師たちは自作に使ったモデルを盛んにアップロードしています。

気に入ったものを選んで使わせてもらいましょう。

公開されているモデルを開くと、使用したファイルが公開されています。

その中で拡張子が「.ckpt」もしくは「.safetensors」とあるのがモデルです。

容量が数GBあるのでディスクの空き容量を確認しながらダウンロードします。

下方向の矢印マークをクリックするとダウンロードできます。

ダウンロードしたファイルは解凍せずに「Stable Diffusion」SSDの中に作られた[Stable-diffusion-webui]というフォルダの[models]の中の[Stable Diffusion]にドラッグ&ドロップします。

これで画像生成の最終準備が完了しました。あとは命令するだけです。

Stable Diffusionを起動する

Stable Diffusion webUI AUTOMATIC1111の起動の仕方には癖があります。

アイコンをクリックして起動するのではありません。

使うのはバッチファイルです。

「Stable Diffusion」SSDの中にある「webui-user.bat」を表示します。

このwebui-user.batをダブルクリックするとコマンドプロンプト画面が開きプログラムが起動します。

プログラムが起動するまでには一時間かかることもあるので、途中しばらく止まったように見える時もありますが、グッと我慢して待ちます。

「To create a public link 〜」の表示がでたら準備完了です。

実はこれだけではありません。起動にはもうひと手間かかります。

画面を閉じずにその行の上にあるリンク「http:127.0.0.1:7860」をctrl+cコピーします。

コマンドプロンプト画面は閉じずにそのままキープしながら、ブラウザにctrl+vでペーストします。

エンターを押すとようやく、クラウド上のAIにつながりWebUIの操作画面が立ち上がります。

以上の画面が表示されたら準備完了です。

こうした手間を避けるには、ブラウザ上の画面をお気に入りなどに登録しておきましょう。

なお、この画面は「webui-user.bat」を終了するとアクセスできなくなります。

再起動する際はwebui-user.batから始めてください。

画像生成する

Stable Diffusion webUI AUTOMATIC1111で画像生成する前に、使用するモデルの確認を行います。

画面左上にある「Stable Diffusion chkpoint」から確認できます。

その下にあるのが現在使用中のモデルになります。

画面上部にtx2imgなどのタブで囲われたの二つの大きな入力枠があります。

上の入力枠がプロンプト枠。下の枠がネガティブプロンプト入力枠です。

二つの違いは、こんな絵が欲しい、こんな絵は嫌だと思ってください。

何かひとつ英文で指示をします。例えばgirlなど。

入力が終わったら右にある「generate」ボタンを押します。

すると作業が始まり、下の枠に画像が生成されます。

画像の生成できたらStable Diffusion webUI AUTOMATIC1111インストールは成功です。(お疲れ様でした)

AIに任意の画像を生成させる

次に任意の画像をAIに生成させましょう。

tx2imgの枠の中に画像生成したい任意のイメージを英語で入力します。

txt2imgとはテキストtoイメージの略。

文字から画像をつくるという意味です。

右にある「generate」ボタンを押します。

下の画面に指示通りの画像が生成されたら成功です。

生成された画像は失敗作のように見えるかもしれませんが、それはAIに対する注文次第で成功作にすることができます。

プロが作った画像を開くとプロンプトと呼ばれる指示文書が緻密に書かれていることがわかります。

ネガティブプロンプトも含め、二つのプロンプトをそれぞれコピーして生成ボタンを押してみましょう。

プロンプト画面が書き換わりしばらくして画像が生成されます。

気に入った画像が生成されるまでコマンドを変えたり数値を変えたりしながら生成を繰り返しましょう。

迷ったら先人のアドバイスに耳を傾けましょう。

高画質な美女画像の作り方|Stmic | AIGirl_Photo|note

著:今村 勇輔
¥2,420 (2024/11/29 17:05時点 | Amazon調べ)
\楽天ポイント4倍セール!/
楽天市場
\ポイント5%還元!/
Yahooショッピング

LoRaについて

Stable Diffusionなどの画像生成AIが作り出す画像はガチャみたいなもので、毎回変わります。そのため、こんなキャラクターやデザインの画像を決めうちでつくるのは基本不可能です。

好みの顔やポーズだけを画像生成したい時はControllNetのようなツールがありますが、もっと手軽に悩みを解決したい時、便利なのがLoRAです。

オプション機能ともいうべき機能は別記事にまとめました。

チュートリアル動画+参考サイト

Code Wizardry | 魔法のようなジェネレーティブAIの世界

Stable Diffusionを使ったサービス

まとめ

イラストや写真のような静止画をローカル環境でつくる

Stable Diffusion webUI AUTOMATIC1111の使い方をまとめました。

  • WindowsPCにSSDドライブを接続して専用のフォルダをつくる
  • 画像生成AI『Stable Diffusion webUI AUTOMATIC1111』(ローカル版)をダウンロード
  • Python 3.10.6のインストール
  • gitのインストール
  • モデルの入手とインストール
  • 以上の段取りが済んだら、SSDドライブの「webui-user.bat」からStable Diffusion webUI AUTOMATIC1111を起動する

起動したStable Diffusion webUI AUTOMATIC1111でイラストや写真のような画像が生成できるようになります

ここまでわかればあとはお手本とプロンプト次第。

いいお手本が手に入ればプロンプトの綴り方次第でAI画像を生成することができます。

Stable Diffusion webUI AUTOMATIC1111に関する良くある質問

異なる顔を生成する方法をまとめました

生成画像をGoogle Driveに保存する方法をまとめました

Stable Diffusion WebUIの終了方法
起動中開いたままになっていたwebui-user.batの黒い画面と、ブラウザのWebUIのタブを閉じれば終了です。
Stable Diffusion WebUIの更新方法
「stable-diffusion-webui」のフォルダを開き、空いているところで右クリックして「Git bash here」を押す「git pull」と入力してEnterを押すと更新完了します。
Stable Diffusion WebUIでいい絵を描くにはチャレンジの回数を増やすのが王道です。PDCAを繰り返すことで、一番重要な指示テキスト(プロンプト)や除外テキスト(ネガティブプロンプト)の適正な言葉を見つけることができます。