【初めてのStable Diffusion 】まずは使ってみたい超ビギナーのための第一歩

Stable Diffusionとは
Stable Diffusion作例サンプル
まずは、デモ版でお試し
Stable Diffusion　その他のバージョン
ローカルで作業環境を構築する方法
Stable Diffusionでさらにイメージ通りの画像を生成するためのテクニック

Stable Diffusionとは

英Stability AIが発表した画像生成AIソフト、Stable Diffusionが話題になっています。Stable Diffusionとは、イメージ通りの画像を生成するための指示文prompt(プロンプト：「呪文」という言い方もされます)を入力することによって、AIが画像を作成するソフトです。発表から数日でローカルでの作業環境構築に関する記事、様々なプロンプトサンプルなどの記事が多く公開されて早くも話題になっています。

ただし、自分のPC等ローカルで作業できるようにするには、入門レベルの記事でもPython動作環境の構築が必要だったりと、筆者のようにプログラミング経験のない人にとっては少しハードルが高いものもあるようです。ここでは、「難しいことはさておき、まずは試してみたい！」という人向けに記事を作成しましたので、よかったら参考にしてみてください。

Stable Diffusion作例サンプル

では実際にどのような画像が生成されるのか？、サンプルのプロンプトを少し加工して「A high tech airplane factory in the forest(森の中のハイテク飛行機工場)」と入力してみました。

※Stable Diffusionで作成した画像は、制作者が自由に使えるようです。(ただし当然著作権とは別に、法律に違反するコンテンツを共有したり、人に危害を加えたり、危害を意図した個人情報を流布したり、誤った情報を広めたりしてはいけません)

ちなみに、「Photographic portrait of beautiful women(美しい女性の肖像写真)」と入力してみると、

と出力されました。「Photographic portrait of beautiful Japanese women(美しい日本人女性の肖像写真)」とすると、、

確かに正しいのですが、もう少しイメージに近づけたくなってきます。

まずは、デモ版でお試し

ローカル環境で作業するための環境構築の記事も多くみられますが、色々難しいので、まずはとにかく色々触ってみたいという人には、以下のデモサイトで試していただくのもおすすめです。

Stable Diffusion 2-1 - a Hugging Face Space by stabilityai

Discover amazing ML apps made by the community

画面内の「Enter Your Prompt」にテキストを入力して、「Generate Image」のボタンを押すだけです。こちらでは英文のプロンプトのみ入力が可能で、そのプロンプトの作成の仕方にコツがあるようです。

まずは、サンプルプロンプトを少し変えて、「Huge concert stadium in the field with many people(多くの人で賑わうフィールドの巨大なコンサートスタジアム)」と入力してみました。

次は、「A boy illustration with a dog(犬を連れた男の子のイラスト)」と入力

もう少し楽しげなイラストにしたいので、「A boy illustration with a dog in the style of funny(犬を連れた男の子のイラストを面白いスタイルで)」と入力

と、このようにプロンプトの入力が生成結果に大きく影響を与えます。そこで、このプロンプトの作成方法やその仕組みについてとても詳しく書かれたのがこちらの記事です。

魔術として理解するお絵描きAI講座｜深津貴之 (fladdict)

やればやるほど呪術化する、AI画像錬成について。以下は、その道の専門家にはメッチャ怒られるかもしれない、雑なロジックと制御講座。いちおうメジャーなサービスでは、共通して動作するノウハウ（DALL-E2, MidJourney, Stab...

基本的には、「美術館や、写真サイト、画集のキャプションに近い文体」で、呪文プロンプトを作るのがよい。
AI錬成を古からしている上級魔術師の間では、以下のような構成が定番となっているように思える。
＜全体のフォーマット＞＜主題＞＜主題の補足＞＜作者＞＜全体の補足＞＜フレーバー＞
おすすめの詠唱のリズム
＜全体フォーマット＞Detailing oil painting of
＜主題＞The great white castle on deep forest landscape
＜英霊＞by CASPAR DAVID FRIEDRICH and CLAUDE LORRAIN,
＜全体の補足＞ perfect lighting, golden hour,
＜フレーバー＞ taken with Canon 5D Mk4

※ https://note.com/fladdict/n/n0f0be20e3e23 より引用

また、以下のサイトでは「Detailing oil painting of」→「非常に精緻な絵が出てくる」のように

辞書的に出力したい表現(英文)の和訳がまとめられていますので、こちらもとても参考になります。