共感で繋がるSNS
人気
帯椀 稀能毘

帯椀 稀能毘

生成環境の話の続きです。

StableDiffusionをfooocus環境で使ってるので、StableDiffusionのバージョンはSDXLになります。SDXLの特徴として、チェックポイントデータを2種類適用できる、というのがあり、ワタシはアニメ柄のチェックポイントをとっかえひっかえして現在の絵柄にたどり着きました。
fooocusの仕様なのかSDXLの仕様なのかはわかりませんが、2種類適用できるチェックポイントのうち、ベースはSDXLのみですがリファイナー(仕上げ生成)はSD1.5のデータも使えて、しかもベースからリファイナーへの切り替えタイミングも調整できますから組み合わせは無限にあります。昨今はSDXLでもリファイナーなしでの生成が主流らしいですが、ワタシはこの絵柄が気に入ってるのでリファイナーありのセットで生成してます。

ここにLORAをさらに適用するのですが、過去記事に書いた通りLORAはSDXLのものしか使えません。ぶっちゃけ種類が少なくてあんまりいいのがない(笑)ただ、手の描写改善のClearHandsのLORAだけは常時適用してます。

あと、AI作画はどうしてもプロンプト要素を全部絵にしたがることから背景がうるさくなりがちなので、fooocusの「スタイル」設定の「ティルトシフト」を適用してバックをボカすようにしてます。コレは正直あんまり効いてないんですが(笑)

ここまでが基本設定で、ここにプロンプトを入れていきます。

前にも書いた通り、うちの美人姉妹の容姿はモデルに依存しており、プロンプト上では髪型と髪色以外の指示は入れてません。まずどっちを描くかをプロンプトの最初に書きます。
その後に、時間帯(朝、夜、夕方…)、大まかなシーン(部屋の中、海辺、店の中…)、服装、表情、その他の状況をだいたいこの順番でプロンプトに入れます。プロンプト独自の指示語もありますが、めんどくさい時は状況をそのまま英語で書きこんでしまいます。なのでGoogle翻訳は必須アイテムです(笑)

残念ながらStableDiffusionは自然言語の解釈があまりうまくなく、自然言語での指示は最後の味付けレベルでしかハマりません。この辺はMidjourney系列の生成AIの方が文句なしに優秀で、特に日本語入力対応のnijijourneyの反映能力は素晴らしいです。
GRAVITY
GRAVITY22
帯椀 稀能毘

帯椀 稀能毘

この辺がFLUX.1の実力かも…。

同じプロンプトを与えて、画風の描き分けを試してみました。

ベースは同じで
「17歳の女子高生、短いポニーテールの黒髪、制服に赤いネクタイ、嵐山、紅葉と竹、照れてる、ポートレート」
として、クオリティ系のプロンプトを足してます。
コレに
「新海誠風」
「京都アニメーション風」
「スタジオジブリ風」
をそれぞれ最後に追加して生成しました。
4枚目は比較用に、SDXLで生成したもの。

注目すべきは、FLUX.1は20ステップ生成にもかかわらず、背景の描き込みで上回っています。
生成AIの仕組みって伝言ゲームみたいなもんで、生成ステップごとにAIがプロンプト要素を描いて(正確にはノイズの中から抽出して)いくので、生成ステップ数と描き込み密度は概ね比例します。
少ないステップ数でしっかり描き込めると言うことは、ベースのAIが優秀と言うことなんだと思います。

また、絵柄の振れ幅が大きく、しかもプロンプトにうまく沿ってくれそうなので、調整次第でかなりいい物ができそうな予感はします。「基礎体力」があるだけに期待感はありますね。

#画像生成AI
#AIイラスト
#FLUX
GRAVITY
GRAVITY25
えると

えると

#AIイラスト
NSFWの有り無しでは正確性に差が出るみたい。有りだと若干プロンプトに幅が産まれてしまうけど、NSFW要素は発生する。無しだとNSFW要素が発生せずにプロンプト要素が強め
GRAVITY
GRAVITY
関連検索ワード
おすすめのクリエーター