お問い合わせ

ブログ

これまでに経験してきたプロジェクトで気になる技術の情報を紹介していきます。

生成AI素人のプログラマが、生成AIを使ってHPのTOPページを作ってみた ⑤

T, M T, M 2 months
生成AI素人のプログラマが、生成AIを使ってHPのTOPページを作ってみた ⑤

◆HPで使用する画像の生成 その①

前回では StableDiffusion の基本的な画像生成の手順について説明を行いました。
今回からは、ようやくHPで使用する画像の生成に入ります。

ここではHPで使用する画像の1、2枚目を生成していきます。
最終的にはメインビジュアル3枚と関連作品4枚で合計7枚生成します。

◆(1枚目)飛鳥時代をイメージしたアニメ

株式会社あすかで・・・という事情もあるので、最初は飛鳥時代っぽいアニメ画像を生成していきます。

1. 作りたい画像のイメージ決め

最初に作りたい画像のイメージを決めます。
具体的には下のような画像をイメージしてみます。

引用元:https://kids.shueisha.co.jp/nihonshi/

2. Checkpoint の設定

サンプルとして、デフォルトの Checkpoint となる「realisticVisionV51_v51VAE(SD 1.5)」で設定しておきます。
先に言っておくと、この Checkpoint はアニメ風ではなく実写に強いモノとなります。
後々にアニメに強い Checkpoint で作り直しますので、その辺りはご理解よろしくお願いします。

3. Prompt の設定

手順1.で選んだイメージになるように Prompt を設定します。
今回のイメージを生成したい場合は、下記のような Prompt になると思います。
※この Prompt に辿り着くまでに、それなりに タグの設定>画像生成>結果確認>タグの修正・・・の試行錯誤を結構繰り返しています(汗)

◆Prompt

best quality, masterpiece, shrine maiden, one person, black hair, pray, (folded hands:1.2), shrine maiden costume, comma-shaped jewels, looking down, cowboy shot, from below, shrine of Japan, autumn leaves, anime, anime screencap

【各タグの内容】

設定項目 タグ内容 Tag
品質 最高品質 best quality
品質 傑作 masterpiece
対象 巫女 shrine maiden
対象 一人 one person
対象 黒髪 black hair
ポーズ 祈る pray
ポーズ 手を合わせ、指を絡める Folded hands
衣装 巫女装束 shrine maiden costume
衣装 勾玉 comma-shaped jewels
構図 見下ろす looking down
構図 太ももから上 cowboy shot
構図 ローアングル from below
背景 日本の神社 shrine of Japan
背景 紅葉 autumn leaves
絵柄 アニメ anime
絵柄 アニメ塗り anime screencap

ここで注目してほしいのが「(folded hands:1.2)」というタグの書き方です。
この書式で記載すると、AIはこの「folded hands」のタグを他のタグより1.2倍強調して認識します。
指定の仕方は簡単で、タグをダブルクリックして選択状態にし、「Ctrl+↑」で強調、「Ctrl+↓」で弱調となります。
複数回すれば、更に数値を調整することも出来ます。

このタグを強調した理由は、単純にAIが合掌ポーズのイラストをなかなか生成してくれなかったからです。
そのため、合掌ポーズになる確率を少しでも上げるために設定しています。
ちなみに強調を何も指定しない場合は、基本的に記載順(この場合左側から)で強いタグと判断されるそうです。

◆Negative Prompt SD 1.5 系の Checkpoint の場合

EasyNegativeV2, negative_hand-neg

SDXL 1.0 系の Checkpoint の場合

negativeXL_D

【各タグの内容】

タグ内容 Tag
品質低下防止(SD 1.5) EasyNegativeV2
変な手防止(SD 1.5) negative_hand-neg
品質低下防止(SDXL 1.0) negativeXL_D

こちらはややこしい設定を「EasyNegativeV2」で省略しています。
もう一つ設定している「negative_hand-neg」は「EasyNegative」と同様のテキスト反転モデルの1つで、変な手の出力を抑制するモノです。
取得の方法は以前(生成AI素人のプログラマが、生成AIを使ってHPのTOPページを作ってみた ③)に紹介した EasyNegative と同じです。
なお、フォーマットが SDXL 1.0 の Checkpoint については「negativeXL_D」のみの設定となります。

4. 画像の生成

下が生成した画像となります。
※HPに使う前提なので、横幅(Width)を倍の1024にしています。
Checkpoint:realisticVisionV51_v51VAE(SD 1.5)
ただ、これだとアニメ調ではないのでアニメ制作会社のHPとして使うには不十分です。
なので Checkpoint をアニメ調の画像を出力するモノに変えて再出力します。

併せて Prompt を変えずに複数の Checkpoint で画像を生成してみます。
Checkpoint を変えると絵柄がこんなに変わるのか・・・といった参考になればと思います。

下が Checkpoint を変えて生成した画像となります。
Checkpoint:westernAnimation_v1(SD 1.5)

Checkpoint:kuronekoAnimemixV10_v10(SD 1.5)

Checkpoint:aniflatmixAnimeFlatColorStyle_v20(SD 1.5)

Checkpoint:Amalgam_Anime_XX(SD 1.5)

Checkpoint:aamXLAnimeMix_v10(SDXL 1.0)

Checkpoint:animaPencilXL_v400(SDXL 1.0)

一旦、1枚目の画像は Checkpoint「animaPencilXL_v400」で生成した画像を採用とします。

続いて2枚目の画像の生成していきます。

◆(2枚目)どっかで見た軽音学部をイメージしたアニメ

2枚目は実際にある作品を参考にて画像を生成していきます。
理由は実務をしていると「~を参考にして欲しい」といった要望を受ける事が多々あるからです。
今回はアニメ「けいおん!」を参考にしてみます。

1. 作りたい画像のイメージ決め

具体的には下のような画像をイメージしてみます。

引用元:https://www.kyotoanimation.co.jp/works/k-on/

2. Checkpoint の設定

今回使用する Checkpoint は「Amalgam_Anime_XX(SD 1.5)」となります。
いつくかの Checkpoint を試した結果、より「けいおん!」に近い画像が生成されたのが理由です。

3. Prompt の設定

◆Prompt

best quality, masterpiece, k-on!, 4 girls, cowboy shot, looking up, band, (keyboard_(instrument):1.2), drumming, (guitar:0.8), concert, school uniform , inside a school building, anime, anime screencap

【各タグの内容】

設定項目 タグ内容 Tag
品質 最高品質 best quality
品質 傑作 masterpiece
作品 けいおん! k-on!
対象 女性4人 4 girls
構図 太ももから上 cowboy shot
構図 見上げる looking up
対象 バンド band
対象 鍵盤楽器 keyboard_(instrument)
対象 ドラマー drumming
対象 ギタリスト guitar
状況 演奏 concert
対象 学生服 school uniform
背景 校舎内 inside a school building
絵柄 アニメ anime
絵柄 アニメ塗り anime screencap

特定の作品を参考にさせるには、Prompt にその作品のタグを入れる形になります。
今回はアニメ「けいおん!」を参考にさせるために「k-on!」というタグを入れています。

◆Negative Prompt こちらは1枚目と同じとなるので省略します。
特に出力したくない内容が出力されない限り、基本的には1枚目と同じです。

4. 画像の生成

下が生成した画像となります。
Amalgam_Anime_XX(SD 1.5)





正直、かなりの枚数を生成したのですが、ギターばかりが出力されてキーボードがなかなか出てくれませんでした。
タグの強弱でギターを弱めて、キーボードを強調したのですが、それでも尚・・・です。
なのでキーボード(っぽいもの)が出で、メンバー構成がイメージに近い構成になった1枚目を採用とします。

以上で HP「もし、株式会社あすかが「アニメ制作会社」だったら」に使用する画像の1、2枚目の画像生成は終了となります。
次回は引き続き HP に使用する画像の3枚目以降の画像を生成をしていきます。
引き続き、よろしくお願いします。

初回:生成AI素人のプログラマが、生成AIを使ってHPのTOPページを作ってみた ①
前回:生成AI素人のプログラマが、生成AIを使ってHPのTOPページを作ってみた ④
次回:生成AI素人のプログラマが、生成AIを使ってHPのTOPページを作ってみた ⑥

生成AI素人のプログラマが、生成AIを使ってHPのTOPページを作ってみた ⑤ 2024-09-03 12:04:03

コメントはありません。

4822

お気軽に
お問い合わせください。

お問い合わせ
gomibako@aska-ltd.jp