ChatGPTで使える画像生成AI「DALL-E3(ダリスリー)」についてもっと勉強したい。
しかし現状、出版社からは専門書が出ていないっぽい。個人が電子書籍出版しているもので、レビュー評価の高いものを、Kindle Unlimitedで手当たり次第読んでみた。
いくつか「なるほど!」という情報を見つけられて、特にいちばんの収穫は gen_id についての理解が深まったことだ。
gen_id を知っていると、たとえばお気に入りの画像を生成できたときに、画風(スタイル)を固定して別の人物やシーンの画像も続けていくつも生成できる。
最初の1枚
ショートカットの女性。この画像の gen_id を尋ねる。
男性に変える
gen_id とともに、「男性に変えて」と指示したもの。
天使に変える
gen_id とともに、「天使に変えて」と指示したもの。
恋人同士に変える
以下同文。人数も変えられた。
男性同士に変える
ハンサムなふたりができた。
サイズを変える
正方形から横長サイズへの変更もできた。最初の1枚の gen_id を使用して作っているから、ハンサムなふたりとは違う。そっちの gen_id を使ったほうがよかったかも。
ちなみにふたりが肩を寄せ合うといった、異なるアクションの生成もできた。
シーンを変える
食事からお茶に変えてみた。
gen_id に似たもので シード値 というものもある。どちらも生成された画像に個別でつけられる数字というのは一緒。
ただ、 シード値 の場合は同じ画像内での修正に向いていて、スタイルを固定して違う画像を生成するのは苦手みたいだ。服の色を変えるとかね。勉強になった。
ちなみにどちらの数値も、同一のチャットセッション内のみで可能。さらに、セッション内で他の画像を生成した後で聞きだすことはできないみたいだから、「これは!」というものができたときは尋ねておくこと。
ChatGPTのカスタマイズで、生成するたびに数値も一緒に表示できるようにする方法もあるみたいなんだけど、動作が重くなったのでやめた(とても古いPCを使っているせいかな……)
正直なところ「これは!」という1冊はなく、乱読してちょっとずついろんな情報を仕入れた。
試してみたけどうまくできなかったテクニックもあるから、引き続き研究していく。