Kindle UnlimitedでDALL-E3の電子書籍読み漁った収穫 - 夜明けのマックで号泣した日もあった

ChatGPTで使える画像生成AI「DALL-E3（ダリスリー）」についてもっと勉強したい。

しかし現状、出版社からは専門書が出ていないっぽい。個人が電子書籍出版しているもので、レビュー評価の高いものを、Kindle Unlimitedで手当たり次第読んでみた。

いくつか「なるほど！」という情報を見つけられて、特にいちばんの収穫は gen_id についての理解が深まったことだ。

gen_id を知っていると、たとえばお気に入りの画像を生成できたときに、画風（スタイル）を固定して別の人物やシーンの画像も続けていくつも生成できる。

f:id:ma1190:20250208073736p:image

ショートカットの女性。この画像の gen_id を尋ねる。

f:id:ma1190:20250208073809p:image

gen_id とともに、「男性に変えて」と指示したもの。

f:id:ma1190:20250208073817p:image

gen_id とともに、「天使に変えて」と指示したもの。

f:id:ma1190:20250208073826p:image

以下同文。人数も変えられた。

f:id:ma1190:20250208073832p:image

ハンサムなふたりができた。

f:id:ma1190:20250208073852p:image

正方形から横長サイズへの変更もできた。最初の1枚の gen_id を使用して作っているから、ハンサムなふたりとは違う。そっちの gen_id を使ったほうがよかったかも。

ちなみにふたりが肩を寄せ合うといった、異なるアクションの生成もできた。

f:id:ma1190:20250208074020p:image

食事からお茶に変えてみた。

gen_id に似たもので シード値 というものもある。どちらも生成された画像に個別でつけられる数字というのは一緒。

ただ、 シード値 の場合は同じ画像内での修正に向いていて、スタイルを固定して違う画像を生成するのは苦手みたいだ。服の色を変えるとかね。勉強になった。

ちなみにどちらの数値も、同一のチャットセッション内のみで可能。さらに、セッション内で他の画像を生成した後で聞きだすことはできないみたいだから、「これは！」というものができたときは尋ねておくこと。

ChatGPTのカスタマイズで、生成するたびに数値も一緒に表示できるようにする方法もあるみたいなんだけど、動作が重くなったのでやめた（とても古いPCを使っているせいかな……）

正直なところ「これは！」という1冊はなく、乱読してちょっとずついろんな情報を仕入れた。

試してみたけどうまくできなかったテクニックもあるから、引き続き研究していく。