なぜ英語入力?
にじジャーニーは日本語入力に対応しているが、内部で英語に翻訳しているので誤訳があれば望む画像にならない。例えばプロンプトを猫人間にするとcat worldと訳される。生成したい物は英語で何と言うのか調べた方が良い。
ちなみに英語の大文字と小文字で生成結果に差は無い。
英語と日本語の混在はダメ
混在すると正しく認識しない。
プロンプトの区切り方
英語なら ,(カンマ) 日本語なら 、(句点)で区切る。単純なプロンプトなら何で区切っても大差無いが、複雑なプロンプトをスペースで区切ると意図しない前後が繋がる可能性がある。一塊の意味ごとに ,(カンマ)や 、(句点)で区切ろう。
ただし、スペースで区切る方が良い場合もある。次の2枚は同じプロンプトだが、カンマ区切りだとそれぞれのプロンプトが独立する傾向にあり、スペース区切りだとそれぞれのプロンプトが融合して1体のキャラになった。
プロンプトの長さ
単語の羅列のような短いプロンプトの生成結果はにじジャーニーのデフォルトスタイルに大きく依存する、デフォルトスタイルで良い画像が生成されるよう調整されているが、他人の画像と類似しやすい。逆に説明的な長いプロンプトは独特な画像になりやすい。とはいえ余計な情報を詰め込むと望む結果にならないので、必要最低限な長さにする。次の2枚は前者が単純なプロンプト、後者がやや説明的なプロンプト。
生成したいものは具体的に書く
次の2枚は前者が「女の子」とだけ入力したもので、髪、目、服などの要素がランダムで決まる。ランダムに生成したいならこれでも良いが、同じようなキャラクターを別角度や別の服で再度生成するのはほぼ不可能だ。後者は目の色、髪、服を指定した場合。
望む画像に合わせて、公式では以下の7つを具体的に記載するよう推奨している。
- 主題:人物、動物、キャラクター、場所、物体など。
- 媒体:写真、絵画、イラスト、彫刻、落書き、タペストリーなど。
- 環境:屋内、屋外、月面、ナルニア国物語、水中、エメラルドシティなど。
- 照明:ソフト、アンビエント、曇り、ネオン、スタジオ ライトなど
- 色:鮮やか、落ち着いた、明るい、単色、カラフル、白黒、パステルなど。
- 気分:落ち着いた、穏やか、騒々しい、元気など。
- 構図:ポートレート、顔写真、クローズアップ、鳥瞰図など
- Subject: person, animal, character, location, object, etc.
- Medium: photo, painting, illustration, sculpture, doodle, tapestry, etc.
- Environment: indoors, outdoors, on the moon, in Narnia, underwater, the Emerald City, etc.
- Lighting: soft, ambient, overcast, neon, studio lights, etc
- Color: vibrant, muted, bright, monochromatic, colorful, black and white, pastel, etc.
- Mood: Sedate, calm, raucous, energetic, etc.
- Composition: Portrait, headshot, closeup, birds-eye view, etc.
また、名詞の複数形は数字を明記すると良い。「cats」だと何匹の猫が描写されるかはランダムだが、「Three cats」なら3匹の猫が描写されやすい。
同義語
例えば「大きい」の意味は高さ、横幅、面積、年齢あるいは心の広さかもしれないが、様々な意味があり、英語だと別の単語を用いる。「大きい」で上手く生成できない場合は同義語か、より具体的な形容詞を使うと上手くいくかもしれない。
何でも描けるわけではない
エロ・グロ
規制されていて、多くの単語はプロンプトとして使えない。工夫すればある程度は生成可能だがやりすぎるとBAN対象だ。にじジャーニーはPG-13(13歳未満の鑑賞には保護者の厳重な注意が必要)を目指しているそうだ。
学習していない画像
学習済みなら単純なプロンプトでそれっぽい画像になるが、学習していないならプロンプトに工夫がいる。