布莱恩喵
折腾笔记已复盘

AI 图像提示词别只堆形容词:我更在意结构

Flux、Nano Banana、图生视频这些模型看起来玩法很多,但真正稳定的提示词通常都有结构:主体、场景、风格、光线、构图、细节和限制。

AI 图像FluxNano Banana提示词

AI 图像提示词最容易写成形容词堆叠:高清、电影感、细节丰富、梦幻、真实、8K。

这些词不是完全没用,但如果只有这些,结果会很飘。我的感受是,稳定的图像提示词更像一张拍摄任务单,而不是一段情绪文案。

我会怎么拆

第一是主体。

主体是谁,长什么样,动作是什么,和镜头的关系是什么。人物、物品、场景都一样,主体不清楚,模型就会自己猜。

第二是环境。

地点、时间、天气、空间关系和背景材质要明确。尤其是图生图,不要只说“变好看”,而要说哪些环境要保留,哪些可以自然延展。

第三是风格。

风格要服务目标。写真、产品摄影、手办、插画、复古胶片、赛博朋克,不要全部塞进去。风格冲突越多,结果越不稳定。

第四是光线和构图。

很多图像的高级感来自光线和镜头,而不是关键词。广角、俯视、仰视、近景、景深、柔光、逆光,这些比“好看”更有控制力。

第五是限制。

不想要什么也要写清楚。比如不要文字、水印、标志,不要换人,不要换服装类型,不要把场景搬到完全不同的地方。

图生视频更要克制

图生视频工作流里,提示词不是唯一变量。模型、VAE、LoRA、采样、帧率、起始图都会影响结果。

所以我不喜欢一上来追求复杂镜头。先确认起始图稳定、人物不崩、动作幅度可控,再逐步增加镜头语言。

我的结论

提示词不是魔法咒语,更像导演给摄影师的 brief。

你越能说清主体、场景、风格、光线、构图和限制,模型越少胡来。堆形容词能偶尔撞好运,结构化提示词才适合长期复用。