AI 图像提示词别只堆形容词：我更在意结构

AI 图像提示词最容易写成形容词堆叠：高清、电影感、细节丰富、梦幻、真实、8K。

这些词不是完全没用，但如果只有这些，结果会很飘。我的感受是，稳定的图像提示词更像一张拍摄任务单，而不是一段情绪文案。

我会怎么拆

第一是主体。

主体是谁，长什么样，动作是什么，和镜头的关系是什么。人物、物品、场景都一样，主体不清楚，模型就会自己猜。

第二是环境。

地点、时间、天气、空间关系和背景材质要明确。尤其是图生图，不要只说“变好看”，而要说哪些环境要保留，哪些可以自然延展。

第三是风格。

风格要服务目标。写真、产品摄影、手办、插画、复古胶片、赛博朋克，不要全部塞进去。风格冲突越多，结果越不稳定。

第四是光线和构图。

很多图像的高级感来自光线和镜头，而不是关键词。广角、俯视、仰视、近景、景深、柔光、逆光，这些比“好看”更有控制力。

第五是限制。

不想要什么也要写清楚。比如不要文字、水印、标志，不要换人，不要换服装类型，不要把场景搬到完全不同的地方。

图生视频工作流里，提示词不是唯一变量。模型、VAE、LoRA、采样、帧率、起始图都会影响结果。

所以我不喜欢一上来追求复杂镜头。先确认起始图稳定、人物不崩、动作幅度可控，再逐步增加镜头语言。

提示词不是魔法咒语，更像导演给摄影师的 brief。

你越能说清主体、场景、风格、光线、构图和限制，模型越少胡来。堆形容词能偶尔撞好运，结构化提示词才适合长期复用。