AI 图像提示词最容易写成形容词堆叠:高清、电影感、细节丰富、梦幻、真实、8K。
这些词不是完全没用,但如果只有这些,结果会很飘。我的感受是,稳定的图像提示词更像一张拍摄任务单,而不是一段情绪文案。
我会怎么拆
第一是主体。
主体是谁,长什么样,动作是什么,和镜头的关系是什么。人物、物品、场景都一样,主体不清楚,模型就会自己猜。
第二是环境。
地点、时间、天气、空间关系和背景材质要明确。尤其是图生图,不要只说“变好看”,而要说哪些环境要保留,哪些可以自然延展。
第三是风格。
风格要服务目标。写真、产品摄影、手办、插画、复古胶片、赛博朋克,不要全部塞进去。风格冲突越多,结果越不稳定。
第四是光线和构图。
很多图像的高级感来自光线和镜头,而不是关键词。广角、俯视、仰视、近景、景深、柔光、逆光,这些比“好看”更有控制力。
第五是限制。
不想要什么也要写清楚。比如不要文字、水印、标志,不要换人,不要换服装类型,不要把场景搬到完全不同的地方。
图生视频更要克制
图生视频工作流里,提示词不是唯一变量。模型、VAE、LoRA、采样、帧率、起始图都会影响结果。
所以我不喜欢一上来追求复杂镜头。先确认起始图稳定、人物不崩、动作幅度可控,再逐步增加镜头语言。
我的结论
提示词不是魔法咒语,更像导演给摄影师的 brief。
你越能说清主体、场景、风格、光线、构图和限制,模型越少胡来。堆形容词能偶尔撞好运,结构化提示词才适合长期复用。