ComfyUI 很强,也很容易把新手吓跑。
一打开就是节点、模型、VAE、CLIP、采样器、latent、workflow。每个词都能继续展开一堆教程。普通人如果从“把所有概念学完”开始,很可能还没出第一张图就已经放弃。
我的入门建议是反过来:先跑通一个可复用工作流,再慢慢理解每个节点为什么存在。
为什么折腾
我想用 AI 图像做两类事情:一类是给内容配图,另一类是研究提示词和视觉风格。
Flux 这类模型的效果很好,ComfyUI 又能把生成流程拆得非常细。它的价值不只是“出图”,而是可以把一套图像生产流程保存下来,之后反复调整、升级和自动化。
我的公开版环境
公开版工作流大概是:
- 先用一个 Flux 相关模型做基础生成。
- 设置竖图尺寸,适配小红书、短视频封面和手机端内容。
- 先生成预览图,再做一次放大或高清重采样。
- 保存 workflow,后续可以接入自动化工具。
这里不强调某个文件名或本地路径,因为模型文件和目录结构每个人都不一样。入门重点是理解流程。
实际怎么做
第一步,先只跑一个最小工作流。
你需要知道输入提示词,模型生成 latent,再经过 VAE 解码成图片。先别急着加 LoRA、ControlNet、局部重绘、高清修复和各种插件。第一张图稳定生成,比一开始堆节点更重要。
第二步,把尺寸和目标绑定。
如果目标是短视频封面,先用竖图比例;如果目标是网站横幅,就用宽图。很多人一开始追求“什么都能生成”,结果每次都要重新调。
第三步,建立提示词结构。
我会把提示词拆成几层:
- 主体是谁或是什么。
- 场景在哪里。
- 画面构图和镜头感。
- 光线、色彩和材质。
- 风格边界,比如写实、插画、电影感或产品摄影。
第四步,保存能复用的 workflow。
ComfyUI 最大的价值就是流程可保存。只要一个 workflow 能稳定产出某类图,就值得保留,并记录它适合什么场景、不适合什么场景。
哪里卡住
第一个坑是提示词堆太满。
很多提示词看起来很专业,但里面堆了大量形容词,模型不一定真的理解。尤其是人物、姿势、镜头、服装、光线全部塞满时,结果可能更不稳定。
第二个坑是节点太早复杂化。
新手很容易看到别人 workflow 里几十个节点,就以为自己也需要。其实很多节点是在解决特定问题。你的问题还没出现,先别急着加解法。
第三个坑是素材边界。
做公开内容时,不要只围绕擦边人物提示词打转。AI 图像更适合做封面氛围、产品概念、流程示意、场景视觉和品牌资产。长期看,这些比短期猎奇更有用。
第四个坑是本地性能。
ComfyUI 能跑不代表流畅。模型、分辨率、放大步骤和批量生成都会吃资源。入门时先控制尺寸和步骤,不要一开始追求超高分辨率。
值不值得
如果你愿意学一点节点逻辑,ComfyUI 值得。
如果你只是偶尔生成一张图,在线工具更省心。ComfyUI 的优势在于可控、可复用、可自动化。它适合把“某类图怎么生成”沉淀成流程,而不是每次随机碰运气。
对我来说,它最适合成为内容生产系统的一部分:网站配图、短视频封面、视觉实验、风格探索。它不是必须每天打开,但一旦流程稳定,就很有价值。
下一步
后面我会继续整理三类 workflow:
- 文章封面和小红书封面。
- 科技设备和工作台场景图。
- 可用于视频脚本分镜的图像流程。
ComfyUI 入门不要先追求“懂全部节点”。先让一条流程稳定产出,再一点点拆开理解。