ComfyUI 和 Flux 图像生成：普通人到底该怎么入门

ComfyUI 很强，也很容易把新手吓跑。

一打开就是节点、模型、VAE、CLIP、采样器、latent、workflow。每个词都能继续展开一堆教程。普通人如果从“把所有概念学完”开始，很可能还没出第一张图就已经放弃。

我的入门建议是反过来：先跑通一个可复用工作流，再慢慢理解每个节点为什么存在。

为什么折腾

我想用 AI 图像做两类事情：一类是给内容配图，另一类是研究提示词和视觉风格。

Flux 这类模型的效果很好，ComfyUI 又能把生成流程拆得非常细。它的价值不只是“出图”，而是可以把一套图像生产流程保存下来，之后反复调整、升级和自动化。

公开版工作流大概是：

这里不强调某个文件名或本地路径，因为模型文件和目录结构每个人都不一样。入门重点是理解流程。

第一步，先只跑一个最小工作流。

你需要知道输入提示词，模型生成 latent，再经过 VAE 解码成图片。先别急着加 LoRA、ControlNet、局部重绘、高清修复和各种插件。第一张图稳定生成，比一开始堆节点更重要。

第二步，把尺寸和目标绑定。

如果目标是短视频封面，先用竖图比例；如果目标是网站横幅，就用宽图。很多人一开始追求“什么都能生成”，结果每次都要重新调。

第三步，建立提示词结构。

我会把提示词拆成几层：

第四步，保存能复用的 workflow。

ComfyUI 最大的价值就是流程可保存。只要一个 workflow 能稳定产出某类图，就值得保留，并记录它适合什么场景、不适合什么场景。

第一个坑是提示词堆太满。

很多提示词看起来很专业，但里面堆了大量形容词，模型不一定真的理解。尤其是人物、姿势、镜头、服装、光线全部塞满时，结果可能更不稳定。

第二个坑是节点太早复杂化。

新手很容易看到别人 workflow 里几十个节点，就以为自己也需要。其实很多节点是在解决特定问题。你的问题还没出现，先别急着加解法。

第三个坑是素材边界。

做公开内容时，不要只围绕擦边人物提示词打转。AI 图像更适合做封面氛围、产品概念、流程示意、场景视觉和品牌资产。长期看，这些比短期猎奇更有用。

第四个坑是本地性能。

ComfyUI 能跑不代表流畅。模型、分辨率、放大步骤和批量生成都会吃资源。入门时先控制尺寸和步骤，不要一开始追求超高分辨率。

如果你愿意学一点节点逻辑，ComfyUI 值得。

如果你只是偶尔生成一张图，在线工具更省心。ComfyUI 的优势在于可控、可复用、可自动化。它适合把“某类图怎么生成”沉淀成流程，而不是每次随机碰运气。

对我来说，它最适合成为内容生产系统的一部分：网站配图、短视频封面、视觉实验、风格探索。它不是必须每天打开，但一旦流程稳定，就很有价值。

后面我会继续整理三类 workflow：

ComfyUI 入门不要先追求“懂全部节点”。先让一条流程稳定产出，再一点点拆开理解。