媒体生成
VAE 和 latent
latent space 潜在空间计算,stable diffusion 将图形的像素数据编码成 latent 空间中的压缩形式的格式,可以显著降低图形生成时的内存占用。
K 采样
ComfyUI
ComfyUI 是一个开源的图形用户界面(GUI),专为 Stable Diffusion(SD)模型设计,用于 AI 图像生成。它采用基于节点的模块化工作流系统,用户通过拖拽节点和连接线来构建复杂生成管道,而非传统的线性输入界面。
- 节点式工作流:每个节点代表一个功能模块(如加载模型、文本编码、采样生成),支持自定义连接,实现高度灵活的流程设计。适合高级用户处理文生图、图生图、图像修复或视频生成。
- 轻量高效:对硬件要求低,显存占用小,生成速度快。支持 GPU 加速,兼容 SD 1.x、SDXL 等模型。
- 可扩展性强:内置自定义节点系统,可安装插件扩展功能,如 ControlNet(姿势控制)、AnimateDiff(动画生成)。