此模型是Flux canny dev fp16版本,测试效果优于lora版本。
FLUX.1 Canny [dev] 是一个拥有 120 亿参数的rectified flow transformer,能够根据文本描述生成图像,同时遵循给定输入图像的结构。
使用建议:
1. 用此模型作为Unet loader(Load diffusion model)中要加载的底模;
2. Flux guidance设为10~30,BFL官方推荐30;
3. 可以搭配lora和InstantX union等controlnet使用;
4. 务必使用Flux-canny-dev-fp16的checkpoint搭配AUX的线稿系列预处理器,个人亲测lineart系列的效果普遍会好一些;
4. 如果本地显卡不是4090,还是建议在线上使用,本模型23.8G,很吃显存;
关键特性:
- 尖端的输出质量。
- 它将令人印象深刻的提示遵循性与基于 Canny 边缘的源图像结构保持相结合。
- 使用指导蒸馏进行训练,使 FLUX.1 Canny [dev] 更加高效。
结构化调节使用 Canny 边缘检测或深度检测来在图像转换过程中保持精确控制。通过边缘或深度图保留原始图像的结构,用户可以在保持核心构图完整的情况下进行文本引导的编辑。这对于重新纹理化图像特别有效。