Omost文生图模型 – Binbin's Log

这个模型由ControlNet作者发布，通过Llama3模型生成Canvas代码，再用Diffusion模型生成最终的图片。模型支持全局和局部描述，局部描述支持location、offset和area三个参数，

作者还提出了Prompt Prefix Tree，用来生成更多的prompts，

参考资料