October 2024 – Binbin's Log

TTS数据准备流程

在开发高质量的文本转语音(TTS)系统时，数据准备是至关重要的第一步。本文简要总结了从原始音频到最终训练数据集的转换过程…

这个模型由ControlNet作者发布，通过Llama3模型生成Canvas代码，再用Diffusion模型生成最终的图片。模型支持全局和局部描述，局部描述支持location、offset和area三个参数…