清华开源 MOSS-TTSD 语音模型！支持双语对话与音色克隆 – 云朵码是一个分享前沿技术、创意项目与编程心得的技术博客

清华大学联合腾讯 AI Lab 开源对话语音模型 MOSS-TTSD，支持中英双语生成。利用百万小时语音数据训练，实现高表现力对话语音输出。模型创新采用 XY-Tokenizer 编码器，在 1kbps 低比特率下保持语音质量，支持零样本音色克隆及最长 960 秒连续生成。已开放模型权重、API 及在线演示，推动 AI 播客、影视配音等应用落地。

说明：本站所有内容均收集于互联网,如果有不妥之处,敬请谅解。如有侵权内容,请联系我们删除。内容并不能代表产品厂家，或者是第三方的观点，非专业技术类人员，请勿对服务器设备进行操作，以免造成设备不可使用或数据丢失。同时凯铧互联小编建议用户定期对云服务器数据进行备份保存！北京凯铧互联科技有限公司（简称凯铧互联）由多名前阿里云资深技术专家创立,核心员工来自阿里云、腾讯云等,作为阿里云重要的合作伙伴,专注于为企业用户提供云计算及云计算的解决方案,高端网站建设,设计及维护服务,设计开发经验丰富,用户认可率高. 今天的分享就到这里啦，若您需要帮助, 可以直接扫描添加我们客服微信号，阿里云代理商凯铧互联专业技术团队为您提供全面/便捷/专业的7x24技术服务。

Related News

Claude 开放多格式文件上传！AI 应用无缝协作升级

阿里 WebShaper 开源，GAIA 评测超越 Claude 与 GPT-4o