腾讯 AI Lab 新推出了一款多模态音频工具,名叫 AudioGenie。它能接收视频、文本、图像等多种输入,轻轻一点就能生成音效、语音和音乐,像影视配音、游戏音效这些场景都能用得上。
这款工具采用了无训练框架,通过生成团队进行动态建模,还有监督团队负责纠错来保证质量,既能降低成本,又能提高效率。在 MA-Bench 测试中,它的表现处于领先地位,用户调研的结果也很优秀。
AudioGenie 的出现,有望挑战当前的市场格局,挤压国际品牌的市场份额,为音频创作开启一个新的时代。

.
.
.
.
.
.
.
