AI 视觉生成模型 Wan 2.5-Preview 发布，支持电影级音视频同步生成 – 云朵码是一个分享前沿技术、创意项目与编程心得的技术博客

AI 领域再添新工具 —— 视觉生成模型 Wan 2.5-Preview 近日正式亮相。这款模型采用了原生多模态架构，通过多模态数据联合训练，实现了不同模态（文本、图像、视频、音频）之间的深度对齐，能够灵活处理这四类信息的生成与协同工作。

在核心功能上，Wan 2.5-Preview 展现出强大的音视频生成能力：不仅能原生输出 1080p 高清规格、时长 10 秒的电影级视频，还能同步生成与视频内容精准匹配的音频素材，包括多人声、场景音效以及背景音乐，真正实现 “音画同步” 的电影级创作效果。

此外，模型的图像生成与编辑功能也进行了升级强化，新增了对话式像素级精修能力 —— 创作者可通过自然语言对话的方式，对图像进行精细化调整，精准满足创作需求。这款模型的推出，为内容创作者提供了一套功能更强大、创作更高效的 AI 辅助工具。

热点推荐