AI 领域再添新工具 —— 视觉生成模型 Wan 2.5-Preview 近日正式亮相。这款模型采用了原生多模态架构,通过多模态数据联合训练,实现了不同模态(文本、图像、视频、音频)之间的深度对齐,能够灵活处理这四类信息的生成与协同工作。
在核心功能上,Wan 2.5-Preview 展现出强大的音视频生成能力:不仅能原生输出 1080p 高清规格、时长 10 秒的电影级视频,还能同步生成与视频内容精准匹配的音频素材,包括多人声、场景音效以及背景音乐,真正实现 “音画同步” 的电影级创作效果。
此外,模型的图像生成与编辑功能也进行了升级强化,新增了对话式像素级精修能力 —— 创作者可通过自然语言对话的方式,对图像进行精细化调整,精准满足创作需求。这款模型的推出,为内容创作者提供了一套功能更强大、创作更高效的 AI 辅助工具。

.
.
.
.
