字节联合 UCLA 突破 AI 长视频极限 最长生成 4 分 15 秒高清内容

字节跳动联合加州大学洛杉矶分校(UCLA)推出 Self-Forcing++ 技术,成功打破 AI 长视频生成的核心瓶颈。针对传统模型生成超 5 秒后易出现的画面崩坏问题,该技术通过反向噪声初始化、扩展分布匹配蒸馏、滚动 KV 缓存训练三大优化,重构模型架构稳定性。

实验数据显示,这项技术可生成最长 4 分 15 秒的高清视频,像无人机航拍海岸线、草原象群迁徙等动态场景,全程画面流畅无卡顿。在 VBench 评测中,其短时语义得分达 80.37,长时视觉稳定性超基准模型 2.6 倍,动态表现提升 104.9%,文本与画面的对齐能力也处于行业领先水平。

.

.

.

说明:本站所有内容均收集于互联网,如果有不妥之处,敬请谅解。如有侵权内容,请联系我们删除。内容并不能代表产品厂家,或者是第三方的观点,非专业技术类人员,请勿对服务器设备进行操作,以免造成设备不可使用或数据丢失。同时凯铧互联小编建议用户定期对云服务器数据进行备份保存! 北京凯铧互联科技有限公司(简称凯铧互联)由多名前阿里云资深技术专家创立,核心员工来自阿里云、腾讯云等,作为阿里云重要的合作伙伴,专注于为企业用户提供云计算及云计算的解决方案,高端网站建设,设计及维护服务,设计开发经验丰富,用户认可率高. 今天的分享就到这里啦,若您需要帮助, 可以直接扫描添加我们客服微信号,阿里云代理商凯铧互联专业技术团队为您提供全面/便捷/专业的7x24技术服务。