腾讯混元发布 52B 参数 Large-Vision！任意分辨率全场景输入

腾讯混元团队新发布了一款多模态理解模型——混元Large-Vision。这款模型采用MoE架构，参数规模达到520亿，能够支持任意分辨率的图像、视频以及3D空间输入，同时在多语言场景的理解能力上也有所提升，为AI视觉理解服务筑牢了技术根基。

热点推荐