腾讯混元团队新发布了一款多模态理解模型——混元Large-Vision。这款模型采用MoE架构,参数规模达到520亿,能够支持任意分辨率的图像、视频以及3D空间输入,同时在多语言场景的理解能力上也有所提升,为AI视觉理解服务筑牢了技术根基。

.
.
.
.
.
.
.

腾讯混元团队新发布了一款多模态理解模型——混元Large-Vision。这款模型采用MoE架构,参数规模达到520亿,能够支持任意分辨率的图像、视频以及3D空间输入,同时在多语言场景的理解能力上也有所提升,为AI视觉理解服务筑牢了技术根基。
.
.
.
.
.
.
.