阿里通义 Qwen3-VL 开源 4B/8B 模型，性能超越 GPT-5 Nano – 云朵码是一个分享前沿技术、创意项目与编程心得的技术博客

阿里通义官宣开源 Qwen3-VL 系列新成员 ——4B 与 8B 密集视觉理解模型，两款均提供 Instruct 与 Thinking 版本，已上线魔搭社区和 Hugging Face。

新模型实现关键突破：通过架构创新解决小模型常见的 “跷跷板” 问题，让视觉感知与文本理解能力同步提升，核心功能未因尺寸缩减而减配。其中 8B 模型在 STEM、VQA、视频理解等 30 项权威评测中表现突出，不仅超越 GPT-5 Nano 与 Gemini 2.5 Flash Lite，性能更媲美上一代 72B 超大模型。

4B 版本则主打高性价比，显存占用更低，适配智能终端部署需求，为端侧视觉 AI 应用提供有力支撑。

说明：本站所有内容均收集于互联网,如果有不妥之处,敬请谅解。如有侵权内容,请联系我们删除。内容并不能代表产品厂家，或者是第三方的观点，非专业技术类人员，请勿对服务器设备进行操作，以免造成设备不可使用或数据丢失。同时凯铧互联小编建议用户定期对云服务器数据进行备份保存！北京凯铧互联科技有限公司（简称凯铧互联）由多名前阿里云资深技术专家创立,核心员工来自阿里云、腾讯云等,作为阿里云重要的合作伙伴,专注于为企业用户提供云计算及云计算的解决方案,高端网站建设,设计及维护服务,设计开发经验丰富,用户认可率高. 今天的分享就到这里啦，若您需要帮助, 可以直接扫描添加我们客服微信号，阿里云代理商凯铧互联专业技术团队为您提供全面/便捷/专业的7x24技术服务。

热点推荐

库克访华：推动 eSIM 落地，再捐清华深化合作

苹果 M5 芯片 MacBook Pro 登场：AI 性能飙升 6 倍