阿里通义官宣开源 Qwen3-VL 系列新成员 ——4B 与 8B 密集视觉理解模型,两款均提供 Instruct 与 Thinking 版本,已上线魔搭社区和 Hugging Face。
新模型实现关键突破:通过架构创新解决小模型常见的 “跷跷板” 问题,让视觉感知与文本理解能力同步提升,核心功能未因尺寸缩减而减配。其中 8B 模型在 STEM、VQA、视频理解等 30 项权威评测中表现突出,不仅超越 GPT-5 Nano 与 Gemini 2.5 Flash Lite,性能更媲美上一代 72B 超大模型。
4B 版本则主打高性价比,显存占用更低,适配智能终端部署需求,为端侧视觉 AI 应用提供有力支撑。

.
.
.
.
.
.
