阿里云通义千问宣布开源 Qwen3-VL-30B-A3B 系列模型,包含 Instruct 与 Thinking 版本及 FP8 量化版,以 30 亿激活参数的小巧体积实现强劲性能,在智能体、视觉问答、STEM 等多任务上媲美甚至超越 GPT-5-Mini。
新模型全面升级核心能力:视觉代理可操作 PC / 移动端界面完成自动化任务,高级空间感知能判断物体位置与遮挡关系,原生支持 256K 长上下文以处理数小时长视频。更实现图像生成 Draw.io、HTML 等代码,OCR 功能扩展至 32 种语言,低光模糊场景表现稳健。
目前该模型已在魔搭社区、Hugging Face 开放免费下载,单卡即可部署,大幅降低开发者使用门槛,为多模态应用落地提供助力。

.
.
