阿里云在昨天宣布将 Qwen3-Coder 模型全面开源,此次推出了最为强大的 480B-A35B 版本。这个模型采用了 MoE 架构,它能够原生支持 256K 的上下文长度,并且还可以扩展到 1M,非常适合处理大规模的代码库。
在训练过程中,阿里云使用了多达 7.5T 的数据,其中有 70% 都是代码数据,这使得模型在仓库级编程方面得到了很好的优化。经过后训练强化学习,模型的代码执行成功率也得到了显著提升。
此外,阿里云还开源了 Qwen Code 命令行工具,它可以和 Claude Code 等工具协同使用,为开发者提供了更多便利。目前,Qwen3-Coder 模型已经在魔搭社区和 HuggingFace 上免费上线了,而且很快还会接入通义灵码和阿里云百炼平台。
.
.
.
