阿里巴巴今日宣布其通义千问系列最新升级版Qwen 3.6-Plus正式上线。在全球权威的大模型盲测榜单中,Qwen 3.6-Plus一举夺得编程能力周榜冠军,成为首个在该领域登顶的国产模型,性能直追甚至在部分场景下超越了Claude系列。
Qwen 3.6-Plus的突破主要集中在复杂系统架构设计和自动化Debug能力上。在HumanEval测试中,其单次代码生成成功率(Pass 1)创下了行业新高。阿里技术团队表示,该模型通过引入“代码逻辑强化学习(RLCP)”技术,能够理解多文件之间的调用逻辑,而不仅仅是单函数生成。
这一成绩标志着国产大模型在“生产力工具化”路线上取得了实质性进展。许多一线程序员反馈,Qwen 3.6-Plus在编写分布式系统代码时展现出的全局观令人惊讶。此外,阿里同步宣布将进一步下调API价格,旨在通过“极致性价比”吸引全球开发者。分析人士认为,Qwen 3.6-Plus的成功预示着大模型竞争已进入“垂直落地”的深水区,编程与工程实践将成为检验模型含金量的硬指标。

