本地跑大模型写代码这件事,从极客玩具变成正经生产力工具,大概只用了半年。Hacker News 一场讨论撕开了这层窗户纸:Qwen 3.6 35B-A3B 以 33% 的提及率稳坐头把交椅,27B 变体 20% 紧随其后,DeepSeek Pro 与 Gemma4 31B 瓜分剩下的前四席位。Agent 工具层面,Pi(49%)和 OpenCode(45%)几乎是开发者桌面上的标配组合。这组数据的潜台词很直白——社区已经用脚投票,把编码主战场从云端 API 悄悄搬回了本地。
数字背后的故事更有意思。用户在实测中发现,Claude Opus 能带来 15 倍加速不假,但 Qwen 本地离线版本同样能做到 5 倍提速,代价只是你得有一张像样的消费级显卡。零 API 费用、零数据外泄、零网络延迟——这三条一旦同时成立,云端编码助手的护城河就塌了一半。SWE-bench Verified 基准测试给出了一个更精确的注脚:Qwen 3.6 27B 拿下 77.2%,35B-A3B 也有 73.4%,距离 Claude Sonnet 4.6 的 79.6% 只差一个身位。考虑到后者按 token 计费、且代码上下文不会离开你的笔记本,所谓的"性能差距"在很多团队眼里已经不值得为之付费。
真正让这场替代变得势不可挡的,是 MoE 架构带来的工程红利。35B-A3B 这种"总参数大、激活参数小"的设计,意味着推理时真正吃显存的只有那 30 亿激活参数,单张 24G 显存的消费级显卡就能流畅运行。一位用户在讨论里算了笔账:同样的编码任务,云端 Sonnet 月费够他买半张二手 4090,而本地模型七年不用交一分钱订阅费。当免费、隐私、性能三角同时成立,企业 IT 采购清单上那个固定支出项突然变得可商量了——这才是 Qwen 社区热度持续走高的真正原因。选型逻辑的拐点,已经到了。

