小米做了一件事:把一款终端AI编程助手直接开源了。MiMo Code V0.1.0,MIT协议,终端里输入mimo就能跑起来。它内置的MiMo-V2.5多模态模型限时免费用,同时支持接入DeepSeek、Kimi、GLM等第三方模型。乍一看这像是又一款CLI工具,但真正值得开发者花十分钟装上试的,是它对两个顽疾的正面回应——长会话健忘和Agent跑偏。
记忆:AI编程最让人崩溃的那个Bug
用Claude Code或者Cursor跑过复杂项目的开发者都有过这种体验:改到第20个文件的时候,模型突然问你这函数原来叫什么名字。会话上下文里明明有,但它就是"忘了"。这不是个别现象,而是当前所有上下文窗口方案的通病——你把信息塞进prompt里,模型在处理后续token时,早期内容的注意力权重被稀释了。
持久记忆不是新概念,但落地方式决定生死
MiMo Code的做法是给每个项目挂一套独立的记忆系统。项目记忆负责跨会话保存项目级配置和架构信息,会话检查点定时快照当前状态,任务进度追踪每个子任务的完成情况。三者协同工作,模型在任何时候都能"回想起"它五分钟前干了什么。具体的工程实现是独立subagent自动保存状态——后台跑一个轻量子进程,负责监听主Agent的操作日志并落盘,不需要用户手动触发。
/dream命令:让AI在空闲时整理记忆
MiMo Code内置了一个叫/dream的命令。它做的事情是:当Agent处于空闲状态时,系统会自动整理和压缩记忆碎片,把零散的检查点合并成结构化的项目知识库。每7天执行一次全量合并。这个设计背后是一个产品判断——长上下文不该靠"塞更多token"解决,而该靠"让AI自己消化旧信息"。和传统RAG不同的是,dream是写入而非检索。
Compose模式:让模型和Agent协同进化
如果说记忆系统解决的是"不忘事",那Compose模式瞄准的就是"不跑偏"。这可能是MiMo Code最值得拆解的设计。
协同优化的核心逻辑
传统Agent的工作流是线性的:模型生成代码→执行→报错→反馈给模型→再生成。模型和Agent之间是单向的指令关系。Compose模式把这个关系改成了双向:Agent的执行结果不只反馈给当前模型,还会反向训练模型的决策偏好。模型在这个过程中"学到"什么样的代码路径在该项目里是更优的,后续生成时会主动倾向这些路径。
跑分说明一切
Compose模式的实际效果体现在基准测试上。SWE-Bench Pro(衡量AI解决真实GitHub Issue能力的标准测试集)MiMo Code跑到62%,而同样使用MiMo-V2.5模型的Claude Code只有57%。Terminal Bench 2(终端操作能力测试)MiMo Code 73%,Claude Code 68%。5个百分点的差距在AI编程领域不算小,这背后是模型与Agent之间协同效率的实质性提升。
上手成本:比你想的低
对于一个刚发布V0.1.0的开源工具,MiMo Code的完成度已经超出了预期。
安装即用,中文友好
终端里一条命令安装,然后输入mimo进入交互界面。所有设置项都做了中文汉化,包括模型选择、记忆管理、Agent配置这些原本可能藏在一堆英文flag后面的选项。内置语音输入也支持中文识别。这不是简单的i18n翻译,而是把面向中文开发者的使用路径重新理了一遍。
模型自由度:不被一家绑死
MiMo-V2.5限时免费是个甜头,但真正的价值在于多模型接入。DeepSeek、Kimi、GLM、Claude、GPT这些主流模型都能在配置里直接切换。对于需要根据任务类型选模型的开发者来说,这意味着同一套工作流可以无缝对接不同底座,不用在Cursor、Continue、Cline之间反复横跳。
小米的AI野心:终端是入口,不是终局
把MiMo Code放在小米的整体战略里看,意图就很清晰了。终端是开发者最高频的入口,AI编程是当前模型能力最直接的试金石。
开源是姿态,更是数据飞轮
MIT协议意味着任何人都可以拿MiMo Code去改、去商用、去嵌入自己的产品线。这和某些大厂的开源策略形成鲜明对比——后者虽然也开源,但保留了大量商业限制。小米选择完全开放,赌的是生态:更多开发者使用→更多真实场景数据回流→模型和Agent协同优化效率更高→跑分继续领先→吸引更多开发者。这是经典的数据飞轮逻辑,而开源是启动它的最低成本方式。
V0.1.0意味着什么
0.1.0这个版本号值得注意。距离第一个稳定版还有很长的路要走,API兼容性、边界case处理、性能优化都有大量工作。但对于愿意吃螃蟹的开发者来说,现在正是最好的试水窗口——工具足够好用,方向足够清晰,社区还没形成路径依赖。等它跑到1.0的时候,你可能就是最早一批熟悉每个命令行参数的深度用户。

