阿里这次把家底亮了一角——内部跑了好几年的向量数据库 Zvec 正式开源,pip install zvec 一行命令就能拉下来用。性能对标的是 Pinecone 每月 70 美元的付费档位,宣称能扛住十亿级向量的毫秒级检索,而且不需要单独起服务进程,Linux、macOS、Windows 全平台通吃。最新 v0.5.0 版本还加上了原生全文混合搜索能力,等于把向量召回和关键词召回在同一套引擎里搞定。对正在做 RAG 或者语义搜索的团队来说,省掉的不是一个月几十美元,而是一整套额外基础设施的运维心智。Zvec 刚起步,生态和文档还在补,但"免费生产级"这四个字本身就是最大的吸引力。
同一条线索里,UCSD 黄碧薇教授抛出了一个相当大胆的 AI 范式演进框架。她把过去十几年的 AI 发展切成了四代:相关性小模型(统计学习时代)→ 因果小模型(贝叶斯网络、结构因果模型)→ 相关性大模型,也就是当前以 LLM 为主力的阶段 → 因果大模型。她认为行业正站在第四代门槛上。黄碧薇本人是开源因果发现库 causal-learn 的作者,这套工具在学术圈几乎是做因果推断的默认起点。围绕第四代范式,她创立的 Aether AI 已经完成首轮融资,方向很有意思——从视频数据中自动抽取物理规律,本质上是在让机器"看懂"牛顿定律级别的世界运行规则,而不是停留在统计相关性。
把这两件事放在一起看,一条隐线浮出来:检索基础设施在变便宜、变轻量,AI 的认知范式却在向更重的因果推理迁移。前者解决的是工程成本,后者押注的是模型能不能真正"理解"而非"记忆"。开源 Zvec 让更多人能低成本搭起 RAG 管道,而 Aether AI 探索的因果大模型,可能决定这些管道里流过的到底是真知还是幻觉。工具和范式,两条线同时在跑。

