即便最强的AI,在生物数据库面前也可能是个“路痴”。Anthropic最近的一项实验泼了盆冷水:他们让Claude、GPT-4、Biomni等一众明星科研智能体,去NCBI Virus里检索病毒序列数据。结果呢?没有一个能稳定达到构建可靠数据集所需的准确率。这结果直接挑战了“模型够强就行”的幻想。
问题出在哪儿?模型本身或许不差,但它所处的“数据环境”太恶劣了。当前的生物学数据基础设施,用一句话形容就是“各自为政”。数据库分散、格式五花八门、接口语言不通,整个系统就像一座没有统一标识的迷宫。AI智能体在软件领域能大展拳脚,是因为有GitHub、Stack Overflow这样标准清晰的“好路”;而在生物信息学的“野外”,它们空有导航能力却无路标可循。
解法已经找到:在AI模型和原始数据之间,加一层**确定性检索**工具。具体到这个研究里,就是一个名为**gget virus**的中间件。它的作用像翻译官兼导航仪,将自然语言的模糊查询,转化为数据库能绝对理解、结果100%可复现的精确指令。加上这层后,检索准确率飙升至近100%。研究结论很明确:想让AI智能体在科学领域可靠地工作,不光要训模型,更得先修好底层的“数据铁路”。生物数据库,得开始为智能体作为规模化用户而设计了。

