谷歌(Google)今日宣布对Gemini API进行重大升级,核心亮点是全新的多模态检索增强生成(RAG)能力。这一更新允许开发者一次性上传超过10,000页的复杂文档、数小时的视频及海量图片,AI能以毫秒级的速度实现跨模态的信息检索与逻辑关联。
在功能演示中,谷歌展示了Gemini如何作为“AI联合数学家”,协助牛津大学教授成功解开了一个困扰数学界多年的群论悬案。AI不仅从成千上万篇历史论文中提取出关键线索,还主动通过视觉推理分析了复杂的几何结构图。谷歌表示,这种深度的多模态RAG能力将极大推动科学研究、法律案件分析及医疗影像诊断的效率。
此外,谷歌还为Gemini上线了全新的“AI搜索”增强功能,支持根据实时网页数据进行证据溯源。开发者现在可以通过更低的成本,让自己的应用具备谷歌搜索级别的知识实时性和精准度。谷歌此举进一步巩固了其在AI基础设施和长上下文处理领域的统治地位。

