品玩5月11日讯,据 The Coders Blog 报道,Google宣布升级Gemini API,正式推出支持多模态的文件搜索功能。
该服务旨在打破数据孤岛,通过Gemini Embedding 2模型实现文本与图像的语义统一索引,彻底改变传统检索增强生成(RAG)的开发模式。
新功能允许开发者将PDF、图片等多种格式文件上传至统一存储库,系统自动进行智能分块与向量化处理。其核心优势在于支持跨模态查询,例如根据图表内容检索相关文档,并提供页级引用以增强结果的可验证性与可信度。此举显著降低了构建复杂多模态应用的门槛。