当前位置：首页 > news >正文

对抗 OpenAI GPT-5.2：谷歌祭出 Gemini Deep Research 深度研究智能体并首次向开发者开放，DeepSearchQA 因果链测试基准重磅开源

news 2026/7/3 20:36:52

在 OpenAI 发布 GPT-5.2 之后，谷歌紧接着就推出了更强大的 Gemini Deep Research 深度研究智能体，同时推出全新交互 API（Interactions API）并藉此首次面向开发者开放。

12 月 12 日消息，在 OpenAI 发布 GPT-5.2 之后，谷歌紧接着就推出了更强大的 Gemini Deep Research 深度研究智能体，同时推出全新交互 API（Interactions API）并藉此首次面向开发者开放。

此外，谷歌还开源了全新的深度搜索评估基准 DeepSearchQA，用于衡量多步骤复杂检索任务中的研究全面性。此次升级标志着 AI 自主研究能力正式进入工业化应用阶段。

Gemini Deep Research 基于 Gemini 3 Pro 构建，专为长周期的内容收集与综合任务优化，幻觉率降低 40%，是谷歌迄今“最具事实性”的模型，并可通过专项训练提升复杂任务中的报告质量。谷歌表示，通过扩展面向搜索的多步骤强化学习，该智能体能够在复杂信息环境中以更高精度自主导航。

谷歌 DeepMind 产品经理路卡斯・哈斯（Lukas Haas）在 X 上透露，Gemini Deep Research 已经实现 SOTA，在谷歌新基准测试上得分 46.4%，在 BrowseComp 上与 GPT-5 Pro 相当，但价格只有其 1/10 左右。

Deep Research 会反复规划研究路径，包括形成搜索查询、阅读结果、识别缺口并再次搜索。本次升级带来显著增强的网页搜索能力，使其能深入网站获取具体数据。

据介绍，该智能体在 Humanity's Last Exam (HLE 人类终极考试)、DeepSearchQA 及 BrowseComp 中取得最新最优成绩，并可在显著更低成本下生成深入研究报告。谷歌称，这项能力未来将应用到 Google Search、NotebookLM、Google Finance 及 Gemini App 之中。

DeepSearchQA：面向复杂研究智能体的全新评测基准

由于现有评测难以体现真实世界的多步骤研究复杂性，谷歌同步宣布开放 DeepSearchQA 数据集与工具。该基准包含跨 17 个领域、900 个“因果链”任务，每一步均依赖前序分析，要求智能体生成详尽答案集，从而衡量其研究精度与检索全面性。

谷歌表示，DeepSearchQA 还能作为“思考时间”效益的诊断工具。内部测试显示，让智能体执行更多搜索与推理步骤可显著提升表现，这部分将在未来版本中继续探索。

开发者可访问数据集、排行榜与 Colab 示例，并阅读数据集技术报告。

Deep Research 在实际领域的早期应用

谷歌称，Gemini Deep Research 已在需要高精度和上下文理解的多个行业中展现出显著效果，包括金融服务、生物技术和市场研究。

在金融行业，企业利用 Deep Research 自动化尽调中的早期信息收集环节，如整合市场信号、竞争格局与合规风险，从而提升研究效率。
在科研领域，Axiom Bio 使用该智能体处理药物毒性预测相关的文献分析，获得更高的研究深度与颗粒度，加速药物开发流程。

开发者能力：文件解析、结构化输出、引用管理

通过 Interactions API，开发者可调用 Gemini Deep Research 构建下一代自动化研究工具，主要特性包括：

统一信息综合：整合上传文件（PDF、CSV 等）和公共网页数据，并能处理大上下文量。
可控报告结构：可通过提示词定义输出结构、标题、表格格式等。
精细引用：为报告中各项事实提供细粒度来源。
结构化输出：支持 JSON schema 以便下游处理。

Interactions API

开发者可通过 Google AI Studio 的 Gemini API Key 使用 Interactions API 构建应用。

谷歌表示，未来更新将加入原生图表输出、扩展 Model Context Protocol（MCP）支持以接入更多自定义数据源，并在企业服务平台 Vertex AI 上提供 Deep Research。

如果你想更深入地学习大模型，以下是一些非常有价值的学习资源，这些资源将帮助你从不同角度学习大模型，提升你的实践能力。

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获取

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获取

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

因篇幅有限，仅展示部分资料，需要点击文章最下方名片即可前往获取

四、AI大模型商业化落地方案

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

http://www.cnnetsun.cn/news/15946.html

相关文章：

简单上手的完整智能家居平台搭建指南

Linux 文件及用户的一些日常命令

中央空调科普：从选型到维护全攻略，舒适生活的 “温度管家”

3分钟极速部署：MuseScore跨平台音乐创作工具高效配置指南

刚刚，DeepSeek又一重大突破，小身材大智慧玩出新高度

计算广告：智能时代的营销科学与实践（八）

AI帮你做跨境！DeepBI助力亚马逊广告新手卖家实现质的飞跃

LCD字模工具终极对比：3款神器如何选择？

终极收藏版：2025年最值得合作的GEO公司推荐，技术实力大揭秘！

QARM：多模态语义对齐与量化在推荐系统中的实践路径

AI 省钱双 buff：价格优化 + 优惠整合，省到实处

用1/10的成本跑RAG？向量压缩+模型蒸馏+智能缓存实战指南

毕业设计实战：基于SpringBoot+MySQL的机动车号牌管理系统，从0到1避坑全流程，导师都说稳！

高密度互联：连接AI“积木”的精密桥梁

2025十大项目管理工具揭晓：从轻量协作到企业级方案全解析

26Java基础之特殊文本文件、日志技术

AI投喂Geo优化系统哪家经验丰富？深度解析行业领先服务商

专业的煤矿水仓清淤公司

GPT-5.2 的数据基石、原生多模态与隐私承诺

16、Lotus Domino 6在Linux系统中的数据备份与安全保障

Hikari-LLVM15终极指南：5个实战场景掌握代码混淆技术

如何快速解决OpenVLA模型微调后推理中的动作归一化问题

故障注入测试：构建高韧性系统的工程实践

WinSetView终极指南：如何快速统一Windows文件夹视图设置

ImageGPT技术解析：像素序列预测如何重构视觉AI底层架构

Beyond Compare 5 密钥生成完整指南：从原理到实战应用

手艺人札记：在开源系统中重塑技术的温度

5种方法彻底解决番茄小说离线下载难题

史诗级漏洞警报：ASP.NET Core 被曝 CVSS 9.9 分漏洞，几乎所有.NET 版本无一幸免！