專題：政策定調(diào)夯實(shí)A股長(zhǎng)期運(yùn)行基礎(chǔ) 未來(lái)方向看科技成長(zhǎng)

　　來(lái)源：智東西

　　智東西12月12日消息，今日凌晨，比OpenAI早一個(gè)小時(shí)，谷歌甩出了3個(gè)Agent大招：

　　Deep Research Agent功能更新，并首次向開(kāi)發(fā)者開(kāi)放；開(kāi)源新網(wǎng)絡(luò)研究Agent基準(zhǔn)DeepSearchQA，旨在測(cè)試Agent在網(wǎng)絡(luò)研究任務(wù)中的全面性；推出新交互API（Interactions API）。

　　Gemini Deep Research是一款專為長(zhǎng)期上下文采集和綜合任務(wù)優(yōu)化的Agent，其背后的模型是Gemini 3 Pro，通過(guò)多步強(qiáng)化學(xué)習(xí)的擴(kuò)展搜索，Agent能夠自主地以高精度導(dǎo)航復(fù)雜的信息環(huán)境。此次更新包括針對(duì)特定數(shù)據(jù)進(jìn)行網(wǎng)頁(yè)搜索、更低成本生成研究報(bào)告等。

　　谷歌DeepMind產(chǎn)品經(jīng)理路卡斯·哈斯（Lukas Haas）在社交平臺(tái)X上透露，新Gemini Deep Research Agent已經(jīng)實(shí)現(xiàn)SOTA，在谷歌新基準(zhǔn)測(cè)試上得分46.4%，在BrowseComp上與GPT-5 Pro相當(dāng)，價(jià)格是其1/10左右。

　　Deep Research Agent很快將在谷歌搜索、筆記本、谷歌金融中提供，并在Gemini應(yīng)用中升級(jí)。

　　DeepSearchQA內(nèi)置了900個(gè)手工設(shè)計(jì)的“因果鏈”任務(wù)，涵蓋17個(gè)領(lǐng)域，可以評(píng)估Agent在復(fù)雜、需要多步查詢信息等任務(wù)上的能力。

　　交互API作為其與Gemini模型和Agent的統(tǒng)一交互界面，通過(guò)Google AI Studio中的Gemini API公開(kāi)測(cè)試版向開(kāi)發(fā)者開(kāi)放。開(kāi)發(fā)者可以通過(guò)Agent開(kāi)發(fā)套件（ADK）和A2A協(xié)議使用交互API。

　　有網(wǎng)友評(píng)論，谷歌這是把“一個(gè)數(shù)字版的福爾摩斯交給了開(kāi)發(fā)者”，現(xiàn)在你只需要一邊喝咖啡，一邊就能讓每個(gè)應(yīng)用像寫論文一樣展開(kāi)深度調(diào)查。

　　DeepSearchQA開(kāi)源地址：https：//www.kaggle.com/benchmarks/google/dsqa/leaderboard

　　一、Deep Research Agent：更新網(wǎng)頁(yè)搜索、低成本生成研究報(bào)告功能

　　谷歌博客稱，Deep Research背后的Gemini 3 Pro模型是他們迄今為止最真實(shí)的模型，該模型經(jīng)過(guò)專門訓(xùn)練，旨在減少幻覺(jué)并最大化復(fù)雜任務(wù)中的報(bào)告質(zhì)量。

　　Deep Research通過(guò)迭代式流程運(yùn)行，它會(huì)提出問(wèn)題、閱讀結(jié)果、識(shí)別知識(shí)空白，然后再次進(jìn)行搜索。其新版本大幅提升了網(wǎng)頁(yè)搜索功能，使其能夠深入網(wǎng)站查找特定數(shù)據(jù)。

　　新Gemini Deep Research Agent在完整HLE測(cè)試中達(dá)到46.4%，Gemini 3 Pro為43.2%，GPT-5 Pro為38.9%。在DeepSearchQA、BrowseComp的測(cè)試中以微小優(yōu)勢(shì)勝出。

　　谷歌還優(yōu)化了該Agent以更低成本生成深度研究報(bào)告的功能。

　　Gemini Deep Research Agent已經(jīng)在需要高精度和基于早期反饋、測(cè)試的復(fù)雜領(lǐng)域應(yīng)用，包括金融服務(wù)、生物技術(shù)和市場(chǎng)調(diào)研等行業(yè)，這些領(lǐng)域都可以利用Gemini Deep Research完成初步調(diào)研任務(wù)。

　　對(duì)于構(gòu)建下一代自動(dòng)化研究工具的開(kāi)發(fā)者來(lái)說(shuō)，Gemini Deep Research Agent能夠綜合信息并生成詳細(xì)報(bào)告：

　　統(tǒng)一信息綜合：Gemini Deep Research通過(guò)文件上傳和文件搜索工具分析用戶的文檔和公共網(wǎng)絡(luò)數(shù)據(jù)，還能處理長(zhǎng)上下文，允許用戶直接在提示中放置大量背景信息；

　　報(bào)告可控性：用戶可以通過(guò)提示定義結(jié)構(gòu)、頭部，或指定數(shù)據(jù)表生成和格式來(lái)控制輸出；

　　詳細(xì)引用：其會(huì)提供細(xì)粒度的來(lái)源，允許用戶驗(yàn)證數(shù)據(jù)來(lái)源；

　　結(jié)構(gòu)化輸出：支持JSON模式輸出，便于下游應(yīng)用解析研究結(jié)果。

　　二、DeepSearchQA：新Agent基礎(chǔ)，涵蓋17大領(lǐng)域、900條任務(wù)

　　DeepSearchQA是Deep Research Agent的測(cè)試基準(zhǔn)。

　　現(xiàn)有基準(zhǔn)測(cè)試往往無(wú)法反映現(xiàn)實(shí)世界多步網(wǎng)絡(luò)研究的復(fù)雜性，谷歌開(kāi)源新基準(zhǔn)DeepSearchQA，是用于評(píng)估Agent在復(fù)雜、需要多步查詢信息等任務(wù)上。

　　DeepSearchQA有900個(gè)手工設(shè)計(jì)的“因果鏈”任務(wù)，涵蓋17個(gè)領(lǐng)域，每一步都依賴于事先分析。與傳統(tǒng)的基于事實(shí)的測(cè)試不同，DeepSearchQA衡量的是全面性，要求Agent生成詳盡的答案集。這不僅評(píng)估研究的準(zhǔn)確性，也包括檢索的記憶能力。

　　DeepSearchQA還可以作為衡量“思考時(shí)長(zhǎng)”效率的工具。谷歌在內(nèi)部評(píng)估中發(fā)現(xiàn)，當(dāng)允許Agent執(zhí)行更多搜索與推理步驟時(shí)，其性能會(huì)獲得顯著提升。

　　三、交互API：集成專為Agent應(yīng)用開(kāi)發(fā)設(shè)計(jì)的接口

　　交互API原生集成了一套專屬接口，該接口專為Agent應(yīng)用開(kāi)發(fā)場(chǎng)景設(shè)計(jì)，可高效處理交錯(cuò)式消息、思維鏈、工具調(diào)用及其狀態(tài)信息的復(fù)雜上下文管理工作。除Gemini模型套件外，交互API還提供其首個(gè)內(nèi)置Agent Gemini Deep Research Agent。

　　下一步，谷歌將擴(kuò)展其內(nèi)置Agent，并提供構(gòu)建和引入其他Agent的功能，這將使開(kāi)發(fā)者能夠通過(guò)一個(gè)API連接Gemini模型、谷歌內(nèi)置Agent和開(kāi)發(fā)者的定制Agent。

　　交互API提供了一個(gè)單一的RESTful端點(diǎn)，用于與模型和Agent交互。

　　通過(guò)指定模型參數(shù)與模型交互：

　　通過(guò)指定Agent參數(shù)與Agent互動(dòng)，目前支持deep-research-pro-preview-12-2025：

　　交互API通過(guò)現(xiàn)代Agent應(yīng)用所需的功能擴(kuò)展了生成內(nèi)容的核心功能，包括：

　　可選的服務(wù)器端狀態(tài)：能夠?qū)v史管理卸載到服務(wù)器。這簡(jiǎn)化了開(kāi)發(fā)者的客戶端代碼，減少了上下文管理錯(cuò)誤，并通過(guò)增加緩存命中率可能降低成本。

　　可解釋和可組合的數(shù)據(jù)模型：一個(gè)為復(fù)雜的Agent歷史設(shè)計(jì)的干凈圖式。開(kāi)發(fā)者可以對(duì)交錯(cuò)的信息、思維、工具及其結(jié)果進(jìn)行調(diào)試、流式分析和推理。

　　背景執(zhí)行：能夠?qū)㈤L(zhǎng)期運(yùn)行的推理環(huán)路卸載到服務(wù)器，而無(wú)需維護(hù)客戶端連接。

　　遠(yuǎn)程MCP工具支持：模型可以直接調(diào)用模型上下文協(xié)議（MCP）服務(wù)器作為工具。

　　結(jié)語(yǔ)：Gemini生態(tài)再擴(kuò)容，谷歌簡(jiǎn)化Agent開(kāi)發(fā)模式

　　目前，Deep Research Agent已經(jīng)在金融、科學(xué)研究等諸多領(lǐng)域有所應(yīng)用。此次谷歌不僅更新了這一Agent，還發(fā)布了交互API，以簡(jiǎn)化與Gemini模型和Agent的交互流程，構(gòu)建更易用的開(kāi)發(fā)生態(tài)。

　　谷歌博客提到，其未來(lái)的更新還將聚焦于更豐富的輸出，如原生生成圖表以支持可視化分析報(bào)告，以及通過(guò)模型上下文協(xié)議（MCP）支持?jǐn)U展連接性，更輕松地訪問(wèn)自定義數(shù)據(jù)源，并努力將Gemini Deep Research引入企業(yè)用的Vertex AI。

伊人六月,97自拍超碰,久久精品亚洲7777影院,五月婷婷综合在线观看,日本亚洲欧洲无免费码在线,2019国产精品视频,国产精品第一页在线

谷歌深夜重磅開(kāi)源！深度研究Agent拿下SOTA，比GPT-5 pro便宜90%

一年度療程后平均減重達(dá)28.7%！禮來(lái)的新一代減肥藥表現(xiàn)驚人，療效遠(yuǎn)超同類藥物

12月12日熱門中概股漲跌不一貝殼漲3.00%，BOSS直聘跌3.34%

觀點(diǎn)綜述：美聯(lián)儲(chǔ)可能兩年都不降息資金成本太低助長(zhǎng)市場(chǎng)冒險(xiǎn)

12月12日收盤：美股漲跌不一道指創(chuàng)歷史新高甲骨文拖累納指收跌

美參議院否決兩項(xiàng)醫(yī)保法案奧巴馬醫(yī)改補(bǔ)貼或于年底到期

Waymo召回?cái)?shù)千輛自動(dòng)駕駛汽車

挪威國(guó)家石油公司剛剛發(fā)現(xiàn)數(shù)億桶新增儲(chǔ)量

愛(ài)爾康遭遇自八月以來(lái)首次看空評(píng)級(jí)

紐約匯市：美元繼續(xù)下跌瑞郎領(lǐng)漲

谷歌深夜重磅開(kāi)源！深度研究Agent拿下SOTA，比GPT-5 pro便宜90%

谷歌深夜重磅開(kāi)源！深度研究Agent拿下SOTA，比GPT-5 pro便宜90%