<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      谷歌深夜重磅開源!深度研究Agent拿下SOTA,比GPT-5 pro便宜90%

      0
      分享至


      智東西
      編譯 程茜
      編輯 心緣

      智東西12月12日消息,今日凌晨,比OpenAI早一個小時,谷歌甩出了3個Agent大招:

      Deep Research Agent功能更新,并首次向開發者開放;開源新網絡研究Agent基準DeepSearchQA,旨在測試Agent在網絡研究任務中的全面性;推出新交互API(Interactions API)


      Gemini Deep Research是一款專為長期上下文采集和綜合任務優化的Agent,其背后的模型是Gemini 3 Pro,通過多步強化學習的擴展搜索,Agent能夠自主地以高精度導航復雜的信息環境。此次更新包括針對特定數據進行網頁搜索、更低成本生成研究報告等。

      谷歌DeepMind產品經理路卡斯·哈斯(Lukas Haas)在社交平臺X上透露,新Gemini Deep Research Agent已經實現SOTA,在谷歌新基準測試上得分46.4%,在BrowseComp上與GPT-5 Pro相當,價格是其1/10左右


      Deep Research Agent很快將在谷歌搜索、筆記本、 谷歌金融中提供,并在Gemini應用中升級。

      DeepSearchQA內置了900個手工設計的“因果鏈”任務,涵蓋17個領域,可以評估Agent在復雜、需要多步查詢信息等任務上的能力。

      交互API作為其與Gemini模型和Agent的統一交互界面,通過Google AI Studio中的Gemini API公開測試版向開發者開放。開發者可以通過Agent開發套件(ADK)和A2A協議使用交互API。

      有網友評論,谷歌這是把“一個數字版的福爾摩斯交給了開發者”,現在你只需要一邊喝咖啡,一邊就能讓每個應用像寫論文一樣展開深度調查。


      DeepSearchQA開源地址:https://www.kaggle.com/benchmarks/google/dsqa/leaderboard

      一、Deep Research Agent:更新網頁搜索、低成本生成研究報告功能

      谷歌博客稱,Deep Research背后的Gemini 3 Pro模型是他們迄今為止最真實的模型,該模型經過專門訓練,旨在減少幻覺并最大化復雜任務中的報告質量。

      Deep Research通過迭代式流程運行,它會提出問題、閱讀結果、識別知識空白,然后再次進行搜索。其新版本大幅提升了網頁搜索功能,使其能夠深入網站查找特定數據。

      新Gemini Deep Research Agent在完整HLE測試中達到46.4%,Gemini 3 Pro為43.2%,GPT-5 Pro為38.9%。在DeepSearchQA、BrowseComp的測試中以微小優勢勝出。


      谷歌還優化了該Agent以更低成本生成深度研究報告的功能。

      Gemini Deep Research Agent已經在需要高精度和基于早期反饋、測試的復雜領域應用,包括金融服務、生物技術和市場調研等行業,這些領域都可以利用Gemini Deep Research完成初步調研任務。

      對于構建下一代自動化研究工具的開發者來說,Gemini Deep Research Agent能夠綜合信息并生成詳細報告:

      統一信息綜合:Gemini Deep Research通過文件上傳和文件搜索工具分析用戶的文檔和公共網絡數據,還能處理長上下文,允許用戶直接在提示中放置大量背景信息;

      報告可控性:用戶可以通過提示定義結構、頭部,或指定數據表生成和格式來控制輸出;

      詳細引用:其會提供細粒度的來源,允許用戶驗證數據來源;

      結構化輸出:支持JSON模式輸出,便于下游應用解析研究結果。

      二、DeepSearchQA:新Agent基礎,涵蓋17大領域、900條任務

      DeepSearchQA是Deep Research Agent的測試基準。

      現有基準測試往往無法反映現實世界多步網絡研究的復雜性,谷歌開源新基準DeepSearchQA,是用于評估Agent在復雜、需要多步查詢信息等任務上。

      DeepSearchQA有900個手工設計的“因果鏈”任務,涵蓋17個領域,每一步都依賴于事先分析。與傳統的基于事實的測試不同,DeepSearchQA衡量的是全面性,要求Agent生成詳盡的答案集。這不僅評估研究的準確性,也包括檢索的記憶能力。

      DeepSearchQA還可以作為衡量“思考時長”效率的工具。谷歌在內部評估中發現,當允許Agent執行更多搜索與推理步驟時,其性能會獲得顯著提升


      三、交互API:集成專為Agent應用開發設計的接口

      交互API原生集成了一套專屬接口,該接口專為Agent應用開發場景設計,可高效處理交錯式消息、思維鏈、工具調用及其狀態信息的復雜上下文管理工作。除Gemini模型套件外,交互API還提供其首個內置Agent Gemini Deep Research Agent

      下一步,谷歌將擴展其內置Agent,并提供構建和引入其他Agent的功能,這將使開發者能夠通過一個API連接Gemini模型、谷歌內置Agent和開發者的定制Agent

      交互API提供了一個單一的RESTful端點,用于與模型和Agent交互。

      通過指定模型參數與模型交互:


      通過指定Agent參數與Agent互動,目前支持deep-research-pro-preview-12-2025:


      交互API通過現代Agent應用所需的功能擴展了生成內容的核心功能,包括:

      可選的服務器端狀態:能夠將歷史管理卸載到服務器。這簡化了開發者的客戶端代碼,減少了上下文管理錯誤,并通過增加緩存命中率可能降低成本。

      可解釋和可組合的數據模型:一個為復雜的Agent歷史設計的干凈圖式。開發者可以對交錯的信息、思維、工具及其結果進行調試、流式分析和推理。

      背景執行:能夠將長期運行的推理環路卸載到服務器,而無需維護客戶端連接。

      遠程MCP工具支持:模型可以直接調用模型上下文協議(MCP)服務器作為工具。

      結語:Gemini生態再擴容,谷歌簡化Agent開發模式

      目前,Deep Research Agent已經在金融、科學研究等諸多領域有所應用。此次谷歌不僅更新了這一Agent,還發布了交互API,以簡化與Gemini模型和Agent的交互流程,構建更易用的開發生態。

      谷歌博客提到,其未來的更新還將聚焦于更豐富的輸出,如原生生成圖表以支持可視化分析報告,以及通過模型上下文協議(MCP)支持擴展連接性,更輕松地訪問自定義數據源,并努力將Gemini Deep Research引入企業用的Vertex AI。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      成都女生家中遇害案一審將宣判,家屬:她有預謀沖進我家里行兇,精神病不是免死金牌

      成都女生家中遇害案一審將宣判,家屬:她有預謀沖進我家里行兇,精神病不是免死金牌

      瀟湘晨報
      2025-12-18 17:45:54
      U15國足開門黑!0-3不敵日本,柏驊峻烏龍助攻,2天后對韓國

      U15國足開門黑!0-3不敵日本,柏驊峻烏龍助攻,2天后對韓國

      奧拜爾
      2025-12-18 16:32:30
      大風追蹤|“智力殘疾女孩遭多次侵犯,父親為討說法不幸遇害”案新進展:維持死刑判決

      大風追蹤|“智力殘疾女孩遭多次侵犯,父親為討說法不幸遇害”案新進展:維持死刑判決

      大風新聞
      2025-12-18 18:06:06
      俄軍騎兵重現戰場,烏軍單日殲敵1730人

      俄軍騎兵重現戰場,烏軍單日殲敵1730人

      史政先鋒
      2025-12-17 21:01:32
      C羅電影首秀,加盟《速度與激情11》劇組

      C羅電影首秀,加盟《速度與激情11》劇組

      澎湃新聞
      2025-12-18 15:06:27
      鴻蒙系統居然不讓買甲流用藥!用戶憤怒吐槽后,華為客服光速道歉

      鴻蒙系統居然不讓買甲流用藥!用戶憤怒吐槽后,華為客服光速道歉

      回旋鏢
      2025-12-18 19:18:42
      姆巴佩獨造3球,年度65球比肩三大傳奇,皇馬3-2險勝魚腩晉級16強

      姆巴佩獨造3球,年度65球比肩三大傳奇,皇馬3-2險勝魚腩晉級16強

      釘釘陌上花開
      2025-12-18 05:57:26
      外交部回應美110億對臺軍售

      外交部回應美110億對臺軍售

      界面新聞
      2025-12-18 15:24:16
      王毅分別同柬埔寨、泰國外長通電話

      王毅分別同柬埔寨、泰國外長通電話

      新華社
      2025-12-18 19:30:04
      美國致67死撞機事故細節曝光!直升機飛行員及空管均有失誤

      美國致67死撞機事故細節曝光!直升機飛行員及空管均有失誤

      南方都市報
      2025-12-18 10:58:12
      笑噴!河南女生被南方室友催洗澡“發飆”:最近半年澡量超我十年

      笑噴!河南女生被南方室友催洗澡“發飆”:最近半年澡量超我十年

      行者聊官
      2025-12-18 10:06:02
      跳樓新娘遺書曝光:并不想死,提了5次錢,鄰居可憐,化妝師嚇哭

      跳樓新娘遺書曝光:并不想死,提了5次錢,鄰居可憐,化妝師嚇哭

      子芫伴你成長
      2025-12-15 23:46:24
      赴日外國游客突破3900萬人次再創歷史新高 中國游客影響有限

      赴日外國游客突破3900萬人次再創歷史新高 中國游客影響有限

      顫抖的熊貓
      2025-12-17 22:12:26
      張韶涵“裁員裁到大動脈”登熱搜,前發型師發文回應

      張韶涵“裁員裁到大動脈”登熱搜,前發型師發文回應

      紅星新聞
      2025-12-18 11:38:30
      轟炸機抵近東京,美國拒表態,日本承認波茨坦公告,求中國一件事

      轟炸機抵近東京,美國拒表態,日本承認波茨坦公告,求中國一件事

      梁訊
      2025-12-18 10:38:01
      杭州剛提新車就撞人后續:疑似被撞銷售不幸身亡,涉事司機麻煩了

      杭州剛提新車就撞人后續:疑似被撞銷售不幸身亡,涉事司機麻煩了

      漢史趣聞
      2025-12-18 11:38:12
      好利來大公子穿女裝惹爭議!化妝做美甲自稱"妹妹",被罵到關賬號

      好利來大公子穿女裝惹爭議!化妝做美甲自稱"妹妹",被罵到關賬號

      派大星紀錄片
      2025-12-18 12:14:15
      澤連斯基還是跪了,其實結果早已注定

      澤連斯基還是跪了,其實結果早已注定

      阿爾法34號
      2025-12-18 09:05:34
      臺灣超越日本,成為亞洲首富

      臺灣超越日本,成為亞洲首富

      深度報
      2025-12-17 23:01:35
      全國統一判:“爛尾樓”購房者可解除合同,不再支付按揭貸款,由開發商兜底!

      全國統一判:“爛尾樓”購房者可解除合同,不再支付按揭貸款,由開發商兜底!

      微法官
      2025-10-15 08:06:34
      2025-12-18 20:16:49
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務產業升級。
      10934文章數 116929關注度
      往期回顧 全部

      科技要聞

      2025新一代人工智能創業大賽

      頭條要聞

      智力殘疾女孩遭4人侵犯懷孕父親討說法遇害 后續來了

      頭條要聞

      智力殘疾女孩遭4人侵犯懷孕父親討說法遇害 后續來了

      體育要聞

      巴黎首奪世界級冠軍 加冕6冠王比肩巴薩拜仁

      娛樂要聞

      絲芭放大招了!實名舉報鞠婧祎經濟犯罪

      財經要聞

      尹艷林:呼吁加快2.5億新市民落戶進程

      汽車要聞

      在零下30℃的考場里 凡爾賽C5 X和508L拿到了"穩"的證明

      態度原創

      藝術
      親子
      健康
      手機
      公開課

      藝術要聞

      卡洛斯·杜蘭:不只是薩金特的老師!

      親子要聞

      長沙市托育綜合服務中心正式揭牌啟用

      這些新療法,讓化療不再那么痛苦

      手機要聞

      小屏機遇冷,消息稱2026年有兩家母系品牌計劃新增大屏旗艦機

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品无码av无码| 延川县| 色无码日韩无码精品| 国产亚洲精品久久777777| 超碰aⅴ人人做人人爽欧美| 亚洲国产一区二区三区| 第一福利在线视频| 无码中文字幕网| 国产99久60在线视频 | 传媒| 大香伊蕉在人线国产免费| 日本无码中文| 久久另类小说| 国产乱子伦精品免费无码专区| 久久久久人妻一区精品| 女同另类激情在线三区| 91在线综合| av色综合久久天堂av色综合在| 国产成人免费一区二区三区| 亚洲av产在线精品亚洲第一站| 国产va在线| 狠狠色综合网站久久久久久久| 后入内射无码人妻一区| 久久永久视频| 2025中文无码| 中文字幕精品无亚洲字幕| 欧美日本韩国亚洲| 久久一日本道色综合久久| 亚洲国产| 99热这里有精品| 狠狠躁18三区二区一区| 亚洲精品国产av成拍色拍个| 日本在线观看| 蜜桃av无码免费看永久| 亚洲国产成人久久综合| 国产成人无码A片免费看| 西盟| 99精品国产一区二区三区2021 | 国产AV中文字幕| 国产suv精品一区二区| 最近中文字幕在线中文视频| 中文字幕三区|