<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

^{<blockquote id="adngt"></blockquote>}

<sup id="adngt"></sup>

網(wǎng)易首頁

網(wǎng)易新聞
網(wǎng)易公開課
網(wǎng)易紅彩
網(wǎng)易嚴選
郵箱大師
網(wǎng)易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網(wǎng)易官方手機郵箱應用

移動端
網(wǎng)易公開課
網(wǎng)易嚴選
支付
郵箱

網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

0.002美元撬動頂級研究力，開源AI助手匹敵OpenAI商用系統(tǒng)

2025-12-31 14:42:58　來源: DeepTech深科技

北京舉報

0

分享至

近日，美國華盛頓大學博士生邵如琳和合作團隊打造出一個名為 Deep Research Tulu（DR Tulu）的深度研究小助手。使用一次 OpenAI 的 Deep Research 服務可能需要大約 1.8 美元，而 DR Tulu 使用一次的成本卻不到 0.002 美元，這幾乎是千倍的效率提升，這意味著未來個人或者小團隊也能負擔得起高質(zhì)量、高可信度的 AI 研究服務。

DR Tulu 是一個擁有超級大腦且會熟練使用搜索引擎的科研助手。當你問它一個問題時，它不會只是簡單地給你一列網(wǎng)頁鏈接，而是會像一位真正的研究員那樣，先去思考如何解決你的問題，然后主動查找各種資料比如網(wǎng)頁和論文，最終為你整理出一份條理清晰、有根有據(jù)、帶著詳細出處說明的長篇答案。

（來源：資料圖）

DR Tulu 的表現(xiàn)大幅超越了所有其他公開可用的、專為搜索設計的 AI 模型，包括一些體型比它大的模型，證明了“小模型+好方法”也能做出大成就。

它的表現(xiàn)匹敵甚至超越了 OpenAI、Google 等公司的頂級商用深度研究系統(tǒng)，比如 OpenAI 的 Deep Research、谷歌的 Gemini Pro + Search。要知道，這些系統(tǒng)背后的技術往往不公開，而且使用成本非常高昂。

同時，DR Tulu 會坦誠地承認自己的知識邊界，并主動查找和核實信息，從而盡可能減少回答中的"幻覺"。DR Tulu 還會在回答中提供詳細的文獻依據(jù)，方便用戶交叉驗證。目前業(yè)界尚無成熟的訓練方法和數(shù)據(jù)來實現(xiàn)這一目標。DR Tulu 的這些能力源于一項新型訓練方法及其配套框架，使 AI 與評估器在訓練過程中協(xié)同進化、相互提升。

圖 | 邵如琳（來源：邵如琳）

為了讓 DR Tulu 成為一個優(yōu)秀的研究員，研究人員并沒有簡單地把它丟進一堆問題里去死記硬背，而是像訓練一位聰明的學徒以分為兩步走：

第一步是名師出高徒，研究人員請來幾位非常厲害的 AI 老師比如 GPT-5。這些老師本身就擅長查找資料和回答問題。研究人員讓 AI 老師們在回答成千上萬個問題的過程中，把它們?nèi)绾嗡伎肌⑷绾嗡阉鳌⑷绾谓M織答案的每一步都記錄下來。這些記錄下來的標準答案步驟，成為了 DR Tulu 學習的第一手教材。通過模仿這些步驟，DR Tulu 學會了當一名研究員的基本功。

第二步是在實戰(zhàn)中進化，光會模仿還不夠，為了讓它變得更強大，研究人員發(fā)明了一個名為帶有進化評分標準的強化學習的方法。

傳統(tǒng)方法就像老師拿著一份固定的評分表，用它來給學生的作業(yè)打分。學生可能會為了得高分，投機取巧地滿足這些死板的條目，而忽略了真正的理解和創(chuàng)造。

研究人員發(fā)現(xiàn)，AI 在回答復雜問題的時候，好壞標準很難用幾張固定的評分表說清楚。于是，他們讓評分標準也跟著 AI 的學習一起進化。

具體來說，在訓練中 DR Tulu 會試著回答很多問題，并能得到多個版本的答案。然后，另一個 AI 也就是評分官會仔細對比這些答案，動態(tài)地發(fā)現(xiàn)新的優(yōu)點和缺點，并把它們作為新的評分標準。

這樣，評分標準就會越來越貼近 AI 當前的真實水平，能更好地鑒別出高質(zhì)量的回答。同時，這些標準總是基于最新搜索到的真實知識，而不是 AI 自己想象出來的內(nèi)容。這樣一來，DR Tulu 就能在不斷的挑戰(zhàn)和反饋中持續(xù)進步，學會搜索以及通過綜合信息來給出可靠的答案。

（來源：資料圖）

研究人員在四個涵蓋學術、醫(yī)療等領域的現(xiàn)有 Deep Research 基準上測試了 DR Tulu 的表現(xiàn)。結(jié)果顯示，DR Tulu 達到了當前最優(yōu)水平（SOTA），與市面上表現(xiàn)最佳的 OpenAI Deep Research 相當，而成本僅為其千分之一。

（來源：資料圖）

為了檢驗 DR Tulu 解決現(xiàn)實世界難題的能力，研究人員設計了一個新挑戰(zhàn)：分析致病基因變異。這是一個非常專業(yè)的醫(yī)學遺傳學問題，需要從海量的科學論文和數(shù)據(jù)庫中查找信息，判斷一個特定的基因變異如何導致疾病，以及它是否適合采用某些前沿的治療方法比如基因療法。

為此，研究人員創(chuàng)建了包含 47 個此類問題的基因疾病問答數(shù)據(jù)集。DR Tulu 在這個它從未專門學習過的領域，表現(xiàn)出了較強的泛化能力即解決新問題的能力。它不僅能夠找到相關的科學證據(jù)，還能將這些證據(jù)組織起來進行比較和綜合，清晰地解釋變異的致病機理。

雖然在最終答案上的準確性上略遜于使用最強商用大模型的系統(tǒng)，但是在證據(jù)支持方面 DR Tulu 做得較為出色。對于專業(yè)用戶比如醫(yī)學用戶來說，這比一個看似正確但無法驗證的簡單答案更有價值，因為他們可以依據(jù) DR Tulu 提供的詳細引文去追溯和核實。

另據(jù)悉，研究人員針對 DR Tulu 進行了完全開放：訓練代碼、數(shù)據(jù)、模型參數(shù)等目前已經(jīng)全部公開。

參考資料：

代碼鏈接：https://github.com/rlresearch/dr-tulu

數(shù)據(jù)及模型鏈接：https://huggingface.co/collections/rl-research/dr-tulu

https://arxiv.org/abs/2511.19399

運營/排版：何晨龍

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

2025年AI十大事件：DeepSeek開源炸場，谷歌絕地反擊，獨角獸扎堆IPO

智東西 2025-12-31 19:58:09
0 跟貼 0
馬斯克加碼xAI算力：收購新大樓，沖刺2吉瓦訓練規(guī)模

智東西 2025-12-31 19:15:14
0 跟貼 0

曝OpenAI首款硬件是“一支筆”，已有原型，富士康代工

智東西 2025-12-31 14:52:12
0 跟貼 0

年終特稿｜被AI泥漿浸泡的一年

澎湃新聞 2025-12-31 07:18:30
194 跟貼 194
格斗冠軍機器人突然發(fā)瘋！嚇呆研究人員

量子位 2025-07-25 09:10:58
0 跟貼 0

模型不用微調(diào)，靠上下文就能自我進化？

機器之心Pro 2025-10-11 20:20:59
0 跟貼 0

「視頻世界模型」新突破：AI連續(xù)生成5分鐘，畫面也不崩

機器之心Pro 2025-12-31 17:54:21
0 跟貼 0
為什么Manus沒有留在中國？

鈦媒體APP 2025-12-31 19:37:50
0 跟貼 0

3個中國小伙創(chuàng)立的AI公司被扎克伯格140億元買下

每日經(jīng)濟新聞 2025-12-31 07:30:08
0 跟貼 0
大模型也會賭博上癮！理智出走！

量子位 2025-11-03 07:06:08
0 跟貼 0
機器人終于有自己的真機評測大考了

量子位 2025-10-15 20:05:44
0 跟貼 0
2025年真正的頂流！通用機器人的路，鋪滿了開源數(shù)據(jù)集

機器之心Pro 2025-12-29 17:58:28
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰(zhàn)真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
未來醫(yī)生摘得全球第一，臨床安全有效性評估新基準

量子位 2025-11-19 11:14:03
0 跟貼 0
稚暉君重磅發(fā)布，上緯新材首款“個人機器人”來了！身高約80厘米，小到能塞進書包

每日經(jīng)濟新聞 2025-12-31 19:30:08
0 跟貼 0
李飛飛發(fā)起機器人家務挑戰(zhàn)賽，老黃第一時間批錢贊助

量子位 2025-10-13 09:30:54
0 跟貼 0
機器人管家Figure 03來了，承包一切家務！

量子位 2025-10-11 10:13:00
0 跟貼 0
五八智能四足機器人平臺Q20A 不止跑跳整活還能維護公共安全

量子位 2025-09-30 10:01:00
0 跟貼 0
靈巧手作為獨立執(zhí)行平臺，實現(xiàn)工業(yè)與家庭場景應用

量子位 2025-12-11 03:38:13
0 跟貼 0
五八智能四足機器人平臺Q20A，適用于千行百業(yè)

量子位 2025-09-30 15:35:41
0 跟貼 0
財大氣粗的老黃繼續(xù)出手！20多億美金收購以色列AI初創(chuàng)公司

量子位 2025-12-31 15:47:00
0 跟貼 0
DeepMind負責人：2036 AI意識覺醒？LeCun怒懟：LLM路線全錯！

新智元 2025-12-16 16:55:25
0 跟貼 0
下一代谷歌頭顯，XREAL x Google 定義混合現(xiàn)實頭顯

愛范兒 2025-12-10 05:12:08
0 跟貼 0
黃仁勛：中國的AI市場無論有沒有英偉達都會進步與華為是競爭對手不是敵人

財聯(lián)社 2025-07-21 10:22:14
7 跟貼 7
美股三大指數(shù)收盤均小幅下跌，大型科技股漲跌不一

界面新聞 2025-12-31 06:53:54
0 跟貼 0
美國ITC正式對DRAM設備及其下游產(chǎn)品和組件啟動337調(diào)查，三星、谷歌等為列名被告

界面新聞 2025-12-30 16:13:21
0 跟貼 0
鋼管鍛造打孔技術

孑孑動漫 2025-12-29 19:50:22
1 跟貼 1
智能機器人守門員，百分百的防守，梅西都束手無策！

呆醬愛搞笑 2025-12-30 01:01:00
0 跟貼 0
微信辟謠“年底兩天微信支付不能使用”

新京報 2025-12-31 12:25:11
1273 跟貼 1273
采訪中問留守兒童“為什么不吃肉”，被解讀為“何不食肉糜”，魯豫回應惡評和偏見

觀威海 2025-12-31 09:30:04
1283 跟貼 1283
其實重點不是遙控，很多人噴遙控，而是他走路自然多了！

西紅柿爆笑菌 2025-12-30 00:46:25
0 跟貼 0
網(wǎng)吧進化神速，網(wǎng)友驚嘆：這變化太驚人了！

心在跳動n 2025-12-30 05:40:23
1 跟貼 1
余承東：我有一個夢想馬路上的所有車里都有華為的技術

每日經(jīng)濟新聞 2025-07-23 17:06:16
310 跟貼 310
世界十大步槍，看看你的愛槍排名第幾。誰才是真正的王者？

開心奇異果 2025-12-27 16:47:14
0 跟貼 0
海底撈店員表演甩面時面條多次著地；海底撈從賠一根撈面改為一個月無限吃，最新回應

江西晨報 2025-12-31 09:39:22
959 跟貼 959
高手就是高手，這模型做的太仿真了，不服都不行啊

制造科技 2025-12-30 13:11:50
0 跟貼 0
軟銀據(jù)稱已全額完成對OpenAI的400億美元出資承諾

財聯(lián)社 2025-12-30 22:18:00
187 跟貼 187
真正的大美女從不需要劉海

拖鞋追劇 2025-12-27 17:58:34
0 跟貼 0
不為感情所惑才是真正的人間清醒

小叮當剪輯 2025-12-29 08:59:18
0 跟貼 0
紅熊AI獲8000萬元Pre-A+輪融資，聚焦記憶科學，旨在賦予人工智能接近人類的記憶能力

36氪 2025-12-31 10:53:08
0 跟貼 0

2025十佳運動員出爐：全紅嬋落榜，孫穎莎位列第四，他意外上榜

2025十佳運動員出爐：全紅嬋落榜，孫穎莎位列第四，他意外上榜

阿纂看事

2025-12-30 09:22:12

巴拿馬總統(tǒng)：已正式通知中國，退出一帶一路計劃，中方送出4個字

巴拿馬總統(tǒng)：已正式通知中國，退出一帶一路計劃，中方送出4個字

花花娛界

2025-12-30 20:09:06

不是101大樓，我軍無人機拍下的這個山包，才是臺軍最“害怕”的

不是101大樓，我軍無人機拍下的這個山包，才是臺軍最“害怕”的

觸摸史跡

2025-12-31 12:01:51

烽火已經(jīng)點燃，中日撞上了！

烽火已經(jīng)點燃，中日撞上了！

楊風

2025-12-30 09:44:24

一記重拳落下來了。12月25日公安部那個會，聽得人心驚肉跳

一記重拳落下來了。12月25日公安部那個會，聽得人心驚肉跳

百態(tài)人間

2025-12-30 16:08:35

定金退不了，人沒了，系統(tǒng)還在轉(zhuǎn)

定金退不了，人沒了，系統(tǒng)還在轉(zhuǎn)

網(wǎng)絡易不易

2025-12-30 11:54:56

俄反對派爆料：普京在克里米亞擁有第二座豪宅，造價高達百億盧布

俄反對派爆料：普京在克里米亞擁有第二座豪宅，造價高達百億盧布

桂系007

2025-12-30 23:31:08

湖北"8·26"高空蹦極事故報告出爐！3名特種設備公職人員被追責！

湖北"8·26"高空蹦極事故報告出爐！3名特種設備公職人員被追責！

特種設備安全科普

2025-12-30 21:49:28

致7名學生死亡，付某某、朱某某被執(zhí)行死刑！

致7名學生死亡，付某某、朱某某被執(zhí)行死刑！

新民晚報

2025-12-31 14:07:25

退無可退后：克林頓正式宣戰(zhàn)，寧可身敗名裂，也要拉懂王“陪葬”

退無可退后：克林頓正式宣戰(zhàn)，寧可身敗名裂，也要拉懂王“陪葬”

文史旺旺旺

2025-12-30 18:55:39

114-105！這就是雷霆隊的改變，防守已從第1秒降13

114-105！這就是雷霆隊的改變，防守已從第1秒降13

奕辰說球

2025-12-31 12:12:31

遼寧省大連市政府原黨組成員、副市長李大民被“雙開”

遼寧省大連市政府原黨組成員、副市長李大民被“雙開”

界面新聞

2025-12-31 18:39:23

國內(nèi)平臺篡改日本視頻煽動情緒，日網(wǎng)2000日元量產(chǎn)反華視頻，誰更過分？

國內(nèi)平臺篡改日本視頻煽動情緒，日網(wǎng)2000日元量產(chǎn)反華視頻，誰更過分？

日本通

2025-12-30 10:34:07

22分慘敗活塞！詹姆斯正面反擊雷迪克了，湖人想反彈需做3件事

22分慘敗活塞！詹姆斯正面反擊雷迪克了，湖人想反彈需做3件事

小路看球

2025-12-31 16:27:19

吃相難看！閆學晶哭窮被噴后，再現(xiàn)狂傲言論，黑歷史被扒后急眼了

吃相難看！閆學晶哭窮被噴后，再現(xiàn)狂傲言論，黑歷史被扒后急眼了

冷紫葉

2025-12-30 18:20:03

賴昌星發(fā)妻曾明娜現(xiàn)狀：逃亡10年后回國，守著3000平老宅安靜養(yǎng)老

賴昌星發(fā)妻曾明娜現(xiàn)狀：逃亡10年后回國，守著3000平老宅安靜養(yǎng)老

古書記史

2025-12-12 11:21:38

8小時鏖戰(zhàn)，阿根廷46票贊成1票棄權，官員集體倒戈，米萊闖關成功

8小時鏖戰(zhàn)，阿根廷46票贊成1票棄權，官員集體倒戈，米萊闖關成功

顧史

2025-12-30 16:18:19

嚴防死守36年，利智還是輸了，李連杰終是沒放下一直虧欠的“她”

嚴防死守36年，利智還是輸了，李連杰終是沒放下一直虧欠的“她”

法老不說教

2025-12-29 17:19:10

反轉(zhuǎn)了？“退貨羽絨服兜揣哈爾濱機票”女子喊冤：只穿一次就退回，已報警！

反轉(zhuǎn)了？“退貨羽絨服兜揣哈爾濱機票”女子喊冤：只穿一次就退回，已報警！

申消費

2025-12-30 10:23:38

1953年，得知彭老總在朝鮮打敗了美軍，身在臺灣的胡宗南紅了眼眶

1953年，得知彭老總在朝鮮打敗了美軍，身在臺灣的胡宗南紅了眼眶

大千世界觀

2025-12-30 20:53:04

DeepTech深科技

麻省理工科技評論獨家合作

16063文章數(shù) 514444關注度

往期回顧全部

科技要聞

老羅，演砸了，也封神了？

頭條要聞

墨西哥將對1463種進口商品加稅中國首次自主立案回應

頭條要聞

墨西哥將對1463種進口商品加稅中國首次自主立案回應

體育要聞

快船大勝國王解鎖5連勝小卡33+5+5

娛樂要聞

官宣才兩天就翻車？七七被連環(huán)爆料

財經(jīng)要聞

高培勇:分配制度改革是提振消費的抓手

汽車要聞

凱迪拉克純電中型SUV 售價不足24萬/33寸曲面屏

態(tài)度原創(chuàng)

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

游戲

健康

公開課

軍事航空

本地新聞

即將過去的2025年，對重慶的影響竟然如此深遠

跳水瞎迎來高光？爐石1月份高分段卡組推薦，新版任務防戰(zhàn)有說法

元旦舉家出行，注意防流感

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
你的工作機密，保護好了嗎？
李彥宏：百度離破產(chǎn)30天

軍事要聞

沉浸式感受"正義使命-2025"演習現(xiàn)場

© 1997-2025 網(wǎng)易公司版權所有 About NetEase | 公司簡介 | 聯(lián)系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：欧美裸体xxxx极品| 内射极品人妻| 国产白浆一区二区三区| 无码国产精品一区二区免费式芒果| 熟女人妻av五十路六十路| 亚洲熟妇自偷自拍另欧美| 亚洲美女视频在线| 改则县| 亚洲欭美日韩颜射在线二| 99re久久资源最新地址| 精品人妻免费看一区二区三区| 日韩天码| 久久人妻无码AⅤ毛片评价| 中文字幕av无码一区二区三区| 亚洲熟妇av乱码在线观看| 四虎库影成人在线播放| 欧美日韩久久| 老司机亚洲精品影院无码| 99久久国产综合精品1| 亚洲欧美日韩在线不卡| 日本久久中文字幕| 亚洲av综合网| 无遮挡又黄又刺激的视频| 91在线观看| 综合AV| 超碰66| 久久一本人碰碰人碰| 亚洲欧美成人久久综合中文网| 91精品人妻一区二区三区蜜桃| 成人精品无码成人亚洲 | 新竹市| 内射极品少妇xxxxxhd| 国产精品乱码一区二区三区| 亚洲成人av| 宜黄县| 国产精品自在线免费| 九九re线精品视频在线观看视频| 中文字幕在线v| 亚洲做第3页| 真人祼交二十三式视频| 国产日韩AV免费无码一区二区三区|

<legend id="eibye"></legend>

<p id="eibye"><li id="eibye"><pre id="eibye"></pre></li></p>