上周Andrej Karpathy發(fā)了一條推,1500萬(wàn)人看了。
![]()
又是Andrej。又是新概念。
這次他說(shuō)自己最近把大量的LLM算力從寫(xiě)代碼轉(zhuǎn)向了「建知識(shí)庫(kù)」,把論文、文章、代碼倉(cāng)庫(kù)等原始資料扔進(jìn)一個(gè)目錄,讓LLM自動(dòng)編譯成一個(gè)markdown wiki,然后在這個(gè)wiki上做問(wèn)答、生成幻燈片、做數(shù)據(jù)可視化。他的wiki已經(jīng)積累了100多篇文章、40萬(wàn)字,可以回答各種復(fù)雜的研究問(wèn)題。
最后他說(shuō)了一句:
I think there is room here for an incredible new product instead of a hacky collection of scripts.(這個(gè)方向應(yīng)該有一個(gè)真正的產(chǎn)品,而不是一堆拼湊的腳本。)
我轉(zhuǎn)發(fā)之后,有不少人來(lái)找我問(wèn):「能不能出個(gè)教程?」「Obsidian怎么配?」「一定要用Claude Code嗎,用xxx行不行?」
說(shuō)實(shí)話(huà)我自己用Claude Code搭類(lèi)似的工作流不難,但每次有人問(wèn)我「怎么搭」,都卡在同一個(gè)地方:Karpathy的方案需要命令行、需要寫(xiě)腳本、需要配Obsidian插件,每一步都在勸退不會(huì)vibe coding的人。尤其是,問(wèn)我這些問(wèn)題的,恰恰都是不會(huì)寫(xiě)代碼,也對(duì)Vibe Coding工具不熟悉的人,學(xué)生、白領(lǐng)、內(nèi)容創(chuàng)作者。
這讓我想起之前在即刻寫(xiě)過(guò)的一件事:我收藏了2000篇文章,再也沒(méi)打開(kāi)過(guò)。評(píng)論區(qū)最多人說(shuō)的一句話(huà)是「一樣」。微信收藏、瀏覽器書(shū)簽、筆記軟件、稍后讀App,到處散落著落灰的內(nèi)容。不是沒(méi)時(shí)間讀,而是收藏的那一刻,大腦已經(jīng)產(chǎn)生了「我處理過(guò)了」的錯(cuò)覺(jué)。
「看過(guò)」和「理解」之間隔著一道溝。Karpathy用代碼填了這道溝,但大多數(shù)人需要的是一個(gè)產(chǎn)品,不是一套腳本。
所以看到網(wǎng)易有道新出的產(chǎn)品--有道寶庫(kù)的時(shí)候,我挺在意的。它做的事情和Karpathy那套工作流幾乎一樣,把資料扔進(jìn)去,AI自動(dòng)理解、整理、關(guān)聯(lián),然后你可以追問(wèn)、生成思維導(dǎo)圖、做PPT、生成播客——但它是一個(gè)打開(kāi)瀏覽器就能用的產(chǎn)品,不是一堆腳本。
之前測(cè)過(guò)有道龍蝦,那是幫你干活的AI Agent。這次寶庫(kù)的定位不一樣,更像一個(gè)思考伙伴,幫你把散落的資料變成可以深度理解的知識(shí)。
我決定按Karpathy的工作流框架,拿有道寶庫(kù)跑一遍自己的真實(shí)調(diào)研場(chǎng)景,看看一個(gè)產(chǎn)品化的方案到底能做到什么程度。
我選的調(diào)研主題是謝賽寧和AMI Labs。
最近張小珺做了一期將近7小時(shí)的馬拉松訪(fǎng)談,采訪(fǎng)的是謝賽寧。他是迄今為止對(duì)我來(lái)說(shuō)認(rèn)知沖擊最大的一期播客。謝賽寧和Yann LeCun共同創(chuàng)立了AMI Labs,剛完成10.3億美元的種子輪融資,估值35億美元,僅25人,連產(chǎn)品都還沒(méi)有。訪(fǎng)談里聊到了世界模型、兩次拒絕Ilya、和何愷明的友誼、以及「硅谷被LLM催眠了」這個(gè)判斷。這是一個(gè)信息量極大、涉及人物關(guān)系和技術(shù)爭(zhēng)論的復(fù)雜話(huà)題,正好用來(lái)測(cè)試知識(shí)庫(kù)的真實(shí)深度。
先把資料扔進(jìn)去
Karpathy的第一步是把原始資料索引到一個(gè)raw/目錄,用Obsidian Web Clipper把網(wǎng)頁(yè)轉(zhuǎn)成markdown,再用腳本下載相關(guān)圖片。
有道寶庫(kù)的做法更直接:創(chuàng)建一個(gè)知識(shí)庫(kù),把各種格式的資料直接導(dǎo)入。
![]()
我把這幾份資料扔了進(jìn)去:張小珺對(duì)謝賽寧的訪(fǎng)談網(wǎng)頁(yè)鏈接、AMI Labs融資報(bào)道(36kr)、以及謝賽寧的4篇論文PDF——DiT、Cambrian-1、Solaris,加上LeCun的世界模型路線(xiàn)圖。
有道寶庫(kù)支持的來(lái)源挺雜的,PDF、Word、網(wǎng)頁(yè)鏈接都是基本操作。還有個(gè)我沒(méi)預(yù)期到的功能:添加資料彈窗里有個(gè)「學(xué)術(shù)」搜索入口,直接在里面搜論文,搜「transformer DeepSeek」能出來(lái)58條結(jié)果,標(biāo)注了引用數(shù)和期刊,直接加入知識(shí)庫(kù),連下載PDF這步都省了。
![]()
一共導(dǎo)入了6份資料,覆蓋中文訪(fǎng)談、英文論文、新聞報(bào)道三種格式,導(dǎo)入都很順。
然后開(kāi)始追問(wèn)
Karpathy說(shuō)他的wiki積累到一定規(guī)模之后,可以對(duì)著它問(wèn)各種復(fù)雜問(wèn)題,LLM會(huì)自己去翻資料、研究、給出答案。
進(jìn)入知識(shí)庫(kù),有道寶庫(kù)自動(dòng)給出了一份內(nèi)容總結(jié),把6份資料橫跨的主題梳理了出來(lái),技術(shù)路徑、人物關(guān)系、世界模型的核心主張,都覆蓋到了,判斷基本準(zhǔn)確。
然后我開(kāi)始追問(wèn)。
我問(wèn)的第一個(gè)問(wèn)題是:「謝賽寧是怎么從DiT發(fā)展到Solaris的,這之間的關(guān)系是什么?」
![]()
回答拉出了DiT到Cambrian再到Solaris的技術(shù)演進(jìn)路徑,每句話(huà)后面跟著引用角標(biāo),對(duì)應(yīng)具體是哪篇論文的哪個(gè)段落。
這里有個(gè)體驗(yàn)和Karpathy的方案根本不同:有道寶庫(kù)的每句回答都跟著引用標(biāo)注,點(diǎn)一下就跳到原文的具體段落。
![]()
Karpathy的wiki是LLM編譯的markdown文件,他需要自己去驗(yàn)證內(nèi)容對(duì)不對(duì)。有道寶庫(kù)把「溯源」這件事產(chǎn)品化了,不需要你自己翻原文對(duì)照,點(diǎn)一下引用標(biāo)注就能看到出處。
這和用ChatGPT等對(duì)話(huà)式AI顯然很不一樣。那些工具是拿整個(gè)互聯(lián)網(wǎng)的知識(shí)回答你,你不知道它是從哪得出的結(jié)論。有道寶庫(kù)的邏輯不同,它只看你上傳的資料,每句話(huà)都能溯源。可以大幅度避免LLM的幻覺(jué)問(wèn)題。
不是說(shuō)它絕對(duì)不會(huì)理解錯(cuò),而是它把證據(jù)鏈擺在你面前了。對(duì)不對(duì)你自己判斷,證據(jù)就在手邊。
做調(diào)研、寫(xiě)文章的時(shí)候,這種確定感很重要。
讓資料長(zhǎng)出新形狀
光靠問(wèn)答還不夠。真正的知識(shí)內(nèi)化,是把零散信息重組成你自己能用的結(jié)構(gòu)。
Karpathy說(shuō)他不喜歡在終端里看純文字結(jié)果,而是讓LLM生成幻燈片、圖表,然后在Obsidian里查看。有道寶庫(kù)在這塊走得更遠(yuǎn)——腦圖、信息圖、PPT、播客,每種輸出格式都有自定義要求的入口,不是盲目生成,而是按你的方向重組。
先試思維導(dǎo)圖。
![]()
我在自定義要求里寫(xiě)了具體方向:以謝賽寧為中心,梳理人際關(guān)系網(wǎng)絡(luò)和技術(shù)演進(jìn)路徑,重點(diǎn)突出人物關(guān)系的戲劇性。生成結(jié)果標(biāo)題是「謝賽寧AI人脈技術(shù)路徑與AMI Labs世界模型愿景」,三級(jí)結(jié)構(gòu),把LeCun、何愷明、Ilya的關(guān)系,以及MoCo到MAE到DiT到Cambrian到Solaris的路徑都拉出來(lái)了。
![]()
這是基于多份資料的跨文檔整合,不是某一篇文章的復(fù)述。生成完可以直接編輯,AI梳理的結(jié)構(gòu)不一定完全準(zhǔn)確,但給了一個(gè)可以改的起點(diǎn),比從空白開(kāi)始順多了。
再試信息圖。
![]()
四個(gè)模塊把DiT、Cambrian-1、Solaris、AMI Labs的脈絡(luò)串了起來(lái),內(nèi)容基本準(zhǔn)確。每個(gè)模塊的核心論點(diǎn)有道寶庫(kù)抓得不錯(cuò),比如Cambrian-1那條「打破語(yǔ)言偏見(jiàn),對(duì)抗當(dāng)前AI過(guò)度依賴(lài)語(yǔ)言先驗(yàn)的局限」,這是原論文的核心主張,提煉準(zhǔn)確。中文渲染這塊體感明顯,一張圖里能有這么多中文字符,但卻沒(méi)有亂碼的,這個(gè)細(xì)節(jié)算是解決了很大的痛點(diǎn)。
還可以直接變成播客
Karpathy的工作流里有幻燈片、有圖表,但沒(méi)有音頻。
對(duì)內(nèi)容創(chuàng)作者來(lái)說(shuō),「聽(tīng)」是一種很不一樣的內(nèi)化方式。很多東西看的時(shí)候以為懂了,但耳朵在聽(tīng)的時(shí)候腦子才真的在處理。如果能有一期專(zhuān)門(mén)講你正在研究的話(huà)題的播客,知識(shí)就不只是躺在文檔里。
NotebookLM兩年前靠播客功能出圈。
2024年9月上線(xiàn)「Audio Overview」,當(dāng)月用戶(hù)增長(zhǎng)300%,Q4環(huán)比增長(zhǎng)120%,移動(dòng)端月活最終達(dá)到800萬(wàn)。這個(gè)數(shù)字證明了一件事:AI播客這個(gè)形式,需求是真實(shí)的。
但中國(guó)用戶(hù)留下來(lái)的不多。不是功能沒(méi)用,是摩擦太大:需要科學(xué)上網(wǎng),中文發(fā)音錯(cuò)誤頻發(fā),公眾號(hào)、B站這些中文內(nèi)容源也不太支持。
有道寶庫(kù)也做了播客功能,有一個(gè)細(xì)節(jié)我覺(jué)得有意思:有音色選擇。
![]()
雙人模式,主持人A可以選「貴氣千金」「智性精英」「冷艷樂(lè)手」,主持人B可以選「好朋男聲」「理工學(xué)霸」「磁性低音炮」,還有簡(jiǎn)潔/深入兩檔時(shí)長(zhǎng),加自定義要求。
我在自定義要求里寫(xiě)了方向:從謝賽寧的人物故事切入,聊DiT怎么變成Sora的基石,再引出世界模型和LLM路線(xiàn)之爭(zhēng),要像兩個(gè)真正關(guān)心這件事的人在深夜聊天,而不是念PPT。
生成出來(lái)的播客,對(duì)話(huà)結(jié)構(gòu)清晰,切中的是真正有意思的點(diǎn)。兩次拒絕Ilya這段,兩個(gè)主持人有來(lái)有回,能感覺(jué)出話(huà)題的張力。中文發(fā)音準(zhǔn)確,沒(méi)有多音字讀錯(cuò)。
暫時(shí)無(wú)法在飛書(shū)文檔外展示此內(nèi)容
當(dāng)然比不上真人播客的人味。但它能做到一件之前做不到的事:你把資料扔進(jìn)去,它替你把資料講給你聽(tīng)——這件事的價(jià)值,不在于它有多完美,在于它真的存在。
它比同類(lèi)多一張牌
測(cè)完這些功能之后,我想到一件事:有道做知識(shí)庫(kù),比其他人多一張牌。
有道詞典和有道翻譯用了這么多年,這次有道寶庫(kù)把這條鏈路打通了。你在有道翻譯里處理過(guò)的文章,可以直接導(dǎo)入寶庫(kù)繼續(xù)研究。這個(gè)閉環(huán)是「翻譯→導(dǎo)入→深度理解」,別家沒(méi)有。
實(shí)測(cè)過(guò)一個(gè)場(chǎng)景:把謝賽寧的DiT英文論文扔進(jìn)去,讓有道寶庫(kù)做文檔翻譯。它不只翻了文字,連論文里的圖表、公式截圖也做了翻譯處理。讀一篇密集的英文ML論文,這種帶圖片翻譯的中文版本和原版對(duì)照,比單純讓AI總結(jié)要扎實(shí)得多——你能看到作者的原始表達(dá),同時(shí)不被語(yǔ)言本身?yè)踝±斫狻?/p>
對(duì)于每天要處理大量英文資料的研究者和創(chuàng)作者來(lái)說(shuō),這個(gè)生態(tài)加法是實(shí)質(zhì)性的。
還有個(gè)彩蛋
測(cè)試快結(jié)束的時(shí)候,我在產(chǎn)品官網(wǎng)發(fā)現(xiàn)了一個(gè)東西——有道寶庫(kù)有CLI。哈哈,這還挺趕現(xiàn)在優(yōu)先給AGENT做產(chǎn)品的潮流的。
![]()
我拿這個(gè)CLI跑了一個(gè)實(shí)驗(yàn):把本地積累的12篇DeepSeek論文扔進(jìn)去,讓它生成一期「聽(tīng)完能搞清楚DeepSeek這兩年在研究什么」的播客。不需要打開(kāi)瀏覽器,命令行上傳文件,等幾分鐘,一期16MB的雙人AI播客出來(lái)了。本地批量文件的知識(shí)內(nèi)化,是純網(wǎng)頁(yè)產(chǎn)品做不到的。
![]()
網(wǎng)頁(yè)端給普通用戶(hù)用,CLI給想要把它嵌入自己工作流的人用。兩個(gè)受眾都照顧到了,這個(gè)設(shè)計(jì)挺聰明的。
Karpathy要的那個(gè)產(chǎn)品,還沒(méi)出現(xiàn)
回到Karpathy那句話(huà):「這個(gè)方向應(yīng)該有一個(gè)真正的產(chǎn)品,而不是一堆拼湊的腳本。」
說(shuō)實(shí)話(huà),那個(gè)產(chǎn)品還沒(méi)出現(xiàn)。
Karpathy描述的不只是「上傳資料然后問(wèn)答」,他描述的是一套基于A(yíng)gentic AI的知識(shí)管理體系:模型能主動(dòng)梳理知識(shí)圖譜、發(fā)現(xiàn)遺漏、跨庫(kù)推理、在自己的權(quán)重里真正「記住」你研究過(guò)的東西。這件事,現(xiàn)有的產(chǎn)品——無(wú)論是NotebookLM還是有道寶庫(kù)——都還沒(méi)做到。底層模型還在快速演進(jìn),真正能「主動(dòng)幫你管知識(shí)」的產(chǎn)品,可能要再等一兩個(gè)大版本。
但這不是說(shuō)現(xiàn)在的工具沒(méi)用。
對(duì)后臺(tái)那些問(wèn)「不會(huì)寫(xiě)代碼怎么辦」的朋友來(lái)說(shuō),有道寶庫(kù)已經(jīng)是目前門(mén)檻最低、能立刻上手的選項(xiàng)之一。 資料導(dǎo)入、有據(jù)可查的深度問(wèn)答、多模態(tài)知識(shí)重組,核心環(huán)節(jié)都產(chǎn)品化了。而且在播客、中文支持、詞典翻譯打通這些維度上,它做到了Karpathy的腳本方案做不到的事。
Karpathy那條推下面,點(diǎn)贊最高的回復(fù)是:「So basically you're describing NotebookLM?」
不完全是。NotebookLM在國(guó)內(nèi)訪(fǎng)問(wèn)不便,對(duì)中文內(nèi)容源的支持程度和生成的中文信息展示的準(zhǔn)確性也常常出錯(cuò),畢竟不是給中國(guó)用戶(hù)準(zhǔn)備的,能力。對(duì)中文用戶(hù)來(lái)說(shuō),這個(gè)更接近現(xiàn)階段的可用答案。
目前免費(fèi)內(nèi)測(cè)。如果你也被這條推種草了但不想折騰腳本,可以先去試試。
![]()
體驗(yàn)鏈接 https://baoku.youdao.com/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.