網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

Karpathy又雙叒叕發(fā)新概念了，這次我替你找到了那個(gè)產(chǎn)品

2026-04-07 11:50:54　來(lái)源: AI進(jìn)化論花生

北京舉報(bào)

分享至

上周Andrej Karpathy發(fā)了一條推，1500萬(wàn)人看了。

又是Andrej。又是新概念。

這次他說(shuō)自己最近把大量的LLM算力從寫(xiě)代碼轉(zhuǎn)向了「建知識(shí)庫(kù)」，把論文、文章、代碼倉(cāng)庫(kù)等原始資料扔進(jìn)一個(gè)目錄，讓LLM自動(dòng)編譯成一個(gè)markdown wiki，然后在這個(gè)wiki上做問(wèn)答、生成幻燈片、做數(shù)據(jù)可視化。他的wiki已經(jīng)積累了100多篇文章、40萬(wàn)字，可以回答各種復(fù)雜的研究問(wèn)題。

最后他說(shuō)了一句：

I think there is room here for an incredible new product instead of a hacky collection of scripts.（這個(gè)方向應(yīng)該有一個(gè)真正的產(chǎn)品，而不是一堆拼湊的腳本。）

我轉(zhuǎn)發(fā)之后，有不少人來(lái)找我問(wèn)：「能不能出個(gè)教程？」「Obsidian怎么配？」「一定要用Claude Code嗎，用xxx行不行？」

說(shuō)實(shí)話(huà)我自己用Claude Code搭類(lèi)似的工作流不難，但每次有人問(wèn)我「怎么搭」，都卡在同一個(gè)地方：Karpathy的方案需要命令行、需要寫(xiě)腳本、需要配Obsidian插件，每一步都在勸退不會(huì)vibe coding的人。尤其是，問(wèn)我這些問(wèn)題的，恰恰都是不會(huì)寫(xiě)代碼，也對(duì)Vibe Coding工具不熟悉的人，學(xué)生、白領(lǐng)、內(nèi)容創(chuàng)作者。

這讓我想起之前在即刻寫(xiě)過(guò)的一件事：我收藏了2000篇文章，再也沒(méi)打開(kāi)過(guò)。評(píng)論區(qū)最多人說(shuō)的一句話(huà)是「一樣」。微信收藏、瀏覽器書(shū)簽、筆記軟件、稍后讀App，到處散落著落灰的內(nèi)容。不是沒(méi)時(shí)間讀，而是收藏的那一刻，大腦已經(jīng)產(chǎn)生了「我處理過(guò)了」的錯(cuò)覺(jué)。

「看過(guò)」和「理解」之間隔著一道溝。Karpathy用代碼填了這道溝，但大多數(shù)人需要的是一個(gè)產(chǎn)品，不是一套腳本。

所以看到網(wǎng)易有道新出的產(chǎn)品--有道寶庫(kù)的時(shí)候，我挺在意的。它做的事情和Karpathy那套工作流幾乎一樣，把資料扔進(jìn)去，AI自動(dòng)理解、整理、關(guān)聯(lián)，然后你可以追問(wèn)、生成思維導(dǎo)圖、做PPT、生成播客——但它是一個(gè)打開(kāi)瀏覽器就能用的產(chǎn)品，不是一堆腳本。

之前測(cè)過(guò)有道龍蝦，那是幫你干活的AI Agent。這次寶庫(kù)的定位不一樣，更像一個(gè)思考伙伴，幫你把散落的資料變成可以深度理解的知識(shí)。

我決定按Karpathy的工作流框架，拿有道寶庫(kù)跑一遍自己的真實(shí)調(diào)研場(chǎng)景，看看一個(gè)產(chǎn)品化的方案到底能做到什么程度。

我選的調(diào)研主題是謝賽寧和AMI Labs。

最近張小珺做了一期將近7小時(shí)的馬拉松訪(fǎng)談，采訪(fǎng)的是謝賽寧。他是迄今為止對(duì)我來(lái)說(shuō)認(rèn)知沖擊最大的一期播客。謝賽寧和Yann LeCun共同創(chuàng)立了AMI Labs，剛完成10.3億美元的種子輪融資，估值35億美元，僅25人，連產(chǎn)品都還沒(méi)有。訪(fǎng)談里聊到了世界模型、兩次拒絕Ilya、和何愷明的友誼、以及「硅谷被LLM催眠了」這個(gè)判斷。這是一個(gè)信息量極大、涉及人物關(guān)系和技術(shù)爭(zhēng)論的復(fù)雜話(huà)題，正好用來(lái)測(cè)試知識(shí)庫(kù)的真實(shí)深度。

先把資料扔進(jìn)去

Karpathy的第一步是把原始資料索引到一個(gè)raw/目錄，用Obsidian Web Clipper把網(wǎng)頁(yè)轉(zhuǎn)成markdown，再用腳本下載相關(guān)圖片。

有道寶庫(kù)的做法更直接：創(chuàng)建一個(gè)知識(shí)庫(kù)，把各種格式的資料直接導(dǎo)入。

我把這幾份資料扔了進(jìn)去：張小珺對(duì)謝賽寧的訪(fǎng)談網(wǎng)頁(yè)鏈接、AMI Labs融資報(bào)道（36kr）、以及謝賽寧的4篇論文PDF——DiT、Cambrian-1、Solaris，加上LeCun的世界模型路線(xiàn)圖。

有道寶庫(kù)支持的來(lái)源挺雜的，PDF、Word、網(wǎng)頁(yè)鏈接都是基本操作。還有個(gè)我沒(méi)預(yù)期到的功能：添加資料彈窗里有個(gè)「學(xué)術(shù)」搜索入口，直接在里面搜論文，搜「transformer DeepSeek」能出來(lái)58條結(jié)果，標(biāo)注了引用數(shù)和期刊，直接加入知識(shí)庫(kù)，連下載PDF這步都省了。

一共導(dǎo)入了6份資料，覆蓋中文訪(fǎng)談、英文論文、新聞報(bào)道三種格式，導(dǎo)入都很順。

然后開(kāi)始追問(wèn)

Karpathy說(shuō)他的wiki積累到一定規(guī)模之后，可以對(duì)著它問(wèn)各種復(fù)雜問(wèn)題，LLM會(huì)自己去翻資料、研究、給出答案。

進(jìn)入知識(shí)庫(kù)，有道寶庫(kù)自動(dòng)給出了一份內(nèi)容總結(jié)，把6份資料橫跨的主題梳理了出來(lái)，技術(shù)路徑、人物關(guān)系、世界模型的核心主張，都覆蓋到了，判斷基本準(zhǔn)確。

然后我開(kāi)始追問(wèn)。

我問(wèn)的第一個(gè)問(wèn)題是：「謝賽寧是怎么從DiT發(fā)展到Solaris的，這之間的關(guān)系是什么？」

回答拉出了DiT到Cambrian再到Solaris的技術(shù)演進(jìn)路徑，每句話(huà)后面跟著引用角標(biāo)，對(duì)應(yīng)具體是哪篇論文的哪個(gè)段落。

這里有個(gè)體驗(yàn)和Karpathy的方案根本不同：有道寶庫(kù)的每句回答都跟著引用標(biāo)注，點(diǎn)一下就跳到原文的具體段落。

Karpathy的wiki是LLM編譯的markdown文件，他需要自己去驗(yàn)證內(nèi)容對(duì)不對(duì)。有道寶庫(kù)把「溯源」這件事產(chǎn)品化了，不需要你自己翻原文對(duì)照，點(diǎn)一下引用標(biāo)注就能看到出處。

這和用ChatGPT等對(duì)話(huà)式AI顯然很不一樣。那些工具是拿整個(gè)互聯(lián)網(wǎng)的知識(shí)回答你，你不知道它是從哪得出的結(jié)論。有道寶庫(kù)的邏輯不同，它只看你上傳的資料，每句話(huà)都能溯源。可以大幅度避免LLM的幻覺(jué)問(wèn)題。

不是說(shuō)它絕對(duì)不會(huì)理解錯(cuò)，而是它把證據(jù)鏈擺在你面前了。對(duì)不對(duì)你自己判斷，證據(jù)就在手邊。

做調(diào)研、寫(xiě)文章的時(shí)候，這種確定感很重要。

讓資料長(zhǎng)出新形狀

光靠問(wèn)答還不夠。真正的知識(shí)內(nèi)化，是把零散信息重組成你自己能用的結(jié)構(gòu)。

Karpathy說(shuō)他不喜歡在終端里看純文字結(jié)果，而是讓LLM生成幻燈片、圖表，然后在Obsidian里查看。有道寶庫(kù)在這塊走得更遠(yuǎn)——腦圖、信息圖、PPT、播客，每種輸出格式都有自定義要求的入口，不是盲目生成，而是按你的方向重組。

先試思維導(dǎo)圖。

我在自定義要求里寫(xiě)了具體方向：以謝賽寧為中心，梳理人際關(guān)系網(wǎng)絡(luò)和技術(shù)演進(jìn)路徑，重點(diǎn)突出人物關(guān)系的戲劇性。生成結(jié)果標(biāo)題是「謝賽寧AI人脈技術(shù)路徑與AMI Labs世界模型愿景」，三級(jí)結(jié)構(gòu)，把LeCun、何愷明、Ilya的關(guān)系，以及MoCo到MAE到DiT到Cambrian到Solaris的路徑都拉出來(lái)了。

這是基于多份資料的跨文檔整合，不是某一篇文章的復(fù)述。生成完可以直接編輯，AI梳理的結(jié)構(gòu)不一定完全準(zhǔn)確，但給了一個(gè)可以改的起點(diǎn)，比從空白開(kāi)始順多了。

再試信息圖。

四個(gè)模塊把DiT、Cambrian-1、Solaris、AMI Labs的脈絡(luò)串了起來(lái)，內(nèi)容基本準(zhǔn)確。每個(gè)模塊的核心論點(diǎn)有道寶庫(kù)抓得不錯(cuò)，比如Cambrian-1那條「打破語(yǔ)言偏見(jiàn)，對(duì)抗當(dāng)前AI過(guò)度依賴(lài)語(yǔ)言先驗(yàn)的局限」，這是原論文的核心主張，提煉準(zhǔn)確。中文渲染這塊體感明顯，一張圖里能有這么多中文字符，但卻沒(méi)有亂碼的，這個(gè)細(xì)節(jié)算是解決了很大的痛點(diǎn)。

還可以直接變成播客

Karpathy的工作流里有幻燈片、有圖表，但沒(méi)有音頻。

對(duì)內(nèi)容創(chuàng)作者來(lái)說(shuō)，「聽(tīng)」是一種很不一樣的內(nèi)化方式。很多東西看的時(shí)候以為懂了，但耳朵在聽(tīng)的時(shí)候腦子才真的在處理。如果能有一期專(zhuān)門(mén)講你正在研究的話(huà)題的播客，知識(shí)就不只是躺在文檔里。

NotebookLM兩年前靠播客功能出圈。

2024年9月上線(xiàn)「Audio Overview」，當(dāng)月用戶(hù)增長(zhǎng)300%，Q4環(huán)比增長(zhǎng)120%，移動(dòng)端月活最終達(dá)到800萬(wàn)。這個(gè)數(shù)字證明了一件事：AI播客這個(gè)形式，需求是真實(shí)的。

但中國(guó)用戶(hù)留下來(lái)的不多。不是功能沒(méi)用，是摩擦太大：需要科學(xué)上網(wǎng)，中文發(fā)音錯(cuò)誤頻發(fā)，公眾號(hào)、B站這些中文內(nèi)容源也不太支持。

有道寶庫(kù)也做了播客功能，有一個(gè)細(xì)節(jié)我覺(jué)得有意思：有音色選擇。

雙人模式，主持人A可以選「貴氣千金」「智性精英」「冷艷樂(lè)手」，主持人B可以選「好朋男聲」「理工學(xué)霸」「磁性低音炮」，還有簡(jiǎn)潔/深入兩檔時(shí)長(zhǎng)，加自定義要求。

我在自定義要求里寫(xiě)了方向：從謝賽寧的人物故事切入，聊DiT怎么變成Sora的基石，再引出世界模型和LLM路線(xiàn)之爭(zhēng)，要像兩個(gè)真正關(guān)心這件事的人在深夜聊天，而不是念PPT。

生成出來(lái)的播客，對(duì)話(huà)結(jié)構(gòu)清晰，切中的是真正有意思的點(diǎn)。兩次拒絕Ilya這段，兩個(gè)主持人有來(lái)有回，能感覺(jué)出話(huà)題的張力。中文發(fā)音準(zhǔn)確，沒(méi)有多音字讀錯(cuò)。

暫時(shí)無(wú)法在飛書(shū)文檔外展示此內(nèi)容

當(dāng)然比不上真人播客的人味。但它能做到一件之前做不到的事：你把資料扔進(jìn)去，它替你把資料講給你聽(tīng)——這件事的價(jià)值，不在于它有多完美，在于它真的存在。

它比同類(lèi)多一張牌

測(cè)完這些功能之后，我想到一件事：有道做知識(shí)庫(kù)，比其他人多一張牌。

有道詞典和有道翻譯用了這么多年，這次有道寶庫(kù)把這條鏈路打通了。你在有道翻譯里處理過(guò)的文章，可以直接導(dǎo)入寶庫(kù)繼續(xù)研究。這個(gè)閉環(huán)是「翻譯→導(dǎo)入→深度理解」，別家沒(méi)有。

實(shí)測(cè)過(guò)一個(gè)場(chǎng)景：把謝賽寧的DiT英文論文扔進(jìn)去，讓有道寶庫(kù)做文檔翻譯。它不只翻了文字，連論文里的圖表、公式截圖也做了翻譯處理。讀一篇密集的英文ML論文，這種帶圖片翻譯的中文版本和原版對(duì)照，比單純讓AI總結(jié)要扎實(shí)得多——你能看到作者的原始表達(dá)，同時(shí)不被語(yǔ)言本身?yè)踝±斫狻?/p>

對(duì)于每天要處理大量英文資料的研究者和創(chuàng)作者來(lái)說(shuō)，這個(gè)生態(tài)加法是實(shí)質(zhì)性的。

還有個(gè)彩蛋

測(cè)試快結(jié)束的時(shí)候，我在產(chǎn)品官網(wǎng)發(fā)現(xiàn)了一個(gè)東西——有道寶庫(kù)有CLI。哈哈，這還挺趕現(xiàn)在優(yōu)先給AGENT做產(chǎn)品的潮流的。

我拿這個(gè)CLI跑了一個(gè)實(shí)驗(yàn)：把本地積累的12篇DeepSeek論文扔進(jìn)去，讓它生成一期「聽(tīng)完能搞清楚DeepSeek這兩年在研究什么」的播客。不需要打開(kāi)瀏覽器，命令行上傳文件，等幾分鐘，一期16MB的雙人AI播客出來(lái)了。本地批量文件的知識(shí)內(nèi)化，是純網(wǎng)頁(yè)產(chǎn)品做不到的。

網(wǎng)頁(yè)端給普通用戶(hù)用，CLI給想要把它嵌入自己工作流的人用。兩個(gè)受眾都照顧到了，這個(gè)設(shè)計(jì)挺聰明的。

Karpathy要的那個(gè)產(chǎn)品，還沒(méi)出現(xiàn)

回到Karpathy那句話(huà)：「這個(gè)方向應(yīng)該有一個(gè)真正的產(chǎn)品，而不是一堆拼湊的腳本。」

說(shuō)實(shí)話(huà)，那個(gè)產(chǎn)品還沒(méi)出現(xiàn)。

Karpathy描述的不只是「上傳資料然后問(wèn)答」，他描述的是一套基于A(yíng)gentic AI的知識(shí)管理體系：模型能主動(dòng)梳理知識(shí)圖譜、發(fā)現(xiàn)遺漏、跨庫(kù)推理、在自己的權(quán)重里真正「記住」你研究過(guò)的東西。這件事，現(xiàn)有的產(chǎn)品——無(wú)論是NotebookLM還是有道寶庫(kù)——都還沒(méi)做到。底層模型還在快速演進(jìn)，真正能「主動(dòng)幫你管知識(shí)」的產(chǎn)品，可能要再等一兩個(gè)大版本。

但這不是說(shuō)現(xiàn)在的工具沒(méi)用。

對(duì)后臺(tái)那些問(wèn)「不會(huì)寫(xiě)代碼怎么辦」的朋友來(lái)說(shuō)，有道寶庫(kù)已經(jīng)是目前門(mén)檻最低、能立刻上手的選項(xiàng)之一。資料導(dǎo)入、有據(jù)可查的深度問(wèn)答、多模態(tài)知識(shí)重組，核心環(huán)節(jié)都產(chǎn)品化了。而且在播客、中文支持、詞典翻譯打通這些維度上，它做到了Karpathy的腳本方案做不到的事。

Karpathy那條推下面，點(diǎn)贊最高的回復(fù)是：「So basically you're describing NotebookLM?」

不完全是。NotebookLM在國(guó)內(nèi)訪(fǎng)問(wèn)不便，對(duì)中文內(nèi)容源的支持程度和生成的中文信息展示的準(zhǔn)確性也常常出錯(cuò)，畢竟不是給中國(guó)用戶(hù)準(zhǔn)備的，能力。對(duì)中文用戶(hù)來(lái)說(shuō)，這個(gè)更接近現(xiàn)階段的可用答案。

目前免費(fèi)內(nèi)測(cè)。如果你也被這條推種草了但不想折騰腳本，可以先去試試。

體驗(yàn)鏈接 https://baoku.youdao.com/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.