<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      DeepSeek OCR論文引爆網(wǎng)絡(luò)!Andrej Karpathy:,我很喜歡;馬斯克:未來99%都是光子

      0
      分享至


      剛剛,AI大神Andrej Karpathy表示非常喜歡DeepSeek OCR 論文,原話:

      我相當(dāng)喜歡新的DeepSeek-OCR論文。它是一個(gè)很好的OCR模型(可能比dots稍微差一點(diǎn)),是的,數(shù)據(jù)收集等等,但無論如何都不重要。對(duì)我來說更有趣的部分(尤其是作為一個(gè)以計(jì)算機(jī)視覺為核心,暫時(shí)偽裝成自然語言的人)是像素是否比文本更適合作為LLM的輸入。文本標(biāo)記是否浪費(fèi)且糟糕,作為輸入。

      還不知什么情況的看我這篇文章

      Karpathy認(rèn)為,拋開模型本身不談,deepseek這篇論文引出了一個(gè)更值得深思的問題:對(duì)于LLM來說,像素是否是比文本更優(yōu)越的輸入形式?文本Token是否既浪費(fèi)又糟糕?

      他進(jìn)一步設(shè)想,或許所有LLM的輸入都只應(yīng)該是圖像。即便是純文本內(nèi)容,也應(yīng)該先渲染成圖片再輸入給模型

      Karpathy給出了支持這一構(gòu)想的四大核心理由:

      1. 更高的信息壓縮效率

      將文本渲染成圖像,可以實(shí)現(xiàn)更高的信息壓縮,這意味著更短的上下文窗口和更高的運(yùn)行效率

      2. 更通用的信息流

      像素是一種遠(yuǎn)比文本更通用的信息流。它不僅能表示純文本,還能輕松捕捉粗體、彩色文本,甚至是任意的圖表和照片

      3. 默認(rèn)實(shí)現(xiàn)強(qiáng)大的雙向注意力

      像素化的輸入可以很自然、很輕松地默認(rèn)使用雙向注意力進(jìn)行處理,這種處理方式比自回歸注意力更為強(qiáng)大

      4. 徹底淘汰Tokenizer

      Karpathy毫不掩飾自己對(duì)Tokenizer的嫌棄。他認(rèn)為Tokenizer是一個(gè)丑陋、獨(dú)立、非端到端的階段。它引入了Unicode和字節(jié)編碼的所有丑陋之處,繼承了大量歷史包袱,并帶來了安全和越獄風(fēng)險(xiǎn)(例如連續(xù)字節(jié)問題)

      他舉例說,Tokenizer會(huì)導(dǎo)致兩個(gè)在人眼看來完全相同的字符,在網(wǎng)絡(luò)內(nèi)部被表示為兩個(gè)完全不同的Token。一個(gè)笑臉emoji,在模型看來只是一個(gè)奇怪的Token,而不是一個(gè)由像素構(gòu)成的、真實(shí)的笑臉,這導(dǎo)致模型無法利用其視覺信息帶來的遷移學(xué)習(xí)優(yōu)勢。Tokenizer必須消失,他強(qiáng)調(diào)

      Karpathy總結(jié)道,OCR只是眾多視覺到文本(vision -> text)任務(wù)中的一種。而傳統(tǒng)的文本到文本(text -> text)任務(wù),完全可以被重構(gòu)成視覺到文本任務(wù),反之則不行

      他設(shè)想的未來交互模式可能是:用戶的輸入(Message)是圖像,而解碼器(Assistant的響應(yīng))的輸出仍然是文本。因?yàn)槿绾握鎸?shí)地輸出像素,或者是否有必要這樣做,目前還不明確

      核心爭議:雙向注意力與圖像分塊

      對(duì)于Karpathy的觀點(diǎn),AI學(xué)者Yoav Goldberg提出了兩個(gè)疑問:


      1.為什么說圖像能輕松獲得雙向注意力,而文本不能?

      2.雖然沒有了Tokenization,但將輸入圖像切分成圖塊(Patches),難道不是一種類似且可能更丑陋的處理方式嗎?

      Karpathy對(duì)此進(jìn)行了解釋。

      他回應(yīng)說,原則上沒有任何東西阻止文本使用雙向注意力。但為了效率,文本通常都是以自回歸的方式進(jìn)行訓(xùn)練的。他設(shè)想,可以在訓(xùn)練中期加入一個(gè)微調(diào)階段,用雙向注意力來處理作為條件的信息(比如用戶的輸入消息,因?yàn)檫@些Token不需要模型去生成)。但他不確定在實(shí)踐中是否有人這樣做。理論上,為了預(yù)測下一個(gè)Token,甚至可以對(duì)整個(gè)上下文窗口進(jìn)行雙向編碼,但這將導(dǎo)致訓(xùn)練無法并行化

      最后他補(bǔ)充道,或許這個(gè)方面(雙向注意力)嚴(yán)格來說并非像素與Token的本質(zhì)區(qū)別,更多是像素通常被編碼(encoded),而Token通常被解碼(decoded)(借用原始Transformer論文的術(shù)語)

      馬斯克:未來99%是光子

      在這場討論的最后,Elon Musk也現(xiàn)身評(píng)論區(qū),并給出了一個(gè)更具未來感的判斷:


      從長遠(yuǎn)來看,AI模型超過99%的輸入和輸出都將是光子。沒有其他任何東西可以規(guī)模化

      馬斯克的這條評(píng)論并非隨口一說。他進(jìn)一步補(bǔ)充了一段堪稱硬核的宇宙學(xué)科普,來解釋為什么他認(rèn)為“光子”是終極的規(guī)模化方案

      簡單來說,宇宙中絕大多數(shù)的粒子都是光子

      而這些光子最主要的來源,是宇宙微波背景(CMB)。根據(jù)測算,CMB的光子密度約為每立方厘米410個(gè)。將這個(gè)密度乘以可觀測宇宙的巨大體積(半徑約465億光年),可以得出僅CMB貢獻(xiàn)的光子數(shù)量就達(dá)到了一個(gè)驚人的數(shù)字:約1.5 x 10??個(gè)

      相比之下,所有恒星發(fā)出的光子(星光)以及其他來源(如中微子背景、黑洞輻射等)貢獻(xiàn)的數(shù)量,則完全可以忽略不計(jì)

      這背后揭示的物理事實(shí)是:光子在數(shù)量級(jí)上擁有無與倫比的優(yōu)勢。這或許就是馬斯克認(rèn)為AI的未來輸入輸出將由光子主宰的底層邏輯

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      突發(fā)!《亞洲周刊》刪除關(guān)于南博的所有帖子,龐叔令“授權(quán)”失效

      突發(fā)!《亞洲周刊》刪除關(guān)于南博的所有帖子,龐叔令“授權(quán)”失效

      火山詩話
      2025-12-29 05:51:21
      中國不是就業(yè)難,是已經(jīng)全面進(jìn)入「零工社會(huì)」

      中國不是就業(yè)難,是已經(jīng)全面進(jìn)入「零工社會(huì)」

      匹夫來搞笑
      2025-12-28 13:12:18
      最后一場!曼聯(lián)功臣面臨停賽,凱塞多、多納魯馬一定要忍住

      最后一場!曼聯(lián)功臣面臨停賽,凱塞多、多納魯馬一定要忍住

      嗨皮看球
      2025-12-30 15:55:08
      1996年,姚文元出獄后,向中央提兩個(gè)請(qǐng)求,第二個(gè)被一口回絕

      1996年,姚文元出獄后,向中央提兩個(gè)請(qǐng)求,第二個(gè)被一口回絕

      雍親王府
      2025-11-15 21:50:03
      可以公開:軍委調(diào)27軍老山參戰(zhàn),戰(zhàn)士們紛紛請(qǐng)假離隊(duì), 畏戰(zhàn)逃兵

      可以公開:軍委調(diào)27軍老山參戰(zhàn),戰(zhàn)士們紛紛請(qǐng)假離隊(duì), 畏戰(zhàn)逃兵

      比利
      2025-12-30 12:30:16
      以好色出名的抗日名將,逃跑本事無人能比,卻能屈能伸活到103歲

      以好色出名的抗日名將,逃跑本事無人能比,卻能屈能伸活到103歲

      古書記史
      2025-12-22 19:52:23
      大陸圍島演習(xí),各方反應(yīng)亮了,江啟臣罕見說“不”,美軍尋求避戰(zhàn)

      大陸圍島演習(xí),各方反應(yīng)亮了,江啟臣罕見說“不”,美軍尋求避戰(zhàn)

      影孖看世界
      2025-12-30 15:22:17
      扛不住了?“委內(nèi)瑞拉開始關(guān)停”

      扛不住了?“委內(nèi)瑞拉開始關(guān)停”

      觀察者網(wǎng)
      2025-12-30 10:29:50
      林強(qiáng)涉案989億被抓!生活奢華超過中東富豪,超5萬百姓血本無歸

      林強(qiáng)涉案989億被抓!生活奢華超過中東富豪,超5萬百姓血本無歸

      千言娛樂記
      2025-12-27 20:07:06
      1989年,宋時(shí)輪去八寶山參加追悼會(huì),結(jié)束后直言:這追悼方式不好

      1989年,宋時(shí)輪去八寶山參加追悼會(huì),結(jié)束后直言:這追悼方式不好

      大運(yùn)河時(shí)空
      2025-12-29 14:45:03
      艾頓:不是每個(gè)人都能直接走到詹姆斯面前,告訴他該怎么做

      艾頓:不是每個(gè)人都能直接走到詹姆斯面前,告訴他該怎么做

      建康啊你可以的
      2025-12-29 22:32:58
      融創(chuàng)中國成功賴賬600億元

      融創(chuàng)中國成功賴賬600億元

      地產(chǎn)微資訊
      2025-12-30 15:50:44
      巴拿馬火速修紀(jì)念碑,求中國放過?中方要求很明確:需嚴(yán)懲當(dāng)事方

      巴拿馬火速修紀(jì)念碑,求中國放過?中方要求很明確:需嚴(yán)懲當(dāng)事方

      近史談
      2025-12-30 15:39:00
      風(fēng)向徹底變了!美媒和韓媒的報(bào)道,都開始緊盯一件事

      風(fēng)向徹底變了!美媒和韓媒的報(bào)道,都開始緊盯一件事

      墜入二次元的海洋
      2025-12-30 15:19:19
      2025年中國國際形象全球調(diào)查報(bào)告:國際社會(huì)對(duì)華好感度持續(xù)提升

      2025年中國國際形象全球調(diào)查報(bào)告:國際社會(huì)對(duì)華好感度持續(xù)提升

      澎湃新聞
      2025-12-29 11:45:11
      東部戰(zhàn)區(qū)太霸氣!最新視頻《這么近那么美,隨時(shí)到臺(tái)北》評(píng)論炸鍋

      東部戰(zhàn)區(qū)太霸氣!最新視頻《這么近那么美,隨時(shí)到臺(tái)北》評(píng)論炸鍋

      丁丁鯉史紀(jì)
      2025-12-30 09:28:02
      大風(fēng)追蹤|女教師上班途中“撞樹枝”身亡,二審查明交警認(rèn)定超速不當(dāng),主次責(zé)改判

      大風(fēng)追蹤|女教師上班途中“撞樹枝”身亡,二審查明交警認(rèn)定超速不當(dāng),主次責(zé)改判

      大風(fēng)新聞
      2025-12-29 18:37:30
      你無意中發(fā)現(xiàn)過別人哪些秘密?網(wǎng)友:這不是我一個(gè)單身狗能看的

      你無意中發(fā)現(xiàn)過別人哪些秘密?網(wǎng)友:這不是我一個(gè)單身狗能看的

      帶你感受人間冷暖
      2025-12-18 00:10:08
      2將缺陣!陳盈駿鼻骨斷3截,曾凡博也上不了,首鋼3場硬仗不好打

      2將缺陣!陳盈駿鼻骨斷3截,曾凡博也上不了,首鋼3場硬仗不好打

      體壇鑒春秋
      2025-12-30 13:26:55
      利空突襲!凌晨,史詩級(jí)暴跌!

      利空突襲!凌晨,史詩級(jí)暴跌!

      證券時(shí)報(bào)
      2025-12-30 07:44:05
      2025-12-30 16:39:00
      AI寒武紀(jì) incentive-icons
      AI寒武紀(jì)
      專注于人工智能,科技領(lǐng)域
      1024文章數(shù) 393關(guān)注度
      往期回顧 全部

      科技要聞

      估值150億的智元,開始批量"制造"小獨(dú)角獸

      頭條要聞

      "退貨羽絨服口袋里現(xiàn)機(jī)票"引發(fā)爭議 買家遭網(wǎng)暴后喊冤

      頭條要聞

      "退貨羽絨服口袋里現(xiàn)機(jī)票"引發(fā)爭議 買家遭網(wǎng)暴后喊冤

      體育要聞

      這個(gè)59歲的胖子,還在表演“蝎子擺尾”

      娛樂要聞

      林俊杰官宣文案爭議!女方名字都不提

      財(cái)經(jīng)要聞

      朱光耀:美關(guān)稅政策正使WTO名存實(shí)亡

      汽車要聞

      標(biāo)配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態(tài)度原創(chuàng)

      本地
      藝術(shù)
      家居
      時(shí)尚
      公開課

      本地新聞

      即將過去的2025年,對(duì)重慶的影響竟然如此深遠(yuǎn)

      藝術(shù)要聞

      謝稚柳雪景山水20圖

      家居要聞

      當(dāng)歸之宅 三胎圓滿居所

      她們冬天這樣穿,真的很美!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 一本色道无码DvD免费视频| 国产人妻丰满熟妇嗷嗷叫| 99热久久这里只有精品| 国产精自产拍久久久久久蜜| 日韩激烈无码| 国产精品一二| 深圳市| 新昌县| 精品人妻一区二区三区四区视频不卡| 中文字幕亚洲综合久久综合| 天堂8中文在线最新版在线| 久久香蕉超碰97国产精品| 成人免费AV| 亚洲综合精品中文字幕| 综合无码| 亚洲AV无码不卡在线播放| 欧美顶级metart裸体全部自慰| 国产精品无码永久免费A片| 品精免费产品精品综合精品综合| 国产欧美日韩综合精品一区二区| 狼人青草久久网伊人| 国自产拍偷拍精品啪啪模特| 欧美日本在线| 亚洲一区精品视频在线| 波多野结衣无码视频| 科技| 人妻小说区图片区| 2018av天堂在线视频精品观看| 欧美日韩在线视频| 国产999久久高清免费观看| 亚洲欧美综合精品成| www.欧美精品| 国产chinese男男网站| 99插插插| 亚洲熟女综合色一区二区三区| 国产极品美女到高潮| 免青青草免费观看视频在线| 永久免费看mv网站入口| 99热视屏| 香港经典a毛片免费观看播放| 两根大肉大捧一进一出好爽视频|