<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      一個(gè)瘋子,造出便宜100倍的AI芯片

      0
      分享至

      25個(gè)人,3000萬(wàn)美金,兩年半。

      做出了一塊碾壓英偉達(dá)旗艦GPU 10倍的芯片。

      不是PPT,不是實(shí)驗(yàn)室demo。芯片已經(jīng)量產(chǎn),API已經(jīng)開(kāi)放,開(kāi)發(fā)者現(xiàn)在就能測(cè)。

      做這件事的人叫Ljubisa Bajic。兩年前,他放棄了自己一手創(chuàng)辦的、估值32億美金的AI

      芯片公司Tenstorrent。AI芯片賽道正火,資本瘋搶,所有人都覺(jué)得他瘋了。

      但Bajic覺(jué)得,真正瘋的是這個(gè)行業(yè)——大家花幾十億美金造芯片,結(jié)果90%的算力都在搬數(shù)據(jù),不在算數(shù)據(jù)。

      他放不下一個(gè)問(wèn)題:AI推理,為什么非得這么貴?

      問(wèn)題有多本質(zhì)?

      你用ChatGPT問(wèn)一個(gè)問(wèn)題,背后是什么?是一堆服務(wù)器里的GPU,把一個(gè)幾十GB甚至幾百GB的模型文件,從內(nèi)存里反復(fù)搬運(yùn)到計(jì)算單元,一個(gè)字一個(gè)字地算出來(lái),再傳給你。

      這個(gè)過(guò)程,每問(wèn)一次,就搬一次。不是搬一次,是每生成一個(gè)token,都要把所有的模型權(quán)重過(guò)一遍。

      NVIDIA的GPU賣這么貴,本質(zhì)上是在賣"通用性"——它什么模型都能跑。這種靈活性,代價(jià)是極大的浪費(fèi)。好比你每次做飯,都要把整個(gè)菜市場(chǎng)搬進(jìn)廚房,然后再搬走。

      Bajic想的是:如果你只做一道菜,為什么不直接把菜長(zhǎng)在廚房里?

      這就是Taalas的起點(diǎn)。

      先說(shuō)說(shuō)Bajic這個(gè)人

      他的履歷,光看都覺(jué)得累。在AMD做了十幾年,從工程師一路做到GPU芯片架構(gòu)師,主導(dǎo)過(guò)混合CPU-GPU芯片的整體設(shè)計(jì)。后來(lái)跳去Nvidia做了一年高級(jí)架構(gòu)師,結(jié)果又被AMD挖回去,當(dāng)了兩年集成電路設(shè)計(jì)總監(jiān)。

      AMD、Nvidia、AMD——在兩家芯片巨頭之間來(lái)回蹦跶。不是他坐不住,是這個(gè)行業(yè)的頂尖人才就這樣,誰(shuí)給更大的舞臺(tái)就去誰(shuí)那兒。

      再后來(lái)他自己出來(lái)創(chuàng)業(yè),創(chuàng)辦了Tenstorrent——專做AI芯片。公司融了7億美金,估值一路飆到32億。為了補(bǔ)強(qiáng)團(tuán)隊(duì),他請(qǐng)來(lái)了芯片界的傳奇人物Jim Keller先擔(dān)任CTO——這個(gè)人在AMD設(shè)計(jì)過(guò)Zen架構(gòu)、在蘋果做過(guò)A系列芯片、在特斯拉搞過(guò)自動(dòng)駕駛芯片,硅谷芯片圈的活化石。

      Keller一開(kāi)始以CTO身份加入,負(fù)責(zé)技術(shù)方向。但很快,Bajic發(fā)現(xiàn)這個(gè)人不只是能做技術(shù)——他能扛起整個(gè)公司。于是Bajic把他升為CEO,自己退到幕后。2022年秋天,Bajic徹底離開(kāi)了Tenstorrent。

      一手創(chuàng)辦的公司,估值32億,親手交給別人,然后走人。

      他停下來(lái)想了六個(gè)月,然后做了一個(gè)更瘋的決定。

      顛覆80年的基本假設(shè)

      2023年,Bajic帶著他的妻子Lejla(AMD/Tenstorrent系統(tǒng)工程老兵,后出任COO),還有老搭檔Drago Ignjatovic(前Tenstorrent硬件VP,出任CTO),三個(gè)人,把這個(gè)想法從零開(kāi)始做。

      他們給這個(gè)方向起了個(gè)霸氣的名字:Hardcore Models.

      口號(hào)只有六個(gè)字:The Model is The Computer.

      不是模型運(yùn)行在計(jì)算機(jī)上。模型本身,就是那臺(tái)計(jì)算機(jī)。

      具體怎么做到的?

      具體怎么做到的?Bajic的技術(shù)解釋,我覺(jué)得非常有意思。傳統(tǒng)芯片的邏輯是:有一堆計(jì)算單元,有一堆內(nèi)存,需要推理的時(shí)候,把模型權(quán)重從內(nèi)存搬到計(jì)算單元,算完結(jié)果,再吐出來(lái)。這中間有一道無(wú)形的"墻"——內(nèi)存帶寬墻。

      你能算多快,取決于你能搬多快。這道墻,是整個(gè)AI算力行業(yè)幾十年的噩夢(mèng)。Cerebras用一整個(gè)晶圓做計(jì)算,SambaNova和Groq用大量高速SRAM,本質(zhì)都是在想辦法把這道墻打薄。但墻還在。

      Taalas的做法,是把這道墻徹底炸掉。

      從1945年馮·諾依曼提出計(jì)算機(jī)架構(gòu)至今,有一個(gè)基本假設(shè)從沒(méi)變過(guò):存儲(chǔ)是存儲(chǔ),計(jì)算是計(jì)算,中間靠總線搬數(shù)據(jù)。八十年了,所有芯片都在這個(gè)框架里優(yōu)化。

      Bajic說(shuō):我不優(yōu)化了,我把這個(gè)架構(gòu)廢了。

      存儲(chǔ)和計(jì)算,合為一體。模型參數(shù)直接刻進(jìn)晶體管,晶體管本身既是存儲(chǔ)又是計(jì)算。不需要搬運(yùn),因?yàn)閿?shù)據(jù)就長(zhǎng)在計(jì)算的地方。

      這才是真正瘋的地方——不是做一塊更快的芯片,而是否定了八十年來(lái)計(jì)算機(jī)的基本假設(shè)。

      他們發(fā)明了一種叫"Mask ROM Recall Fabric"的架構(gòu)——直接把模型權(quán)重,在芯片制造的時(shí)候,固化進(jìn)晶體管里。不是寫進(jìn)內(nèi)存,是刻進(jìn)硅里。

      他們用的是70年代手工晶體管級(jí)別的設(shè)計(jì)方法,一行一行地布局,像在手工雕刻。一共申請(qǐng)了14項(xiàng)專利。

      結(jié)果

      第一代芯片HC1,TSMC 6納米工藝,815平方毫米,530億個(gè)晶體管,功耗200W一張卡。

      跑Llama 3.1 8B的推理速度:17,000 tokens/秒(每用戶)

      NVIDIA最新的B200(Blackwell架構(gòu)):大約1,800 tokens/秒

      差了將近10倍。成本便宜20倍功耗低10倍。

      而且,因?yàn)樗俣忍欤静恍枰?批處理"。HC1速度太快,每個(gè)用戶的請(qǐng)求直接實(shí)時(shí)響應(yīng),延遲極低。

      低延遲和低成本,原本是一對(duì)矛盾。Taalas說(shuō),我兩個(gè)都要。

      代價(jià)與解法

      你可能會(huì)問(wèn):這聽(tīng)起來(lái)太好了,有什么代價(jià)?

      有的。

      每一個(gè)模型,對(duì)應(yīng)一款專屬芯片。你想跑Llama 3.1,就得用Llama 3.1的HC芯片。

      Bajic說(shuō):不麻煩。他們和TSMC一起,設(shè)計(jì)了一套"兩層金屬"的快速更新方案——換個(gè)模型,只改芯片里的兩層金屬。從收到新模型的權(quán)重,到可以量產(chǎn)出貨:兩個(gè)月

      定制一塊專屬推理芯片,成本大概是訓(xùn)練成本的百分之一。

      這個(gè)賬,算得過(guò)來(lái)。

      更關(guān)鍵的是:模型更新的速度,正在放緩。用戶開(kāi)始在乎"穩(wěn)定性"多過(guò)"新功能"。GPT-4到GPT-4.5到GPT-5,不少企業(yè)用戶反而不急著升級(jí),因?yàn)橐呀?jīng)跑通的工作流不想被打亂。這種趨勢(shì),恰恰給了HC芯片更大的生存空間。

      25人,$3000萬(wàn)

      Taalas今年2月剛宣布完成$1.69億融資,總?cè)谫Y額達(dá)到$2.19億,投資方包括Fidelity(富達(dá))。

      他們總共只花了$3000萬(wàn)在研發(fā)上。還有$1.7億在賬上沒(méi)動(dòng)。

      25個(gè)人,$3000萬(wàn),兩年半做出了一個(gè)跑贏NVIDIA旗艦GPU 10倍的芯片。

      這不是在吹牛。他們現(xiàn)在已經(jīng)有公開(kāi)可用的API(chatjimmy.ai),開(kāi)發(fā)者可以自己去測(cè)。

      我見(jiàn)過(guò)太多創(chuàng)業(yè)團(tuán)隊(duì),動(dòng)不動(dòng)就說(shuō)要做多大的事,然后花很多錢,很多年,產(chǎn)出一個(gè)平庸的結(jié)果。Taalas這個(gè)數(shù)字,讓我坐直了。

      極度焦慮=極度效率

      這件事讓我想到一個(gè)更大的問(wèn)題:資源,到底是優(yōu)勢(shì),還是束縛?

      Taalas走了另一條路:用極度聚焦換來(lái)極度效率。

      Bajic從AMD到Tenstorrent,再到Taalas,每次都在做減法:

      • AMD:做所有人的GPU

      • Tenstorrent:做AI時(shí)代的通用芯片

      • Taalas:只做一個(gè)模型的最優(yōu)硬件

      越聚越窄,越聚越深,越聚越快。

      我自己做獵豹的時(shí)候,也經(jīng)歷過(guò)類似的階段。做移動(dòng)工具的那幾年,整個(gè)團(tuán)隊(duì)想的就是一件事:如何在手機(jī)清理這件小事上,做到極致?

      別人覺(jué)得這太窄,沒(méi)有未來(lái)。但正是這種極致的聚焦,讓我們?cè)谌虺^(guò)一億用戶。

      Taalas讓我想到,這個(gè)道理在硬科技領(lǐng)域一樣成立——甚至更成立。因?yàn)橛布蒎e(cuò)率更低,極度聚焦,不是退而求其次,而是生存本能。

      因?yàn)橛布蒎e(cuò)率更低。你不能"先發(fā)布再迭代",每次流片都是真金白銀。極度聚焦,不是退而求其次,而是生存本能。

      順便說(shuō),Taalas的VP of Products,叫Paresh Kharya。

      這個(gè)人之前在NVIDIA做了三年數(shù)據(jù)中心業(yè)務(wù)高級(jí)產(chǎn)品負(fù)責(zé)人,然后去Google Cloud管了一段時(shí)間GPU和TPU的整個(gè)硬件產(chǎn)品線。

      從NVIDIA和Google的內(nèi)部,主動(dòng)跳槽去一個(gè)25人的初創(chuàng)公司。

      這個(gè)選擇,很說(shuō)明問(wèn)題。見(jiàn)過(guò)最好的,選擇去做可能更顛覆的,這種判斷不輕易發(fā)生。

      價(jià)格革命

      當(dāng)然,Taalas面前還有很多沒(méi)解決的問(wèn)題。

      模型迭代越來(lái)越快,兩個(gè)月的交貨周期夠不夠?超大參數(shù)量的模型(數(shù)千億參數(shù))怎么做,目前HC1只支持80億參數(shù),HC2年底才出。客戶愿不愿意為"專用芯片"接受靈活性上的限制,這是真實(shí)的商業(yè)挑戰(zhàn)。

      這些問(wèn)題,都不是小問(wèn)題。

      但有一件事我覺(jué)得是確定的:AI推理的成本,必然會(huì)被打穿。

      DeepSeek從訓(xùn)練端做到了,用更少的算力訓(xùn)練出接近GPT-4水平的模型。

      Taalas從推理端做,把同一個(gè)模型的運(yùn)行成本砍掉20倍

      兩條路,同一個(gè)方向——讓AI的使用成本趨近于零。

      這不是一個(gè)技術(shù)故事,這是一場(chǎng)價(jià)格革。

      最后說(shuō)一句話。

      Bajic離開(kāi)Tenstorrent的時(shí)候,所有人都說(shuō)他瘋了——AI芯片賽道正熱,公司估值$32億,你走什么走?

      但他停下來(lái)想了六個(gè)月,然后去做一件更瘋的事——否定馮·諾依曼架構(gòu),把模型直接燒進(jìn)芯片。

      現(xiàn)在他們拿著$2.19億,25個(gè)人,從加拿大多倫多出發(fā),準(zhǔn)備在一個(gè)萬(wàn)億美元的市場(chǎng)里,打出一道裂縫。

      有時(shí)候,瘋子才能看到正常人看不到的路。

      這件事的結(jié)局還沒(méi)寫完。但開(kāi)頭,已經(jīng)很精彩了。

      Taalas的HC1已經(jīng)可以申請(qǐng)API試用:taalas.com/api-request-form/。如果你在做AI應(yīng)用,不妨去測(cè)一下。17,000 tokens/秒是什么感覺(jué),親眼看看。

      關(guān)于EasyClaw


      AI推理成本趨近于零的那一天,真正的價(jià)值不在算力,在應(yīng)用。

      EasyClaw是我們做的AI Agent平臺(tái)——讓每個(gè)人都能擁有自己的AI助理,7×24小時(shí)幫你處理工作、獲取信息、管理日程。不需要寫代碼,不需要懂技術(shù),開(kāi)箱即用。

      Taalas讓AI算力便宜100倍,EasyClaw讓AI能力人人可用。

      easyclaw.com — 你的第一只龍蝦,在等你。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      媽祖被換后續(xù):官方發(fā)通報(bào)澄清,許家人身份曝光,還有更多疑點(diǎn)

      媽祖被換后續(xù):官方發(fā)通報(bào)澄清,許家人身份曝光,還有更多疑點(diǎn)

      離離言幾許
      2026-02-22 23:41:21
      橙子再次被發(fā)現(xiàn)!醫(yī)生發(fā)現(xiàn):高血壓患者常吃橙子,或出現(xiàn)4種變化

      橙子再次被發(fā)現(xiàn)!醫(yī)生發(fā)現(xiàn):高血壓患者常吃橙子,或出現(xiàn)4種變化

      小胡軍事愛(ài)好
      2026-02-08 22:34:31
      TOP14位身高170以上的女神,有顏有燈有演技

      TOP14位身高170以上的女神,有顏有燈有演技

      素然追光
      2026-01-02 02:45:02
      單打32強(qiáng)出爐!國(guó)乒3人出局;日乒男單折戟一半;韓國(guó)女單剩獨(dú)苗

      單打32強(qiáng)出爐!國(guó)乒3人出局;日乒男單折戟一半;韓國(guó)女單剩獨(dú)苗

      莼侃體育
      2026-02-24 00:27:40
      何卓佳3-1葉伊恬晉級(jí)32強(qiáng)!前2局吊打,后2局反手起伏穩(wěn)住關(guān)鍵分

      何卓佳3-1葉伊恬晉級(jí)32強(qiáng)!前2局吊打,后2局反手起伏穩(wěn)住關(guān)鍵分

      籃球資訊達(dá)人
      2026-02-23 21:05:49
      7家美國(guó)企業(yè)上榜,中國(guó)大陸芯片公司全軍覆沒(méi),這份榜單讓人清醒

      7家美國(guó)企業(yè)上榜,中國(guó)大陸芯片公司全軍覆沒(méi),這份榜單讓人清醒

      科技專家
      2026-02-23 16:15:14
      貝加爾湖溺亡中國(guó)游客遺體均被打撈上岸!車上成員含一家四口

      貝加爾湖溺亡中國(guó)游客遺體均被打撈上岸!車上成員含一家四口

      南方都市報(bào)
      2026-02-22 17:40:24
      關(guān)于春節(jié)假期延長(zhǎng)的通知

      關(guān)于春節(jié)假期延長(zhǎng)的通知

      I河源
      2026-02-22 23:26:40
      我為什么那么厭惡高市早苗

      我為什么那么厭惡高市早苗

      天真無(wú)牙
      2026-02-23 11:06:20
      我在莫斯科工作5年,娶了個(gè)當(dāng)?shù)毓媚铮貒?guó)時(shí)才知道自己娶的是誰(shuí)

      我在莫斯科工作5年,娶了個(gè)當(dāng)?shù)毓媚?,回?guó)時(shí)才知道自己娶的是誰(shuí)

      生活魔術(shù)專家
      2026-02-23 19:01:30
      特朗普訪華日程敲定,先凍結(jié)對(duì)臺(tái)軍售!不是心軟,是真扛不住了

      特朗普訪華日程敲定,先凍結(jié)對(duì)臺(tái)軍售!不是心軟,是真扛不住了

      東極妙嚴(yán)
      2026-02-23 11:34:51
      那藝娜多個(gè)賬號(hào)被禁止關(guān)注,視頻已清空!此前被認(rèn)定為劣跡藝人,叫停演出

      那藝娜多個(gè)賬號(hào)被禁止關(guān)注,視頻已清空!此前被認(rèn)定為劣跡藝人,叫停演出

      上觀新聞
      2026-02-23 15:03:06
      凌峰:兩岸婚姻太累,七十九歲隱居泰國(guó),妻女失聯(lián),一人孤苦伶仃

      凌峰:兩岸婚姻太累,七十九歲隱居泰國(guó),妻女失聯(lián),一人孤苦伶仃

      小熊侃史
      2026-02-23 13:03:54
      郵輪假期變噩夢(mèng)!退休夫婦回家見(jiàn)賬單崩潰,存款瞬間縮水

      郵輪假期變噩夢(mèng)!退休夫婦回家見(jiàn)賬單崩潰,存款瞬間縮水

      華人生活網(wǎng)
      2026-02-23 02:27:49
      貝加爾湖遇難中國(guó)游客身份全部確認(rèn):七條生命,一個(gè)破碎的春節(jié)

      貝加爾湖遇難中國(guó)游客身份全部確認(rèn):七條生命,一個(gè)破碎的春節(jié)

      青木說(shuō)
      2026-02-22 09:02:50
      2026年的保命策略:在這3個(gè)地方,主動(dòng)選擇裝窮

      2026年的保命策略:在這3個(gè)地方,主動(dòng)選擇裝窮

      舒山有鹿
      2026-02-21 10:48:07
      被打女孩至今半昏迷!打人夫妻徹底栽了,網(wǎng)友:比唐山打人案更狠

      被打女孩至今半昏迷!打人夫妻徹底栽了,網(wǎng)友:比唐山打人案更狠

      愛(ài)寫的櫻桃
      2026-02-23 22:06:50
      2026年最神的神童

      2026年最神的神童

      木子默
      2026-02-23 20:46:54
      村里紅白事從不回,男子母親離世,鄰居等著看笑話,結(jié)果長(zhǎng)了見(jiàn)識(shí)

      村里紅白事從不回,男子母親離世,鄰居等著看笑話,結(jié)果長(zhǎng)了見(jiàn)識(shí)

      子芫伴你成長(zhǎng)
      2026-02-23 12:21:40
      2026春節(jié)十大“怪象”,越看越扎心,幾乎家家都中招!

      2026春節(jié)十大“怪象”,越看越扎心,幾乎家家都中招!

      健身狂人
      2026-02-24 04:57:55
      2026-02-24 06:11:00
      傅盛 incentive-icons
      傅盛
      獵豹移動(dòng)董事長(zhǎng)兼CEO、獵戶星空董事長(zhǎng)
      37文章數(shù) 718關(guān)注度
      往期回顧 全部

      科技要聞

      智譜、MiniMax合計(jì)蒸發(fā)近千億市值,為何?

      頭條要聞

      墨西哥最大毒梟被擊斃:喜歡殺人滅門 幾乎沒(méi)人看見(jiàn)過(guò)他

      頭條要聞

      墨西哥最大毒梟被擊斃:喜歡殺人滅門 幾乎沒(méi)人看見(jiàn)過(guò)他

      體育要聞

      哈登版騎士首?。豪做墓谲娬n

      娛樂(lè)要聞

      那藝娜賬號(hào)被禁止關(guān)注,視頻已清空!

      財(cái)經(jīng)要聞

      美國(guó)海關(guān)將停止征收被裁定違法的關(guān)稅

      汽車要聞

      續(xù)航1810km!smart精靈#6 EHD超級(jí)電混2026年上市

      態(tài)度原創(chuàng)

      家居
      數(shù)碼
      本地
      教育
      房產(chǎn)

      家居要聞

      本真棲居 愛(ài)暖伴流年

      數(shù)碼要聞

      英特爾要回歸統(tǒng)一核心設(shè)計(jì),預(yù)計(jì)未來(lái)十年推出!

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      教育要聞

      北大教授透露:70% 職高生農(nóng)村戶口,不是孩子不爭(zhēng)氣,是現(xiàn)實(shí)扎心

      房產(chǎn)要聞

      窗前即地標(biāo)!獨(dú)占三亞灣C位 自貿(mào)港總裁行宮亮相

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版