<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      一個瘋子,造出便宜100倍的AI芯片

      0
      分享至

      25個人,3000萬美金,兩年半。

      做出了一塊碾壓英偉達旗艦GPU 10倍的芯片。

      不是PPT,不是實驗室demo。芯片已經量產,API已經開放,開發者現在就能測。

      做這件事的人叫Ljubisa Bajic。兩年前,他放棄了自己一手創辦的、估值32億美金的AI

      芯片公司Tenstorrent。AI芯片賽道正火,資本瘋搶,所有人都覺得他瘋了。

      但Bajic覺得,真正瘋的是這個行業——大家花幾十億美金造芯片,結果90%的算力都在搬數據,不在算數據。

      他放不下一個問題:AI推理,為什么非得這么貴?

      問題有多本質?

      你用ChatGPT問一個問題,背后是什么?是一堆服務器里的GPU,把一個幾十GB甚至幾百GB的模型文件,從內存里反復搬運到計算單元,一個字一個字地算出來,再傳給你。

      這個過程,每問一次,就搬一次。不是搬一次,是每生成一個token,都要把所有的模型權重過一遍。

      NVIDIA的GPU賣這么貴,本質上是在賣"通用性"——它什么模型都能跑。這種靈活性,代價是極大的浪費。好比你每次做飯,都要把整個菜市場搬進廚房,然后再搬走。

      Bajic想的是:如果你只做一道菜,為什么不直接把菜長在廚房里?

      這就是Taalas的起點。

      先說說Bajic這個人

      他的履歷,光看都覺得累。在AMD做了十幾年,從工程師一路做到GPU芯片架構師,主導過混合CPU-GPU芯片的整體設計。后來跳去Nvidia做了一年高級架構師,結果又被AMD挖回去,當了兩年集成電路設計總監。

      AMD、Nvidia、AMD——在兩家芯片巨頭之間來回蹦跶。不是他坐不住,是這個行業的頂尖人才就這樣,誰給更大的舞臺就去誰那兒。

      再后來他自己出來創業,創辦了Tenstorrent——專做AI芯片。公司融了7億美金,估值一路飆到32億。為了補強團隊,他請來了芯片界的傳奇人物Jim Keller先擔任CTO——這個人在AMD設計過Zen架構、在蘋果做過A系列芯片、在特斯拉搞過自動駕駛芯片,硅谷芯片圈的活化石。

      Keller一開始以CTO身份加入,負責技術方向。但很快,Bajic發現這個人不只是能做技術——他能扛起整個公司。于是Bajic把他升為CEO,自己退到幕后。2022年秋天,Bajic徹底離開了Tenstorrent。

      一手創辦的公司,估值32億,親手交給別人,然后走人。

      他停下來想了六個月,然后做了一個更瘋的決定。

      顛覆80年的基本假設

      2023年,Bajic帶著他的妻子Lejla(AMD/Tenstorrent系統工程老兵,后出任COO),還有老搭檔Drago Ignjatovic(前Tenstorrent硬件VP,出任CTO),三個人,把這個想法從零開始做。

      他們給這個方向起了個霸氣的名字:Hardcore Models.

      口號只有六個字:The Model is The Computer.

      不是模型運行在計算機上。模型本身,就是那臺計算機。

      具體怎么做到的?

      具體怎么做到的?Bajic的技術解釋,我覺得非常有意思。傳統芯片的邏輯是:有一堆計算單元,有一堆內存,需要推理的時候,把模型權重從內存搬到計算單元,算完結果,再吐出來。這中間有一道無形的"墻"——內存帶寬墻。

      你能算多快,取決于你能搬多快。這道墻,是整個AI算力行業幾十年的噩夢。Cerebras用一整個晶圓做計算,SambaNova和Groq用大量高速SRAM,本質都是在想辦法把這道墻打薄。但墻還在。

      Taalas的做法,是把這道墻徹底炸掉。

      從1945年馮·諾依曼提出計算機架構至今,有一個基本假設從沒變過:存儲是存儲,計算是計算,中間靠總線搬數據。八十年了,所有芯片都在這個框架里優化。

      Bajic說:我不優化了,我把這個架構廢了。

      存儲和計算,合為一體。模型參數直接刻進晶體管,晶體管本身既是存儲又是計算。不需要搬運,因為數據就長在計算的地方。

      這才是真正瘋的地方——不是做一塊更快的芯片,而是否定了八十年來計算機的基本假設。

      他們發明了一種叫"Mask ROM Recall Fabric"的架構——直接把模型權重,在芯片制造的時候,固化進晶體管里。不是寫進內存,是刻進硅里

      他們用的是70年代手工晶體管級別的設計方法,一行一行地布局,像在手工雕刻。一共申請了14項專利。

      結果

      第一代芯片HC1,TSMC 6納米工藝,815平方毫米,530億個晶體管,功耗200W一張卡。

      跑Llama 3.1 8B的推理速度:17,000 tokens/秒(每用戶)

      NVIDIA最新的B200(Blackwell架構):大約1,800 tokens/秒

      差了將近10倍。成本便宜20倍功耗低10倍

      而且,因為速度太快,根本不需要"批處理"。HC1速度太快,每個用戶的請求直接實時響應,延遲極低。

      低延遲和低成本,原本是一對矛盾。Taalas說,我兩個都要。

      代價與解法

      你可能會問:這聽起來太好了,有什么代價?

      有的。

      每一個模型,對應一款專屬芯片。你想跑Llama 3.1,就得用Llama 3.1的HC芯片。

      Bajic說:不麻煩。他們和TSMC一起,設計了一套"兩層金屬"的快速更新方案——換個模型,只改芯片里的兩層金屬。從收到新模型的權重,到可以量產出貨:兩個月

      定制一塊專屬推理芯片,成本大概是訓練成本的百分之一

      這個賬,算得過來。

      更關鍵的是:模型更新的速度,正在放緩。用戶開始在乎"穩定性"多過"新功能"。GPT-4到GPT-4.5到GPT-5,不少企業用戶反而不急著升級,因為已經跑通的工作流不想被打亂。這種趨勢,恰恰給了HC芯片更大的生存空間。

      25人,$3000萬

      Taalas今年2月剛宣布完成$1.69億融資,總融資額達到$2.19億,投資方包括Fidelity(富達)。

      他們總共只花了$3000萬在研發上。還有$1.7億在賬上沒動。

      25個人,$3000萬,兩年半,做出了一個跑贏NVIDIA旗艦GPU 10倍的芯片。

      這不是在吹牛。他們現在已經有公開可用的API(chatjimmy.ai),開發者可以自己去測。

      我見過太多創業團隊,動不動就說要做多大的事,然后花很多錢,很多年,產出一個平庸的結果。Taalas這個數字,讓我坐直了。

      極度焦慮=極度效率

      這件事讓我想到一個更大的問題:資源,到底是優勢,還是束縛?

      Taalas走了另一條路:用極度聚焦換來極度效率

      Bajic從AMD到Tenstorrent,再到Taalas,每次都在做減法:

      • AMD:做所有人的GPU

      • Tenstorrent:做AI時代的通用芯片

      • Taalas:只做一個模型的最優硬件

      越聚越窄,越聚越深,越聚越快。

      我自己做獵豹的時候,也經歷過類似的階段。做移動工具的那幾年,整個團隊想的就是一件事:如何在手機清理這件小事上,做到極致?

      別人覺得這太窄,沒有未來。但正是這種極致的聚焦,讓我們在全球超過一億用戶。

      Taalas讓我想到,這個道理在硬科技領域一樣成立——甚至更成立。因為硬件容錯率更低,極度聚焦,不是退而求其次,而是生存本能。

      因為硬件容錯率更低。你不能"先發布再迭代",每次流片都是真金白銀。極度聚焦,不是退而求其次,而是生存本能。

      順便說,Taalas的VP of Products,叫Paresh Kharya。

      這個人之前在NVIDIA做了三年數據中心業務高級產品負責人,然后去Google Cloud管了一段時間GPU和TPU的整個硬件產品線。

      從NVIDIA和Google的內部,主動跳槽去一個25人的初創公司。

      這個選擇,很說明問題。見過最好的,選擇去做可能更顛覆的,這種判斷不輕易發生。

      價格革命

      當然,Taalas面前還有很多沒解決的問題。

      模型迭代越來越快,兩個月的交貨周期夠不夠?超大參數量的模型(數千億參數)怎么做,目前HC1只支持80億參數,HC2年底才出。客戶愿不愿意為"專用芯片"接受靈活性上的限制,這是真實的商業挑戰。

      這些問題,都不是小問題。

      但有一件事我覺得是確定的:AI推理的成本,必然會被打穿。

      DeepSeek從訓練端做到了,用更少的算力訓練出接近GPT-4水平的模型。

      Taalas從推理端做,把同一個模型的運行成本砍掉20倍。

      兩條路,同一個方向——讓AI的使用成本趨近于零。

      這不是一個技術故事,這是一場價格革。

      最后說一句話。

      Bajic離開Tenstorrent的時候,所有人都說他瘋了——AI芯片賽道正熱,公司估值$32億,你走什么走?

      但他停下來想了六個月,然后去做一件更瘋的事——否定馮·諾依曼架構,把模型直接燒進芯片。

      現在他們拿著$2.19億,25個人,從加拿大多倫多出發,準備在一個萬億美元的市場里,打出一道裂縫。

      有時候,瘋子才能看到正常人看不到的路。

      這件事的結局還沒寫完。但開頭,已經很精彩了。

      Taalas的HC1已經可以申請API試用:taalas.com/api-request-form/。如果你在做AI應用,不妨去測一下。17,000 tokens/秒是什么感覺,親眼看看。

      關于EasyClaw


      AI推理成本趨近于零的那一天,真正的價值不在算力,在應用。

      EasyClaw是我們做的AI Agent平臺——讓每個人都能擁有自己的AI助理,7×24小時幫你處理工作、獲取信息、管理日程。不需要寫代碼,不需要懂技術,開箱即用。

      Taalas讓AI算力便宜100倍,EasyClaw讓AI能力人人可用。

      easyclaw.com — 你的第一只龍蝦,在等你。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      普京和澤連斯基宣布:俄烏?;?2小時!澤連斯基:愿意與普京會面,但不是在莫斯科

      普京和澤連斯基宣布:俄烏?;?2小時!澤連斯基:愿意與普京會面,但不是在莫斯科

      每日經濟新聞
      2026-04-10 17:29:03
      伊朗議長帶四名遇難兒童照片赴美伊談判,配文“我的飛行同伴們”;代表團又名“米納卜168”;此前伊朗米納卜市一小學遭襲,168名女童遇難

      伊朗議長帶四名遇難兒童照片赴美伊談判,配文“我的飛行同伴們”;代表團又名“米納卜168”;此前伊朗米納卜市一小學遭襲,168名女童遇難

      揚子晚報
      2026-04-11 10:45:57
      德國“大神”來華手術,被「中國病歷」嚇到:“我的天...”。中國醫生卻要天天扛著

      德國“大神”來華手術,被「中國病歷」嚇到:“我的天...”。中國醫生卻要天天扛著

      醫護健康科普
      2026-04-11 09:08:37
      命中了!以色列徹底失控了!

      命中了!以色列徹底失控了!

      財經要參
      2026-04-11 05:50:03
      關于兩岸和平統一,鄭麗文正式表態,國民黨三人罕見支持,不簡單

      關于兩岸和平統一,鄭麗文正式表態,國民黨三人罕見支持,不簡單

      DS北風
      2026-04-10 17:16:33
      看了一天!終于理清特朗普老婆和愛潑斯坦的瓜!

      看了一天!終于理清特朗普老婆和愛潑斯坦的瓜!

      啃金融
      2026-04-10 22:47:23
      8888奔馳陪葬當事人已經認識到錯誤,他也確實非常有錢

      8888奔馳陪葬當事人已經認識到錯誤,他也確實非常有錢

      映射生活的身影
      2026-04-10 19:15:23
      以色列,終成人類公敵!

      以色列,終成人類公敵!

      燕梳樓頻道
      2026-04-10 15:02:39
      中東迎來關鍵24小時:伊朗額外提了兩個條件,特朗普邊談邊增兵

      中東迎來關鍵24小時:伊朗額外提了兩個條件,特朗普邊談邊增兵

      阿芒娛樂說
      2026-04-11 09:23:47
      兩段婚姻都娶普通人,三婚娶名導前妻,知名前國腳,如今活成這樣

      兩段婚姻都娶普通人,三婚娶名導前妻,知名前國腳,如今活成這樣

      削桐作琴
      2026-04-10 18:36:31
      為了鄭麗文專機能順利落地,解放軍果斷亮出底牌,痛擊臺獨要害

      為了鄭麗文專機能順利落地,解放軍果斷亮出底牌,痛擊臺獨要害

      流史歲月
      2026-04-09 16:30:07
      時隔35年!廣東東莞樟木頭上網絡平臺熱搜,真相令人震驚

      時隔35年!廣東東莞樟木頭上網絡平臺熱搜,真相令人震驚

      南方健哥
      2026-04-10 23:13:49
      Woc,才18歲啊,中國版“切特”橫空出世,已預定登錄NBA

      Woc,才18歲啊,中國版“切特”橫空出世,已預定登錄NBA

      體育新角度
      2026-04-11 11:19:36
      1-1!姆巴佩遭點球爭議,巴爾韋德難救主,皇馬連續3場不勝

      1-1!姆巴佩遭點球爭議,巴爾韋德難救主,皇馬連續3場不勝

      我的護球最獨特
      2026-04-11 05:04:38
      標120W的充電器實際功率僅22.5W,商家:120W是產品型號

      標120W的充電器實際功率僅22.5W,商家:120W是產品型號

      極目新聞
      2026-04-11 00:53:31
      難以置信?。∫徊统缘?62339.80元,上海一張消費清單刷爆網絡

      難以置信?。∫徊统缘?62339.80元,上海一張消費清單刷爆網絡

      火山詩話
      2026-04-10 06:49:46
      快訊!特普朗宣布最新消息了!

      快訊!特普朗宣布最新消息了!

      達文西看世界
      2026-04-11 09:58:36
      湖人季后賽前搞事情!裁掉場均25分天才后衛 要簽狠角色?

      湖人季后賽前搞事情!裁掉場均25分天才后衛 要簽狠角色?

      仰臥撐FTUer
      2026-04-11 11:02:33
      刺激!深圳有人年初買房已經賺了100萬!

      刺激!深圳有人年初買房已經賺了100萬!

      樓市滅霸
      2026-04-10 13:27:25
      趙勇淚別母親陳麗華!他曾支持母親再婚,不嫌棄生父平凡

      趙勇淚別母親陳麗華!他曾支持母親再婚,不嫌棄生父平凡

      細品名人
      2026-04-11 07:29:02
      2026-04-11 11:55:00
      傅盛 incentive-icons
      傅盛
      獵豹移動董事長兼CEO、獵戶星空董事長
      78文章數 789關注度
      往期回顧 全部

      科技要聞

      阿爾忒彌斯2號成功濺落,隔熱罩驚險過關

      頭條要聞

      "遲重瑞與陳麗華年輕時合影"熱傳 當事女子:張冠李戴

      頭條要聞

      "遲重瑞與陳麗華年輕時合影"熱傳 當事女子:張冠李戴

      體育要聞

      換帥之后,他們從降級區沖到升級區

      娛樂要聞

      浪姐7淘汰 該走的沒走,不該走的走了

      財經要聞

      從日本翻身看:這次誰能扛住高油價?

      汽車要聞

      煥新極氪007/007GT上市 限時19.39萬起

      態度原創

      健康
      家居
      手機
      數碼
      軍事航空

      干細胞抗衰4大誤區,90%的人都中招

      家居要聞

      復古風格 自然簡約

      手機要聞

      橙色版OPPO Find X9 Ultra手機渲染圖曝光

      數碼要聞

      大疆Pocket 4官宣4月16日發布:1英寸大底+可旋轉屏幕

      軍事要聞

      特朗普:對美國與伊朗達成和平協議“非常樂觀”

      無障礙瀏覽 進入關懷版