網易首頁 > 網易號 > 正文申請入駐

一個瘋子，造出便宜100倍的AI芯片

2026-02-23 15:18:48　來源: 傅盛

北京舉報

分享至

25個人，3000萬美金，兩年半。

做出了一塊碾壓英偉達旗艦GPU 10倍的芯片。

不是PPT，不是實驗室demo。芯片已經量產，API已經開放，開發者現在就能測。

做這件事的人叫Ljubisa Bajic。兩年前，他放棄了自己一手創辦的、估值32億美金的AI

芯片公司Tenstorrent。AI芯片賽道正火，資本瘋搶，所有人都覺得他瘋了。

但Bajic覺得，真正瘋的是這個行業——大家花幾十億美金造芯片，結果90%的算力都在搬數據，不在算數據。

他放不下一個問題：AI推理，為什么非得這么貴？

問題有多本質？

你用ChatGPT問一個問題，背后是什么？是一堆服務器里的GPU，把一個幾十GB甚至幾百GB的模型文件，從內存里反復搬運到計算單元，一個字一個字地算出來，再傳給你。

這個過程，每問一次，就搬一次。不是搬一次，是每生成一個token，都要把所有的模型權重過一遍。

NVIDIA的GPU賣這么貴，本質上是在賣"通用性"——它什么模型都能跑。這種靈活性，代價是極大的浪費。好比你每次做飯，都要把整個菜市場搬進廚房，然后再搬走。

Bajic想的是：如果你只做一道菜，為什么不直接把菜長在廚房里？

這就是Taalas的起點。

先說說Bajic這個人

他的履歷，光看都覺得累。在AMD做了十幾年，從工程師一路做到GPU芯片架構師，主導過混合CPU-GPU芯片的整體設計。后來跳去Nvidia做了一年高級架構師，結果又被AMD挖回去，當了兩年集成電路設計總監。

AMD、Nvidia、AMD——在兩家芯片巨頭之間來回蹦跶。不是他坐不住，是這個行業的頂尖人才就這樣，誰給更大的舞臺就去誰那兒。

再后來他自己出來創業，創辦了Tenstorrent——專做AI芯片。公司融了7億美金，估值一路飆到32億。為了補強團隊，他請來了芯片界的傳奇人物Jim Keller先擔任CTO——這個人在AMD設計過Zen架構、在蘋果做過A系列芯片、在特斯拉搞過自動駕駛芯片，硅谷芯片圈的活化石。

Keller一開始以CTO身份加入，負責技術方向。但很快，Bajic發現這個人不只是能做技術——他能扛起整個公司。于是Bajic把他升為CEO，自己退到幕后。2022年秋天，Bajic徹底離開了Tenstorrent。

一手創辦的公司，估值32億，親手交給別人，然后走人。

他停下來想了六個月，然后做了一個更瘋的決定。

顛覆80年的基本假設

2023年，Bajic帶著他的妻子Lejla（AMD/Tenstorrent系統工程老兵，后出任COO），還有老搭檔Drago Ignjatovic（前Tenstorrent硬件VP，出任CTO），三個人，把這個想法從零開始做。

他們給這個方向起了個霸氣的名字：Hardcore Models.

口號只有六個字：The Model is The Computer.

不是模型運行在計算機上。模型本身，就是那臺計算機。

具體怎么做到的？

具體怎么做到的？Bajic的技術解釋，我覺得非常有意思。傳統芯片的邏輯是：有一堆計算單元，有一堆內存，需要推理的時候，把模型權重從內存搬到計算單元，算完結果，再吐出來。這中間有一道無形的"墻"——內存帶寬墻。

你能算多快，取決于你能搬多快。這道墻，是整個AI算力行業幾十年的噩夢。Cerebras用一整個晶圓做計算，SambaNova和Groq用大量高速SRAM，本質都是在想辦法把這道墻打薄。但墻還在。

Taalas的做法，是把這道墻徹底炸掉。

從1945年馮·諾依曼提出計算機架構至今，有一個基本假設從沒變過：存儲是存儲，計算是計算，中間靠總線搬數據。八十年了，所有芯片都在這個框架里優化。

Bajic說：我不優化了，我把這個架構廢了。

存儲和計算，合為一體。模型參數直接刻進晶體管，晶體管本身既是存儲又是計算。不需要搬運，因為數據就長在計算的地方。

這才是真正瘋的地方——不是做一塊更快的芯片，而是否定了八十年來計算機的基本假設。

他們發明了一種叫"Mask ROM Recall Fabric"的架構——直接把模型權重，在芯片制造的時候，固化進晶體管里。不是寫進內存，是刻進硅里。

他們用的是70年代手工晶體管級別的設計方法，一行一行地布局，像在手工雕刻。一共申請了14項專利。

結果

第一代芯片HC1，TSMC 6納米工藝，815平方毫米，530億個晶體管，功耗200W一張卡。

跑Llama 3.1 8B的推理速度：17,000 tokens/秒（每用戶）

NVIDIA最新的B200（Blackwell架構）：大約1,800 tokens/秒

差了將近10倍。成本便宜20倍。功耗低10倍。

而且，因為速度太快，根本不需要"批處理"。HC1速度太快，每個用戶的請求直接實時響應，延遲極低。

低延遲和低成本，原本是一對矛盾。Taalas說，我兩個都要。

代價與解法

你可能會問：這聽起來太好了，有什么代價？

有的。

每一個模型，對應一款專屬芯片。你想跑Llama 3.1，就得用Llama 3.1的HC芯片。

Bajic說：不麻煩。他們和TSMC一起，設計了一套"兩層金屬"的快速更新方案——換個模型，只改芯片里的兩層金屬。從收到新模型的權重，到可以量產出貨：兩個月。

定制一塊專屬推理芯片，成本大概是訓練成本的百分之一。

這個賬，算得過來。

更關鍵的是：模型更新的速度，正在放緩。用戶開始在乎"穩定性"多過"新功能"。GPT-4到GPT-4.5到GPT-5，不少企業用戶反而不急著升級，因為已經跑通的工作流不想被打亂。這種趨勢，恰恰給了HC芯片更大的生存空間。

25人，$3000萬

Taalas今年2月剛宣布完成$1.69億融資，總融資額達到$2.19億，投資方包括Fidelity（富達）。

他們總共只花了$3000萬在研發上。還有$1.7億在賬上沒動。

25個人，$3000萬，兩年半，做出了一個跑贏NVIDIA旗艦GPU 10倍的芯片。

這不是在吹牛。他們現在已經有公開可用的API（chatjimmy.ai），開發者可以自己去測。

我見過太多創業團隊，動不動就說要做多大的事，然后花很多錢，很多年，產出一個平庸的結果。Taalas這個數字，讓我坐直了。

極度焦慮=極度效率

這件事讓我想到一個更大的問題：資源，到底是優勢，還是束縛？

Taalas走了另一條路：用極度聚焦換來極度效率。

Bajic從AMD到Tenstorrent，再到Taalas，每次都在做減法：

AMD：做所有人的GPU
Tenstorrent：做AI時代的通用芯片
Taalas：只做一個模型的最優硬件

越聚越窄，越聚越深，越聚越快。

我自己做獵豹的時候，也經歷過類似的階段。做移動工具的那幾年，整個團隊想的就是一件事：如何在手機清理這件小事上，做到極致？

別人覺得這太窄，沒有未來。但正是這種極致的聚焦，讓我們在全球超過一億用戶。

Taalas讓我想到，這個道理在硬科技領域一樣成立——甚至更成立。因為硬件容錯率更低，極度聚焦，不是退而求其次，而是生存本能。

因為硬件容錯率更低。你不能"先發布再迭代"，每次流片都是真金白銀。極度聚焦，不是退而求其次，而是生存本能。

順便說，Taalas的VP of Products，叫Paresh Kharya。

這個人之前在NVIDIA做了三年數據中心業務高級產品負責人，然后去Google Cloud管了一段時間GPU和TPU的整個硬件產品線。

從NVIDIA和Google的內部，主動跳槽去一個25人的初創公司。

這個選擇，很說明問題。見過最好的，選擇去做可能更顛覆的，這種判斷不輕易發生。

價格革命

當然，Taalas面前還有很多沒解決的問題。

模型迭代越來越快，兩個月的交貨周期夠不夠？超大參數量的模型（數千億參數）怎么做，目前HC1只支持80億參數，HC2年底才出。客戶愿不愿意為"專用芯片"接受靈活性上的限制，這是真實的商業挑戰。

這些問題，都不是小問題。

但有一件事我覺得是確定的：AI推理的成本，必然會被打穿。

DeepSeek從訓練端做到了，用更少的算力訓練出接近GPT-4水平的模型。

Taalas從推理端做，把同一個模型的運行成本砍掉20倍。

兩條路，同一個方向——讓AI的使用成本趨近于零。

這不是一個技術故事，這是一場價格革命。

最后說一句話。

Bajic離開Tenstorrent的時候，所有人都說他瘋了——AI芯片賽道正熱，公司估值$32億，你走什么走？

但他停下來想了六個月，然后去做一件更瘋的事——否定馮·諾依曼架構，把模型直接燒進芯片。

現在他們拿著$2.19億，25個人，從加拿大多倫多出發，準備在一個萬億美元的市場里，打出一道裂縫。

有時候，瘋子才能看到正常人看不到的路。

這件事的結局還沒寫完。但開頭，已經很精彩了。

Taalas的HC1已經可以申請API試用：taalas.com/api-request-form/。如果你在做AI應用，不妨去測一下。17,000 tokens/秒是什么感覺，親眼看看。

關于EasyClaw

AI推理成本趨近于零的那一天，真正的價值不在算力，在應用。

EasyClaw是我們做的AI Agent平臺——讓每個人都能擁有自己的AI助理，7×24小時幫你處理工作、獲取信息、管理日程。不需要寫代碼，不需要懂技術，開箱即用。

Taalas讓AI算力便宜100倍，EasyClaw讓AI能力人人可用。

easyclaw.com — 你的第一只龍蝦，在等你。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

1000 倍效率神話，Taalas如何用 “模型即芯片” 暴打英偉達

鈦媒體APP 2026-02-24 15:35:10
0 跟貼 0
2026，國產AI芯片，跨越天塹：從“推理”走向“訓練”

鈦媒體APP 2026-02-25 12:59:31
0 跟貼 0

Semianalysis：智能體火爆，CPU成為新的“AI瓶頸”

華爾街見聞官方 2026-04-09 20:25:07
0 跟貼 0

同時給兩大AI死敵砸了580億，AWS CEO終于回應了

鈦媒體APP 2026-04-11 10:10:23
0 跟貼 0
中國具身模型狂攬全球第一！機器人的人類數據時代來了

量子位 2026-04-11 10:03:54
0 跟貼 0

1954年成立的雙鹿電池，如何成為AI智造的標桿

吳曉波頻道 2026-03-06 14:19:28
0 跟貼 0

小紅書辦了場黑客松！48小時造出理發神器、雀神機，太會玩了

雷科技 2026-04-11 10:40:18
0 跟貼 0
不再“靠醫生手感”，AI機器人要“植”入這個千億市場

經濟觀察報 2026-04-11 11:06:11
0 跟貼 0

不上云、不租卡，如何優雅地在本地微調Qwen-VL-30B？

機器之心Pro 2026-01-13 12:57:27
30 跟貼 30
獨家對話研極微創始人：80人做到近100億營收后，要把AI攝像頭插到田間地頭

36氪 2026-01-21 09:10:59
42 跟貼 42
比黃金還貴的腦起搏器，這一撕就是20萬，真正的保命用！

冥想搞笑 2026-04-09 16:31:19
1 跟貼 1
不造一顆芯片的Arm如何統治了世界？

DeepTech深科技 2026-01-05 16:58:33
81 跟貼 81
亞馬遜考慮對外銷售自研AI芯片，年化營收規模或達500億美元

華爾街見聞官方 2026-04-10 04:28:59
4 跟貼 4
MIT新方法讓兩顆芯片共享唯一“指紋”，重寫硬件安全規則

DeepTech深科技 2026-02-25 17:32:10
14 跟貼 14
男子把麻將牌砸碎，從里頭找出了一塊芯片

銳眼新聞 2026-04-09 15:33:29
0 跟貼 0
AI驅動產業新周期，多重邏輯共振迎投資機遇

每日經濟新聞 2026-03-18 11:38:14
0 跟貼 0
在美華人：中國彎道超車別做夢了！美國的先進你無法想象！

豎笛小魔王 2026-04-07 02:28:20
17 跟貼 17
形勢早就大變！西方媒體集體改口：中國，已無需再向世界證明啥了

有態度網友19vVf0 2026-04-10 11:47:08
2 跟貼 2
周期反轉，模擬芯片步入上行期

鈦媒體APP 2026-04-10 12:19:08
1 跟貼 1
CPO商用化提速：Scale-out突破0到1，Scale-up有望率先大規模落地？

華爾街見聞官方 2026-04-10 18:09:13
0 跟貼 0
伊高官:若美約束不好以色列這條瘋狗伊朗將幫它一把

中國新聞周刊 2026-04-10 18:41:40
42018 跟貼 42018
吉利給SUV刷了層"黑金皮膚"，智駕直接上英偉達頂配

報錯免疫體 2026-04-11 09:34:40
0 跟貼 0
三家芯片廠的豪賭，到底值不值？

鈦媒體APP 2026-04-11 11:03:09
0 跟貼 0
形勢不樂觀！繼手機后，國產汽車也被高通芯片卡住脖子了？

互聯網.亂侃秀 2026-04-11 11:29:21
0 跟貼 0
Nvidia把3年陳的痛點塞進后臺，玩家終于不用干等了

野生運營 2026-04-09 16:25:39
3 跟貼 3
《極限競速：地平線6》完整夏季地圖公開

3DM游戲 2026-04-08 20:42:11
3 跟貼 3
索尼PS6價格曝光！全球局勢或將其推向1000美元

游民星空 2026-04-10 21:21:32
3 跟貼 3
硅基直覺的誕生：大模型如何一瞥見全體

尹燁 2026-04-08 21:40:58
0 跟貼 0
美國推演：7天打掉4萬解放軍？參數一扒就露餡

半路友人之他 2026-04-10 02:11:31
1 跟貼 1
前英偉達高管吳夏清創辦機器人數據服務公司，Calder瞄準世界模型底座

鈦媒體APP 2026-04-10 20:05:14
0 跟貼 0
存儲芯片漲價后，5000元的iPhone都要擴容了：大容量買不起

雷科技 2026-04-09 09:57:44
1 跟貼 1
一顆藥下肚就能自動報備，醫學界迎來新突破

Maxonor創意公元 2026-04-06 17:17:24
0 跟貼 0
華為暢享90m Plus正式亮相，麒麟8000芯片

快科技 2026-04-10 04:59:04
0 跟貼 0
缸中之腦現代版：20萬人腦神經元一周學會打Doom

量子位 2026-03-06 17:34:11
0 跟貼 0
高手之間的對決，差距往往藏在細節，關鍵竟差在了硬件上

菠菜不算愛 2026-04-08 14:22:49
1 跟貼 1
日本“降級”中日關系中方表態

參考消息 2026-04-10 14:22:31
113 跟貼 113
Claude Opus 4.6差評如潮！思考深度暴跌67%，AMD總監6852次日志打臉

新智元 2026-04-09 19:19:58
83 跟貼 83
特朗普芯片出口政策被卡3個月，商務部系統崩了

我是一個粉刷匠2 2026-04-11 09:59:03
0 跟貼 0
400年前的機械大腦？沒電沒芯片，它憑什么自動控制機器？

一棵不倒松 2026-04-07 16:19:03
5 跟貼 5
仍有地方弄虛作假！督察組進駐后，發現了不少問題

政知新媒體 2026-04-11 06:19:51
106 跟貼 106

傅盛

獵豹移動董事長兼CEO、獵戶星空董事長

78文章數 789關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

健康

家居

手機

數碼

軍事航空

干細胞抗衰4大誤區,90%的人都中招

家居要聞

手機 / 數碼

房產 / 家居

一個瘋子，造出便宜100倍的AI芯片

阿爾忒彌斯2號成功濺落，隔熱罩驚險過關

"遲重瑞與陳麗華年輕時合影"熱傳 當事女子：張冠李戴

"遲重瑞與陳麗華年輕時合影"熱傳 當事女子：張冠李戴

換帥之后，他們從降級區沖到升級區

浪姐7淘汰 該走的沒走，不該走的走了

從日本翻身看：這次誰能扛住高油價？

煥新極氪007/007GT上市 限時19.39萬起

態度原創

干細胞抗衰4大誤區,90%的人都中招

復古風格 自然簡約

橙色版OPPO Find X9 Ultra手機渲染圖曝光

大疆Pocket 4官宣4月16日發布：1英寸大底+可旋轉屏幕

特朗普：對美國與伊朗達成和平協議“非常樂觀”

一個瘋子，造出便宜100倍的AI芯片

阿爾忒彌斯2號成功濺落，隔熱罩驚險過關

"遲重瑞與陳麗華年輕時合影"熱傳當事女子：張冠李戴

"遲重瑞與陳麗華年輕時合影"熱傳當事女子：張冠李戴

換帥之后，他們從降級區沖到升級區

浪姐7淘汰該走的沒走，不該走的走了

從日本翻身看：這次誰能扛住高油價？

煥新極氪007/007GT上市限時19.39萬起

復古風格自然簡約