![]()
過去幾年,模型越來越強,但模型使用的賬單也越來越嚇人——阻礙企業級場景下 AI 深度使用的,不是模型不夠好,而是推理成本高、速度跑不起來。
你現在為每一個 Token 付的錢,還有多少空間可以壓縮?
同樣跑一個大模型,有人花 1 塊錢,有人只花 1 毛,差距在哪?
當硬件紅利持續釋放,推理成本的下限在哪?
這不是玄學,背后靠的是工程優化!
今年,“模型推理“——是 AI 領域當之無愧的關鍵詞,基于算力的“推理加速”已成為行業共識。有一群人,正在改寫這道問題的答案。
4 月 13 日 19:00,InfoQ 聯合阿里云共同打造的【AI Token 說】首播,邀請“推理加速大拿”+“芯片產品專家”+“資深媒體人”圍繞“推理加速,如何實現底層破局?”開啟硬核對話:
Token 背后不為人知的算力博弈,國內推理加速真正卡點在哪里?
阿里云飛天企業版 x 平頭哥“真武”芯片,如何實現 13 倍推理性能“硅基躍遷”?
軟硬協同如何把 Token 成本砍掉 90%,讓大模型推理更具性價比?
從科技從業者視角,把基于國內算力生態的推理加速實踐拆解給你聽,也一起聊聊“模型推理”的未來趨勢!
Every Token Tells a Story。每一枚 Token,皆是算力的敘事!長按識別海報二維碼,鎖定席位。 4 月 13 日晚 7 點,不見不散。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.