一群開發者搞了個叫sllm的項目,把高端GPU節點切成碎片出租。花10美元就能和別人合租一塊卡,跑Llama 4 Scout、DeepSeek V3.2這些大模型,號稱「unlimited tokens」。
這事的魔幻在于定價邏輯。官方API按token收費,這里按月訂閱,流量不限。團隊打了個比方:傳統云廠商像按滴賣水,他們直接賣水龍頭。一位早期用戶說,「我跑了三天R1-0528,賬單還是10塊」。
技術實現上,他們用Kubernetes把A100/H100切成多個實例,每個實例分配固定顯存切片。多用戶共享同一塊物理卡,通過調度錯開峰值。延遲肯定比獨占高,但15 tok/s的吞吐量對調試代碼夠用了。
風險也明顯。Availability一列顯示0%的模型不在少數,熱門時段排隊是常態。更麻煩的是合規——模型廠商的API條款大多禁止轉售,sllm目前沒拿到任何官方授權。有開發者在社區留言:「便宜是真便宜,被封號的時候別哭。」
項目上線兩周,HN帖子的評論區已經吵了400樓。支持的人說這是「AI民主化」,反對的人算了一筆賬:按官方價跑DeepSeek V3.2,10美元大概能買200萬token,這里能跑多少取決于你有多閑。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.