<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      AI泡沫論調(diào)下,月之暗面用460萬美元訓(xùn)練了一款萬億參數(shù)模型

      0
      分享至



      出品|搜狐科技

      作者|梁昌均

      編輯|楊 錦

      “AI獨角獸又重回舞臺中心了。”談及最近國產(chǎn)大模型的表現(xiàn),有AI從業(yè)者感嘆。

      最新例證是,月之暗面發(fā)布的萬億參數(shù)思考模型Kimi K2 Thinking,其基本趕超GPT-5等領(lǐng)先的閉源模型,并登頂全球開源模型榜首。

      值得注意的是,這款模型還用了很低的成本。搜狐科技獲悉,Kimi K2 Thinking模型的訓(xùn)練成本約為460萬美元(約合人民幣3200萬元)。

      這刷新了DeepSeek的紀錄。DeepSeek曾透露V3模型僅花了560萬美元,引發(fā)全球AI圈震動,如今Kimi K2 Thinking又降低了百萬美元。

      “這是中國大模型最接近OpenAI的時刻”、“又一個DeepSeeek時刻”,不少評價稱。而除了月之暗面,智譜、MiniMax的模型最近也在海外出圈。

      DeepSeek-R2遲遲不來,現(xiàn)在其也似乎已不再是話題中心,曾被搶去風頭的國內(nèi)AI獨角獸則開始走向全球舞臺,這也是這些公司試圖重新?lián)尰丶夹g(shù)話語權(quán)的嘗試。


      “又一個DeepSeeek時刻”

      萬億參數(shù)、開源登頂、趕超GPT-5……這是月之暗面最新發(fā)布的思考模型Kimi K2 Thinking被外界討論的關(guān)注點。

      官方評測顯示,該模型在推理、編程等多個能力超過或接近GPT-5和Claude Sonnet 4.5,并在人類最后的考試(Humanity's Last Exam)等多項基準測試中達到SOTA(最優(yōu))水平。



      “這是開源模型的歷史性突破?!痹贏rtificial Analysis(下稱AA)最新發(fā)布的全球模型綜合評測中,Kimi K2 Thinking得分躍居全球第二,和GPT-5兩款模型僅有1分之差。


      在該機構(gòu)發(fā)布的智能體評測基準τ2-Bench的電信任務(wù)中,Kimi K2 Thinking更是直接躍升至第一名,吊打GPT-5、Claude Sonnet 4.5、Grok4等領(lǐng)先模型。

      月之暗面在海外社交平臺對這款模型的介紹推文短短幾天閱讀就超過440萬,并再次刷新了海外對中國大模型的認知,有評論認為這又是一個“DeepSeek時刻”。

      這款模型用了比DeepSeek更低的成本。搜狐科技從知情人士獲悉,Kimi K2 Thinking模型的訓(xùn)練成本約為460萬美元。這不僅遠低于OpenAI等模型投入,還打破了DeepSeek-V3約560萬美元的訓(xùn)練成本紀錄。

      “相對美國那些頂尖模型來說,這個成本很低。中國多數(shù)模型都差不多這個預(yù)算水平,很多企業(yè)沒有那么多芯片可用,所以就是看誰訓(xùn)得好?!庇蠥I從業(yè)者表示。

      至于Kimi K2 Thinking為何能繼續(xù)降低成本,月之暗面并未透露相關(guān)技術(shù)論文,業(yè)內(nèi)認為還是得益于算法、架構(gòu)、后訓(xùn)練等方面的優(yōu)化,此次關(guān)鍵的一點是采用了原生INT4量化技術(shù)。

      INT4是指在大語言模型中的一種量化技術(shù),其通過降低模型參數(shù)的數(shù)值精度來減少模型的存儲需求和計算資源消耗,同時盡可能地保持模型的性能。

      月之暗面研究員劉少偉發(fā)文透露,在研發(fā)K2-Thinking時,發(fā)現(xiàn)隨著模型的生成長度變得越來越長,想要實現(xiàn)低延遲的推理,必須使用量化損失更小的INT4 QAT(訓(xùn)練感知量化)方案,這也使得后訓(xùn)練強化學(xué)習的訓(xùn)練效率顯著提升。

      至于為何不選擇更“先進”的格式,劉少偉稱是為了更好地支持非Blackwell架構(gòu)硬件?!霸诖竽P蜁r代,量化是一個可以跟SOTA和Frontier(邊界)放在一起,甚至加快模型達到Frontier速度的概念?!?/p>

      不過,不少實測顯示,Kimi K2 Thinking顯得非?!霸挵A”。在AA的智能指數(shù)評測時,它總共使用1.4億個token,是DeepSeek V3.2的2.5倍,是GPT-5的2倍,導(dǎo)致推理成本和速度受到一定影響。

      “現(xiàn)在,世界上最智能的模型是開源的,而且來自中國。如果美國繼續(xù)閉門造車,中國開源模型將會完全取勝?!庇性u論說到。

      全球華人首富黃仁勛上周提到,中國的AI技術(shù)非常出色,并開發(fā)出了非常優(yōu)秀的AI,目前世界上最流行的開源AI模型都來自中國,發(fā)展速度非???。

      這話說得沒錯,目前中國的開源模型無論是能力,還是數(shù)量都占據(jù)優(yōu)勢,今年的開源榜首也由中國模型輪流做。

      在AA全球最新開源模型榜單中,全球前十模型中有六款來自中國,其中Kimi K2 Thinking居首,取代了半月前登頂榜首的MiniMax-M2,以及更早前的阿里、DeepSeek模型。


      過去一段時間,以O(shè)penAI為核心的美國科技圈圍繞算力基礎(chǔ)設(shè)施進行捆綁,并揮出上萬億美元的投資,將自身優(yōu)勢發(fā)揮到了極致,但這種模式在中國難以復(fù)制。

      對中國多數(shù)大模型廠商來說,需要在算法、架構(gòu)、工程等層面加大創(chuàng)新突破,正如DeepSeek和Kimi所做的這樣。一點一點的微創(chuàng)新累計起來,最終有可能產(chǎn)生驚人的成果。

      一個明顯的信號是,中國AI獨角獸在重回技術(shù)競賽后,正在重回舞臺中心。現(xiàn)在,DeepSeek在AA全球模型的排名已至十名之外,或許只有R2會再扳回一局。


      國產(chǎn)模型的應(yīng)用之風吹到了硅谷

      在Kimi 模型出圈的背后,中國大模型日益受到海外青睞,硅谷正嘗試從昂貴的閉源往更便宜的中國開源模型上遷移。

      硅谷知名投資人、Social Capital公司創(chuàng)始人Chamath Palihapitiya近日坦言,已把大量工作負載轉(zhuǎn)移到Kimi K2。

      美國云計算公司Vercel則上線了該模型的API服務(wù),AI編程獨角獸Cursor和Windsurf,百度前高管景鯤在美創(chuàng)業(yè)公司Genspark,以及AI搜索獨角獸Perplexity等多家公司均有接入。

      MiniMax早前發(fā)布的推理模型M2,推出幾天后就在海外模型路由器OpenRouter的全球調(diào)用量達到前三,一度成為HuggingFace下載量最大的模型,還有至少20家平臺提供了API服務(wù)。

      此外,不少硅谷公司被爆出套殼中國大模型。Cursor在最新2.0版本更新中,推出首個自家的代碼模型Composer。但被開發(fā)者爆出,Composer套殼了中國的GLM-4.6模型。

      GLM- 4.6是智譜在今年9月底發(fā)布的旗艦?zāi)P停a能力對齊Claude Sonnet 4,當時號稱國內(nèi)最好的代碼模型,隨后在大模型競技場LMArena中排名開源模型第一。

      另外兩大AI編程獨角獸Cognition和Windsurf也被爆出套殼GLM-4.6,Windsurf在被網(wǎng)友扒出后,直接不裝了,稱應(yīng)社區(qū)用戶的熱烈呼聲,上線了GLM-4.6模型,認為其“將帶來更出色的代碼生成能力和編程任務(wù)表現(xiàn)”。

      這也讓不少AI從業(yè)者感到振奮?!霸瓉矶际侵袊竽P吞讱ずM忸I(lǐng)先模型,現(xiàn)在我們的模型成為被套殼的對象,國產(chǎn)模型真正開始揚眉吐氣了?!?/p>

      可以說,中國大模型出海已進入新階段。從最初僅僅是關(guān)注討論,到部分產(chǎn)品應(yīng)用出圈,再到多個國產(chǎn)基座模型在海外企業(yè)落地,大模型領(lǐng)域的Made in China含金量,正在持續(xù)上升。

      值得注意的是,這些模型均選擇了開源。這讓全球開發(fā)者和企業(yè)能夠無負擔地應(yīng)用起來,而中國大模型借助開源正在構(gòu)建起越來越大的技術(shù)影響。

      當然,開源也需要實力支撐,而讓硅谷選擇中國模型的關(guān)鍵就是極致的性價比。

      美國云計算公司Vercel CEO吉列爾莫·勞赫(Guillermo Rauch)提到,在內(nèi)部智能體真實場景基準測試中,Kimi K2在運行速度和準確率上優(yōu)于GPT-5和Claude Sonnet 4.5,其中準確率更是高出50%。

      前述硅谷投資人Chamath則提到,Kimi-K2性能夠強,且比OpenAI和Anthropic便宜太多。

      數(shù)據(jù)顯示,Kimi-K2、Kimi K2 Thinking以及智譜GLM-4.6的API輸出價格約為GPT-5的20%,不到Claude Sonnet 4.5的15%,MiniMax-M2的價格更是僅有Claude Sonnet 4.5的8%。

      “這個一個重要時刻,中國的開源模型具備了足夠的能力來支持西方產(chǎn)品的開發(fā),全球AI正進入多極化競爭的新格局?!庇性u論稱,甚至有海外網(wǎng)友表示:是不是該學(xué)點中文了?


      融資上市,AI獨角獸各謀出路

      技術(shù)趕超、出海破圈,中國的AI獨角獸試圖繼續(xù)留在牌桌上。這也讓它們在邁向上市和新一輪融資的過程中,更有底氣了。

      月之暗面最近被爆出開啟新一輪融資,甚至傳出海外知名的a16z考慮投資。有消息稱,月之暗面此次融資約6億美金,投前估值38億美金,領(lǐng)投方指向IDG,騰訊、五源資本、今日資本等老股東計劃跟投。

      如融資完成,月之暗面有望成為繼智譜、MiniMax后又一家估值超300億元的AI獨角獸。

      搜狐科技就此向月之暗面以及有關(guān)投資方求證,對方未做回應(yīng)。有關(guān)注AI的投資人認為,這么高額的融資,一般需要比較長的時間決策確認,而美國基金在當前環(huán)境下不太可能投。

      對月之暗面前述估值,該投資人表示,在國內(nèi)大模型融資熱潮已經(jīng)過去的情況下,這個估值不算低,但相較美國大模型獨角獸來說差距很大。

      有觀點認為,國內(nèi)AI獨角獸相較美國AI創(chuàng)企,技術(shù)和估值嚴重不匹配。比如,月之暗面估值不到OpenAI和Anthropic的1%,“國內(nèi)大模型賺錢還是太難了”。

      此前兩年,月之暗面是大模型市場炙手可熱的明星,去年超13億美元的兩輪融資更是讓其成為估值達33億美元的AI獨角獸,Kimi也一度成為國內(nèi)流量最高的AI原生應(yīng)用。

      然而,隨著聯(lián)創(chuàng)張予彤和朱嘯虎的糾紛,以及DeepSeek沖擊,月之暗面遭遇質(zhì)疑,公司發(fā)展也出現(xiàn)擺動,停止產(chǎn)品投流,重心轉(zhuǎn)向技術(shù),并從閉源走向開源等。

      今年以來,Kimi用戶規(guī)模增長停滯甚至下降。據(jù)QuestMobile,今年9月,Kimi月活規(guī)模已不足千萬,相較去年12月下降超過1100萬,在國內(nèi)AI原生APP排名從第二降至第五。


      在商業(yè)化方面,月之暗面繼續(xù)押注C端,此前在海內(nèi)外上線OK Computer,并首次開啟訂閱付費。在國內(nèi)同類型產(chǎn)品均免費,且面臨頭部競爭情況下,這可能是一場持久的惡戰(zhàn)。

      在這種情況下,此次融資對月之暗面頗為重要,尤其是在商業(yè)化相對較好的智譜開啟上市和MiniMax計劃上市的情況下,其需要積累更多資金應(yīng)對未來的變局。

      今年中期,MiniMax完成近3億美元新一輪融資,投后估值超40億美元,上海國資等出手。隨后,該公司被爆計劃赴港上市,當時內(nèi)部人士稱確有上市想法。

      目前,該公司海外推出的陪伴類應(yīng)用Talkie和視頻生成應(yīng)用海螺AI構(gòu)成其主要收入來源,最近還在編程和智能體產(chǎn)品上推出收費模式,進一步押注C端。

      深耕G端和B端的智譜則在今年上半年完成多地國資融資,并開啟上市,有望在年內(nèi)提交科創(chuàng)板招股書,成為大模型第一股。此前該公司爆出裁員,亦反應(yīng)出商業(yè)化和上市的不易。

      肉眼可見的是,AI四小虎中的階躍星辰,似乎有些掉隊。AI獨角獸們在技術(shù)理想和現(xiàn)實交織當中仍面臨生存壓力,但目前還遠未到格局已定的局面。



      運營編輯 |曹倩審核|孟莎莎




      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      小早川憐子,1400部作品直接封神!K燈熟女風范,堪稱暗黑界悍將

      小早川憐子,1400部作品直接封神!K燈熟女風范,堪稱暗黑界悍將

      灼灼小齊
      2025-12-31 09:17:10
      75歲港星宣布分手,自曝被騙當了14年第三者,拒絕向女方老公道歉

      75歲港星宣布分手,自曝被騙當了14年第三者,拒絕向女方老公道歉

      開開森森
      2025-12-31 10:08:35
      終于談完了,蔣萬安離開大陸,臨走前告知兩岸,民進黨將全面管制

      終于談完了,蔣萬安離開大陸,臨走前告知兩岸,民進黨將全面管制

      面包夾知識
      2025-12-30 18:03:29
      書記每次簽字都故意讓我空等3小時,我不急不躁,他晉升時卻后悔了

      書記每次簽字都故意讓我空等3小時,我不急不躁,他晉升時卻后悔了

      張道陵秘話
      2025-12-28 12:08:06
      德國俱樂部經(jīng)理已經(jīng)坐不住了,公開喊話,希望樊振東明年能留下

      德國俱樂部經(jīng)理已經(jīng)坐不住了,公開喊話,希望樊振東明年能留下

      南權(quán)先生
      2025-12-30 16:17:46
      新年首位訪華元首確定,專機將坐滿200多人,有五點讓人意想不到

      新年首位訪華元首確定,專機將坐滿200多人,有五點讓人意想不到

      觸摸史跡
      2025-12-31 05:08:33
      10位同學(xué)已相繼逝去!70后網(wǎng)友發(fā)帖感慨,已訂好車票,馬上進站了

      10位同學(xué)已相繼逝去!70后網(wǎng)友發(fā)帖感慨,已訂好車票,馬上進站了

      火山詩話
      2025-12-30 14:47:51
      臺軍“班超”艦雷達鎖定解放軍“烏魯木齊”驅(qū)逐艦,要開第一槍?

      臺軍“班超”艦雷達鎖定解放軍“烏魯木齊”驅(qū)逐艦,要開第一槍?

      我心縱橫天地間
      2025-12-30 23:10:37
      為什么老顧客突然不來照顧生意了?網(wǎng)友:為了一瓶礦泉水查監(jiān)控

      為什么老顧客突然不來照顧生意了?網(wǎng)友:為了一瓶礦泉水查監(jiān)控

      滑稽斑馬呀
      2025-11-27 17:02:09
      特朗普大膽開麥,美國已替代聯(lián)合國,中方警告:臺島或?qū)⒊苫鹚幫?>
    </a>
        <h3>
      <a href=有牙的兔紙
      2025-12-31 09:11:35
      “港獨分子”陳方安生,如今已活成了一個“笑話”?善惡終有報!

      “港獨分子”陳方安生,如今已活成了一個“笑話”?善惡終有報!

      涼羽亭
      2025-12-29 19:37:55
      71歲寇振海寫長文給18歲的兒子:我53歲老來得子,年輕時闖事業(yè)錯過最佳生育年齡,面對孩子滿滿酸楚和驕傲

      71歲寇振海寫長文給18歲的兒子:我53歲老來得子,年輕時闖事業(yè)錯過最佳生育年齡,面對孩子滿滿酸楚和驕傲

      魯中晨報
      2025-12-30 15:57:06
      Manus收購案細節(jié)曝光:20億刀閃電成交,CEO不向亞歷山大王匯報

      Manus收購案細節(jié)曝光:20億刀閃電成交,CEO不向亞歷山大王匯報

      量子位
      2025-12-31 10:02:40
      永州相關(guān)部門人員:湘超奪冠獎金不是108萬,沒有企業(yè)贊助汽車

      永州相關(guān)部門人員:湘超奪冠獎金不是108萬,沒有企業(yè)贊助汽車

      懂球帝
      2025-12-30 11:27:30
      兩個拼車的人竟然親上了!盤點生活中那些有趣又尷尬的經(jīng)歷

      兩個拼車的人竟然親上了!盤點生活中那些有趣又尷尬的經(jīng)歷

      夜深愛雜談
      2025-12-19 17:11:55
      半程冠軍!英超第1起飛繼續(xù)領(lǐng)跑,終結(jié)對手11連勝

      半程冠軍!英超第1起飛繼續(xù)領(lǐng)跑,終結(jié)對手11連勝

      烏龍球OwnGoal
      2025-12-31 09:45:03
      沖繩的美軍不走了

      沖繩的美軍不走了

      陸棄
      2025-12-30 08:35:03
      笑暈,父母能把動植物養(yǎng)的多離譜!網(wǎng)友:養(yǎng)的兔子都成精了!

      笑暈,父母能把動植物養(yǎng)的多離譜!網(wǎng)友:養(yǎng)的兔子都成精了!

      夜深愛雜談
      2025-12-13 22:34:27
      5艘航母逼近中國近海,特朗普直接打明牌,逼著中國接招!

      5艘航母逼近中國近海,特朗普直接打明牌,逼著中國接招!

      奉壹數(shù)碼
      2025-12-26 22:02:25
      羅永浩:有一個公司天天說遙遙領(lǐng)先,成了全國笑柄……

      羅永浩:有一個公司天天說遙遙領(lǐng)先,成了全國笑柄……

      柴狗夫斯基
      2025-12-31 09:40:35
      2025-12-31 10:44:49
      搜狐科技 incentive-icons
      搜狐科技
      搜狐科技官方賬號
      4624文章數(shù) 9175關(guān)注度
      往期回顧 全部

      科技要聞

      老羅,演砸了,也封神了?

      頭條要聞

      70后飛行員翻臉將22歲情人告上法庭 讓其歸還700多萬

      頭條要聞

      70后飛行員翻臉將22歲情人告上法庭 讓其歸還700多萬

      體育要聞

      聯(lián)盟第一人倒下了!掘金還有底牌嗎?

      娛樂要聞

      林俊杰女友被扒 父親涉經(jīng)濟案卷款13億?

      財經(jīng)要聞

      朱光耀:美關(guān)稅政策正使WTO名存實亡

      汽車要聞

      標配華為乾崑ADS 4 Pro 華境S明年上半年上市

      態(tài)度原創(chuàng)

      數(shù)碼
      本地
      家居
      房產(chǎn)
      公開課

      數(shù)碼要聞

      華為FreeClip一代耳夾耳機獲HarmonyOS 6.0.0.296更新

      本地新聞

      即將過去的2025年,對重慶的影響竟然如此深遠

      家居要聞

      當歸之宅 三胎圓滿居所

      房產(chǎn)要聞

      瘋了!2025海南拿地榜巨變:榜首狂砸80億,民企火力全開!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 国产性色av免费观看| 久久亚洲中文字幕不卡一二区| 国产18女人毛片真多水| 亚洲中文字幕无码一区| 欧美丰满熟妇hdxx| 色欲天天综合| 熟女?国产?精品| 亚洲国产色婷婷久久99精品91| 人妻 丝袜美腿 中文字幕| 成年午夜性影院| 极品人妻系列| 人妻人人爽| 91人妻中文字幕在线精品| 性姿势真人免费视频放| 2024av天堂手机在线观看| 在线成人精品国产区免费| 无码人妻精品一区二区蜜桃91| 国产jizz| 成人av中文字幕在线播放| 蜜桃av一区二区高潮久久精品| 精品99在线| 手机在线观看av| 毛葺葺老太做受视频| 国产精品av在线| 在线无码免费的毛片视频| 迭部县| 天天摸天天碰天天添| 亚洲精品www久久久久久| 欧美日韩中文字幕久久伊人| 亚洲国产精品VA在线看黑人| 亚洲中文字幕无码中文字| 一本大道东京热无码视频 | 亚洲高清无码人妻| 国内精品久久久久影院优| 欧美人与zoxxxx另类| 夜夜夜爽| 免费观看羞羞视频网站| 国产偷国产偷亚洲高清app| 少妇人妻av| 潮喷视频在线播放| 婷婷久久久亚洲欧洲日产国码av|