<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Artificial Analysis評測新鮮出爐:Kimi K2 thinking位居世界第二,開源第一

      0
      分享至


      根據(jù)著名AI分析機構Artificial Analysis的評估,Kimi K2 Thinking在智能體(agentic)相關任務中表現(xiàn)非常突出,但在完成評測時生成了所有模型中最多的token,表現(xiàn)出非常“話癆”的特性

      以下是其核心要點:

      智能指數(shù)67分,登頂開源榜首

      Kimi K2 Thinking在Artificial Analysis智能指數(shù)中獲得67分。

      這一成績使其明確領先于所有其他開源權重模型,包括最近發(fā)布的MiniMax-M2(61分)和DeepSeek-V3.2-Exp(57分),在所有模型中僅次于GPT-5


      Agent能力突出,推理表現(xiàn)強勁

      Kimi K2 Thinking在智能體應用場景中展現(xiàn)出強大實力,在Artificial Analysis智能體指數(shù)中排名第二,僅次于GPT-5

      其優(yōu)異表現(xiàn)主要得益于在2-Bench Telecom基準測試中取得了93%的成績。這是一個智能體工具使用評測。這是該機構獨立測量到的最高分


      此外,在Humanity’s Last Exam(人類終極考試)評測中,Kimi K2 Thinking在無工具情況下的得分為22.3%,創(chuàng)下開源模型歷史新高,僅次于GPT-5和Grok 4


      成為新晉開源代碼模型冠軍

      盡管Kimi K2 Thinking并未在任何一項代碼評測中奪得總冠軍,但相較于其他開源模型,它在各項評測中均排名第一或并列第一

      具體排名為:Terminal-Bench Hard第6名,SciCode第7名,LiveCodeBench第2名

      因此,它在Artificial Analysis代碼指數(shù)中超越了先前的開源領導者DeepSeek V3.2

      更多排名:


      模型細節(jié):1萬億參數(shù),INT4原生精度

      模型規(guī)格:總參數(shù)量1萬億,激活參數(shù)320億(約594GB),僅支持文本輸入,擁有256K上下文窗口

      模型定位:該模型是Kimi K2 Instruct的推理變體,擁有相同的架構和參數(shù)數(shù)量

      INT4精度:與此前Kimi K2 Instruct發(fā)布的FP8精度不同,該模型原生以INT4精度發(fā)布。月之暗面在后訓練階段使用了量化感知訓練來實現(xiàn)這一點。這使得模型大小僅為約594GB,相比K2 Instruct的1TB以上大幅縮小,從而提升了推理和訓練效率

      代價:高冗余度、成本與延遲

      Kimi K2 Thinking表現(xiàn)得非常“話癆”。在完成智能指數(shù)評測時,它總共使用了1.4億個token,約為DeepSeek V3.2的2.5倍,GPT-5的2倍。


      高冗余度直接影響了成本和延遲

      基礎版API

      定價:輸入 百 萬 , 輸 出 2.5/百萬token。

      評測總成本:$356,比頂尖前沿模型便宜(比GPT-5(高)便宜2.5倍),但比DeepSeek V3.2貴9倍

      速度:非常慢,約8個輸出token/秒

      Turbo版API

      定價:輸入 百 萬 , 輸 出 8/百萬token。
      評測總成本:$1172,是第二昂貴的模型,僅次于Grok 4。
      速度:相對較快,約50個輸出token/秒

      報告指出,此次發(fā)布再次凸顯了一個持續(xù)的趨勢:后訓練,特別是強化學習(RL),正在推動推理模型和涉及工具調用的長程任務性能實現(xiàn)增長

      參考:

      https://artificialanalysis.ai/models/kimi-k2-thinking

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      反轉了!臭豆腐賠償?shù)轿淮箢^被捐,女兒成眾矢之的,再找工作難了

      反轉了!臭豆腐賠償?shù)轿淮箢^被捐,女兒成眾矢之的,再找工作難了

      離離言幾許
      2026-03-01 12:08:32
      美以對伊朗動手,俄羅斯、歐盟、巴基斯坦等多方發(fā)聲

      美以對伊朗動手,俄羅斯、歐盟、巴基斯坦等多方發(fā)聲

      參考消息
      2026-02-28 22:08:44
      砍9分11籃板!中國男籃1米98奇兵正負值+21:郭士強用對他

      砍9分11籃板!中國男籃1米98奇兵正負值+21:郭士強用對他

      李喜林籃球絕殺
      2026-03-01 18:48:10
      狗咬人被摔死,狗主人帶9人復仇被60歲老人反殺!是正當防衛(wèi)嗎?

      狗咬人被摔死,狗主人帶9人復仇被60歲老人反殺!是正當防衛(wèi)嗎?

      何慕白
      2025-11-13 10:22:09
      椰樹太顛了!代言人婚紗照成網紅打卡地,“土味營銷”天花板!

      椰樹太顛了!代言人婚紗照成網紅打卡地,“土味營銷”天花板!

      LOGO研究所
      2026-03-01 11:19:49
      周末信息如何影響市場?明天是紅色星期一?還是黑色星期一?

      周末信息如何影響市場?明天是紅色星期一?還是黑色星期一?

      春江財富
      2026-03-01 08:39:41
      7億成本,《鏢人》虧損2億,吳京不服氣,一口氣立項了7部武俠片

      7億成本,《鏢人》虧損2億,吳京不服氣,一口氣立項了7部武俠片

      電影票房預告片
      2026-02-26 23:39:18
      你有知道哪些炸裂的秘密?網友:我有個秘密說出來肯定大家要笑死

      你有知道哪些炸裂的秘密?網友:我有個秘密說出來肯定大家要笑死

      帶你感受人間冷暖
      2026-01-29 00:10:05
      潛伏11年,那些被礦渣喂大的香蕉,終于開始向人類“復仇”了

      潛伏11年,那些被礦渣喂大的香蕉,終于開始向人類“復仇”了

      墨印齋
      2026-02-26 08:32:20
      金靖自曝過完年胖了6斤,怎么工作啊,網友調侃年味都長身上了

      金靖自曝過完年胖了6斤,怎么工作啊,網友調侃年味都長身上了

      韓小娛
      2026-03-01 09:57:40
      中東局勢升級 金價重回1600元 專家提醒:建議投資者逢高少量減持

      中東局勢升級 金價重回1600元 專家提醒:建議投資者逢高少量減持

      封面新聞
      2026-03-01 22:14:05
      抵債的方式能有多離譜?網友:賠了我八個車位

      抵債的方式能有多離譜?網友:賠了我八個車位

      另子維愛讀史
      2026-02-28 20:39:11
      網紅民宿降價也無人問津?這屆“摳門”的年輕人擠爆體制內招待所

      網紅民宿降價也無人問津?這屆“摳門”的年輕人擠爆體制內招待所

      藍鯨新聞
      2026-02-24 16:03:06
      中領館提醒: 18-65歲在俄長期居留男性 須同意在俄軍事單位等至少服役1年

      中領館提醒: 18-65歲在俄長期居留男性 須同意在俄軍事單位等至少服役1年

      閃電新聞
      2026-02-26 12:46:48
      男籃世預賽晉級形勢分析!中國隊1戰(zhàn)定生死:韓國或被聯(lián)手踢出局

      男籃世預賽晉級形勢分析!中國隊1戰(zhàn)定生死:韓國或被聯(lián)手踢出局

      籃球快餐車
      2026-03-01 00:42:22
      伊朗犯下10月7日的致命失誤,導致其失去一切

      伊朗犯下10月7日的致命失誤,導致其失去一切

      山河路口
      2026-03-01 20:25:18
      鄒市明一家國外度假,冉瑩穎挑染紅發(fā)似精神小妹,軒軒180cm超帥

      鄒市明一家國外度假,冉瑩穎挑染紅發(fā)似精神小妹,軒軒180cm超帥

      瘋說時尚
      2026-03-01 11:38:45
      美伊戰(zhàn)爭進入第二天,美軍投入大量新式武器,伊朗連射20輪導彈

      美伊戰(zhàn)爭進入第二天,美軍投入大量新式武器,伊朗連射20輪導彈

      鐵血戰(zhàn)史1927
      2026-03-01 18:37:15
      無錫二院!你要火了!

      無錫二院!你要火了!

      無錫eTV全媒體
      2026-03-01 11:46:51
      富士康創(chuàng)始人郭臺銘:“若兩岸爆發(fā)沖突,我會誓死守護臺灣”

      富士康創(chuàng)始人郭臺銘:“若兩岸爆發(fā)沖突,我會誓死守護臺灣”

      百態(tài)人間
      2026-02-12 15:21:00
      2026-03-01 23:32:49
      AI寒武紀 incentive-icons
      AI寒武紀
      專注于人工智能,科技領域
      1034文章數(shù) 396關注度
      往期回顧 全部

      科技要聞

      榮耀發(fā)布機器人手機、折疊屏、人形機器人

      頭條要聞

      在以貼瓷磚的中國小伙:爆炸聲在頭頂響起 真的被嚇到

      頭條要聞

      在以貼瓷磚的中國小伙:爆炸聲在頭頂響起 真的被嚇到

      體育要聞

      火箭輸給熱火:烏度卡又輸斯波教練

      娛樂要聞

      黃景瑜 李雪健坐鎮(zhèn)!38集犯罪大劇來襲

      財經要聞

      中東局勢升級 如何影響A股、黃金和原油

      汽車要聞

      理想汽車2月交付26421輛 歷史累計交付超159萬輛

      態(tài)度原創(chuàng)

      教育
      時尚
      房產
      公開課
      軍事航空

      教育要聞

      中考數(shù)學復習,中考數(shù)學重難點二次函數(shù),經典壓軸題,難度大

      今年春天最流行的4件衛(wèi)衣,照著穿就很好看

      房產要聞

      濱江九小也來了!集齊海僑北+哈羅、寰島...江東教育要炸了!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      伊朗前總統(tǒng)內賈德遇襲身亡

      無障礙瀏覽 進入關懷版