<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      迄今為止最強大的開源模型:Kimi K2 Thinking ,比肩閉源模型

      0
      分享至

      大家好,我是 Ai 學習的老章

      Kimi 也算我們的常客,尤其是 K2 模型,十分亮眼,目前也是我 Agent 常配模型之一

      昨晚 ,剛剛模型文件開源,技術博客也發布了,本文做個梳理。
      K2 Thinking 實測

      先看幾個網友實測:

      啟用 Kimi 工具調用,直接生成數學和物理解釋動畫

      將公式渲染進行量子場論的動畫推理

      太空侵略者游戲

      K2 Thinking 簡介

      kimi-k2-thinking模型是具有通用 Agentic 能力和推理能力的思考模型,它擅長深度推理,并可通過多步工具調用,幫助解決各類難題。

      什么讓它與眾不同:
      ? 原生 INT4 量化 → 2 倍快速推理
      占用內存減半,無精度損失
      256K 上下文,支持 200-300 次工具調用


      Kimi K2 Thinking 上下文長度為 256k。(從常規的 Kimi K2 的 128k 提升而來),總參數 1T,激活參數 32B

      官方釋放的基準測試結果:

      在 HLE (44.9%) 和 BrowseComp (60.2%) 上達到 SOTA
      最多可以執行 200 – 300 個連續的工具調用 無需人工干預
      在推理、自主搜索和編程方面表現出色


      需要指出的是,Kimi 非常自信的與最強的閉源模型進行對比,在多個基準中結果反超閉源模型。

      下面是更全面的對比結果,確實不需要與其他開源模型比參數了:


      artificialanalysis.ai 也對 Kimi K2 Thinking 做了基準測試,結果也十分優秀

      ? Kimi K2 Thinking 在 2-Bench Telecom 代理工具使用基準測試中獲得了 93% 的成績,這是一個 agentic tool 基準測試,模型作為客戶服務代理進行操作。在長期代理上下文中的工具使用是 Kimi K2 Instruct 的強項,而新的 Thinking 變體在此方面取得了顯著進步。


      K2 Thinking 本地部署

      K2 Thinking 的模型文件只有 594GB


      https://huggingface.co/moonshotai/Kimi-K2-Thinking

      K2 Instruct 和 K2 Instruct 0905 的大小則超過 1TB,為何 Thinking 之后 594GB 呢?

      這是因為 K2 Thinking 使用 INT4 精度而非 FP8,Moonshot 在后訓練階段使用量化感知訓練來實現這一點,這意味著推理和訓練的效率提升。使用 INT4 的一個潛在原因是,Blackwell 的 NVIDIA GPU 不支持 FP4,因此 INT4 更適合在較陳舊的硬件上實現效率提升。

      vLLM Day 0 支持 K2 Thinking 的部署,命令如下

      # 安裝
      uv venv
      source .venv/bin/activate
      uv pip install -U vllm --pre --extra-index-url https://wheels.vllm.ai/nightly --extra-index-url https://download.pytorch.org/whl/cu129 --index-strategy unsafe-best-match # for xformers

      # 部署
      vllm serve moonshotai/Kimi-K2-Thinking \
      --trust-remote-code \
      --tensor-parallel-size 8 \
      --enable-auto-tool-choice \
      --tool-call-parser kimi_k2 \
      --reasoning-parser kimi_k2 \

      ## `--reasoning-parser` 標志指定用于從模型輸出中提取推理內容的推理解析器。

      要啟動 Kimi-K2-Thinking 需要 8 個 141GB 的 H200/H20,成本還是蠻高的,不過即便再量化,估計向下空間也不大了吧?已經 int4 了,還能怎樣。

      推薦使用 解碼上下文(DCP)并行部署,添加 --decode-context-parallel-size number 來啟用解碼上下文并行:

      vllm serve moonshotai/Kimi-K2-Thinking \
      --trust-remote-code \
      --tensor-parallel-size 8 \
      --decode-context-parallel-size 8 \
      --enable-auto-tool-choice \
      --tool-call-parser kimi_k2 \
      --reasoning-parser kimi_k2 \

      配合 DCP 后,優勢顯著(43% 更快的 Token 生成,26% 更高的吞吐量),同時幾乎沒有缺點(中位數延遲改善微乎其微)

      指標

      TP8

      TP8+DCP8

      變更

      改進 (%)

      請求吞吐量 (req/s)

      1.25

      1.57

      +25.6%

      輸出標記吞吐量 (tok/s)

      +43.1%

      平均 TTFT(秒)

      +16.0%

      中位數 TTFT(秒)

      后面我會拿之前的用例詳細測試一下,同時也把 Claude code 后臺模型改成 K2 Thinking 多用一用

      如有能再量化同時保障效果不打大折扣,把部署成本控制在 4 卡就好了,我也可以本地部署試試了。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      1958年,毛主席視察濟南,見到長征時警衛員道:小鬼,你官不小嘛

      1958年,毛主席視察濟南,見到長征時警衛員道:小鬼,你官不小嘛

      云霄紀史觀
      2025-12-25 01:31:06
      一上午11人,全部確診癌癥晚期!醫生提醒,天再冷也不要做這事

      一上午11人,全部確診癌癥晚期!醫生提醒,天再冷也不要做這事

      新時代的兩性情感
      2025-12-23 04:42:27
      當許世友乘車進入軍區招待所大院之際,哨兵朝他連開三槍,令人意外的是哨兵還被記了功,這其中的緣由是什么?

      當許世友乘車進入軍區招待所大院之際,哨兵朝他連開三槍,令人意外的是哨兵還被記了功,這其中的緣由是什么?

      寄史言志
      2025-12-23 12:47:15
      黃曉明帶兒子和媽媽包餃子,摘了假發套發量很藝術,兒子很像楊穎

      黃曉明帶兒子和媽媽包餃子,摘了假發套發量很藝術,兒子很像楊穎

      笑飲孤鴻非
      2025-12-24 01:09:08
      女警被3名歹徒侵犯活埋,臨終前還苦苦哀求歹徒

      女警被3名歹徒侵犯活埋,臨終前還苦苦哀求歹徒

      史記趣聞
      2025-12-19 20:40:05
      我替首長擋了5槍,他連電話都沒打,我退伍后,剛到火車站就被人攔住

      我替首長擋了5槍,他連電話都沒打,我退伍后,剛到火車站就被人攔住

      張道陵秘話
      2025-12-17 10:20:09
      肖央COS武大郎成名場面,張小婉頂替克拉拉跳舞,情圣3你給打幾分

      肖央COS武大郎成名場面,張小婉頂替克拉拉跳舞,情圣3你給打幾分

      新金牌娛樂觀察家
      2025-12-24 13:26:50
      鄭州中原保時捷中心疑似突然閉店“跑路”,當地商務局回應:有關部門已成立專班介入

      鄭州中原保時捷中心疑似突然閉店“跑路”,當地商務局回應:有關部門已成立專班介入

      揚子晚報
      2025-12-24 19:13:41
      非洲杯:曼聯雙煞齊獲開門紅

      非洲杯:曼聯雙煞齊獲開門紅

      體壇周報
      2025-12-25 08:36:25
      再砍27分6板4助2斷,大威少離311工程又近一步

      再砍27分6板4助2斷,大威少離311工程又近一步

      大眼瞄世界
      2025-12-24 22:28:36
      重磅!北京打響第一槍

      重磅!北京打響第一槍

      地產觀點
      2025-12-24 17:57:23
      破局!WS-21 發動機曝光, 中國殲-35 徹底擺脫動力枷鎖, 西方壟斷落幕

      破局!WS-21 發動機曝光, 中國殲-35 徹底擺脫動力枷鎖, 西方壟斷落幕

      Ck的蜜糖
      2025-12-25 10:09:28
      演都不演!京東法國倉庫被盜僅是冰山一角,更“惡心”的還在后面

      演都不演!京東法國倉庫被盜僅是冰山一角,更“惡心”的還在后面

      法老不說教
      2025-12-24 19:11:38
      原來他們是楊鳴父母,出身體育世家,難怪兒子能三連冠且性格囂張

      原來他們是楊鳴父母,出身體育世家,難怪兒子能三連冠且性格囂張

      凡知
      2025-12-24 18:09:24
      從“鐵姑娘”到身價億萬卻不拿一分工資的董事長,郭鳳蓮這輩子,活成了傳奇

      從“鐵姑娘”到身價億萬卻不拿一分工資的董事長,郭鳳蓮這輩子,活成了傳奇

      史海孤雁
      2025-12-16 22:13:43
      敢不敢攔?載有委內瑞拉原油的中國油輪已開出,美國敢不敢攔截?

      敢不敢攔?載有委內瑞拉原油的中國油輪已開出,美國敢不敢攔截?

      百態人間
      2025-12-24 16:50:17
      超越梅球王!奧利塞以30次助攻成為2025年助攻之王!

      超越梅球王!奧利塞以30次助攻成為2025年助攻之王!

      田先生籃球
      2025-12-25 10:08:11
      澤連斯基說漏嘴,公開盼望特朗普去世?普京樂了,送上一句夸贊

      澤連斯基說漏嘴,公開盼望特朗普去世?普京樂了,送上一句夸贊

      陳菲副教授
      2025-12-25 09:59:45
      1976年尼克松重返北京,執意要去周總理墓前磕頭,秘書一句話讓他瞬間淚崩

      1976年尼克松重返北京,執意要去周總理墓前磕頭,秘書一句話讓他瞬間淚崩

      史海殘云
      2025-12-19 14:26:17
      “地暖”逐漸退出中國家庭!學學山東人的取暖新方式,省錢又實用

      “地暖”逐漸退出中國家庭!學學山東人的取暖新方式,省錢又實用

      阿離家居
      2025-12-25 05:48:12
      2025-12-25 11:23:00
      機器學習與Python社區 incentive-icons
      機器學習與Python社區
      機器學習算法與Python
      3233文章數 11081關注度
      往期回顧 全部

      科技要聞

      屠龍少年被"招安"!英偉達平安夜豪擲200億

      頭條要聞

      媒體:靖國神社強塞韓軍人牌位 韓國如何清算是個看點

      頭條要聞

      媒體:靖國神社強塞韓軍人牌位 韓國如何清算是個看點

      體育要聞

      26歲廣西球王,在質疑聲中成為本土得分王

      娛樂要聞

      金莎被小19歲男友求婚,成功后擁抱親吻

      財經要聞

      美國未來18個月不對中國芯片加額外關稅

      汽車要聞

      預售31.3萬元起 全新奧迪Q5L將于1月內上市

      態度原創

      親子
      教育
      數碼
      時尚
      軍事航空

      親子要聞

      江西幼兒園園長駕車落水,致8人遇難后續,家長:園長也是好心

      教育要聞

      18部門聯手辦“家長學校”:陜西這樣破解“家庭教育困境”

      數碼要聞

      1799元起!華為MatePad 11.5正式開售 主打護眼學習

      對不起周柯宇,是陳靖可先來的

      軍事要聞

      澤連斯基版“和平計劃”透露哪些信息

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 老王AV| 色色97| 性做久久久久久| 精品国内自产拍在线观看| 精品香蕉在线视频| 岛国AV在线| 人妻a码精品| 久久久亚洲欧洲日产国码αv| 久久久国产一区二区三区四区小说 | 这里只有精品在线播放| 亚洲国产制服丝袜| 成人色一区二区三区| 无码一区二区三区免费| 动漫av永久无码精品每日更新| 国产精品视频一区国模私拍| 婷婷六月色| www97| 成人亚洲国产| 亚洲香蕉视频天天爽| 五月av综合av国产av | 亚洲一区av无码少妇电影| 久久久久国产一区二区三区| 欧美成人黄在线观看| 美腿丝袜中文字幕精品| 尤物yw193无码点击进入 | 亚洲精品成人一二三专区| 亚洲成人天堂网| 伊人久久久| 玩弄丰满少妇xxxxx性多毛| AV无码免费不卡在线观看| 专干老熟女A片| 邵武市| 午夜福利啪啪片| 欧美深度肠交惨叫| 精品久久久久无码| 91精品国产综合久久久蜜臀酒店| 无码人妻一区二区三区线花季传件| 色婷婷综合久久久久中文一区二区| 国产精品久久久久久影视| 欧美精品99久久久| 亚洲自拍成人|