<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Kimi K2 Thinking 模型發布并開源,全面提升 Agent 和推理能力|Z News

      0
      分享至


      11 月 6 日,Kimi 發布 Kimi K2 Thinking,已在網頁端與最新版 App 上線,同時其 API 也正式登陸 Kimi 開放平臺。

      Kimi K2 是基于「模型即 Agent」理念訓練的新一代 Thinking Agent。在 OpenAI 評估 AI Agent 網絡瀏覽能力的基準測試 BrowseComp 中,Kimi K2 以 60.2% 的成績成為新的 SOTA 模型。

      真格基金于 2023 年天使輪投資月之暗面。自 2023 年 10 月發布以來,Kimi 持續升級基礎模型能力,拓展產品功能與交互體驗。Kimi K2 模型最初發布于 7 月 11 日。目前,包括 Cursor、Genspark、Perplexity、YouWare 等多款產品已接入或使用 Kimi K2 模型。

      我們期待在未來與 Kimi 和更多用戶一起共創智能。

      今天,我們發布 Kimi K2 Thinking——Kimi 迄今能力最強的開源思考模型。


      Kimi K2 Thinking 是我們基于「模型即 Agent」理念訓練的新一代 Thinking Agent,它原生掌握「邊思考,邊使用工具」的能力。在人類最后的考試(Humanity's Last Exam)、自主網絡瀏覽能力(BrowseComp)、復雜信息收集推理(SEAL-0)等多項基準測試中表現達到 SOTA 水平,并在 Agentic 搜索、Agentic 編程、寫作和綜合推理能力等方面取得全面提升。


      Kimi K2 Thinking 模型無需人類干預,即可憑借持續穩定的深度思考能力自主實現高達 300 步的工具調用,從而幫助用戶解決更復雜的問題。這是我們在 Test-Time Scaling(測試時擴展)領域的最新進展,通過同時擴展思考 Token 和工具調用的步數,實現更強的 Agent 和推理性能。


      Kimi K2 Thinking 模型已上線 kimi.com 和最新版 Kimi 手機應用的常規對話模式。Kimi Agent 模式的底層模型后續也將升級為 Kimi K2 Thinking 模型,帶來完整的多步思考和工具調用能力。


      Kimi K2 Thinking 模型的 API 可通過 Kimi 開放平臺(platform.moonshot.cn)訪問。如需自行部署,請在 Hugging Face、ModelScope 等平臺下載模型。


      推理性能全面提升

      我們來看一個人類最后的考試中人文類題目推理過程示例。在這個示例中,Kimi K2 Thinking 經過 5 次搜索和推理,結合每步搜索到的新信息,層層深入,最終推理出了答案:


      上下滾動查看完整推理過程

      自主搜索與瀏覽能力全面提升

      在復雜搜索和瀏覽場景中,Kimi K2 Thinking 模型也表現出色。BrowseComp 是由 OpenAI 發布的一個專門評估 AI Agent 網絡瀏覽能力的基準測試,這項測試的初衷是衡量 AI Agent 在信息過載環境中展現出的堅持性與創造力,即能否像人類研究員一樣「刨根問底」。在這項極具挑戰的任務上,人類平均只能達到 29.2% 的成績。Kimi K2 Thinking 在這項基準測試中展現出極強的鉆研能力,以 60.2% 的成績成為新的 SOTA 模型。


      在長程規劃和自主搜索能力的驅動下,Kimi K2 Thinking 可借助多達上百步的「思考 → 搜索→ 瀏覽網頁 → 思考 → 編程」動態循環,持續地提出并完善假設、驗證證據、進行推理,并構建出邏輯一致的答案。這種邊主動搜索邊持續思考的能力,使 Kimi K2 Thinking 能夠將模糊且開放式的問題分解為清晰、可執行的子任務。


      我們來看一個示例,在這個例子中,Kimi K2 Thinking 經過兩次搜索和思考,先根據股票回購的已知信息找到了這家制造快艇的公司,然后在美國證券交易委員會(SEC)的官網上找到了股票回購公告信息,得出了準確的答案:


      上下滾動查看完整推理過程

      Agentic 編程能力持續精進

      Kimi K2 Thinking 模型的編碼能力也得到了增強,在多語言軟件工程基準 SWE-Multilingual、SWE-bench 驗證集和 Terminal 終端使用等基準測試中的表現有了進一步提升。


      我們觀察到 Kimi K2 Thinking 在處理 HTML、React 以及組件豐富的前端任務時性能有明顯提升,能將創意轉變為功能齊全、響應式的產品。在 Agentic Coding 場景中,Kimi K2 Thinking 能在調用各種工具的同時進行思考,靈活地融入 software agents 中,處理更復雜、多步驟的開發工作流。


      我們來看兩個例子:


      現在,Kimi K2 Thinking 可以幫你復刻一個真實可用的 Word 文字編輯器。


      Kimi K2 Thinking 也可以幫你創造一個華麗風格的體素藝術(voxel art)作品:


      通用基礎能力升級

      創意寫作:Kimi K2 Thinking 顯著提升了寫作能力,它能將粗略的靈感轉化為清晰、動人且意圖明確的敘述,使其兼具韻律感和深度。它能輕松駕馭微妙的文風差異和模糊的結構,并在長篇大論中保持風格的連貫性。在創意寫作方面,它筆下的意象更生動,情感共鳴更強烈,將精準的表達與豐富的表現力融為一體。


      學術與研究:在學術研究和專業領域,Kimi K2 Thinking 在分析深度、信息準確性和邏輯結構方面均有顯著提升。它能有條不紊地剖析復雜的指令,并以清晰嚴謹的方式拓展思路。這使其尤其擅長處理學術論文、技術摘要,以及那些對信息完整性和推理質量要求極高的長篇報告。


      個人與情感:在回應個人或情感類問題時,Kimi K2 Thinking 的回答更富同理心,立場也更中正平和。它的思考深入周到且具體明確,能提供細致入微的觀點和切實可行的后續建議。它能清晰并關切地幫助用戶梳理復雜的決策,其語氣既腳踏實地又切實中肯,更有人情味。


      我們來看一個輔助閱讀英文技術論文的例子:


      上下滾動查看完整分析過程

      原生 INT4 量化提升推理效率

      低比特量化是降低大規模推理服務器的延遲和 GPU 顯存占用的有效方法。我們的測試發現,因為思考模型會產生極長的解碼長度,常規的量化手段往往會導致模型性能大幅下降。為了克服這一挑戰,我們在后訓練(post-training)階段采用了量化感知訓練(QAT),并對 MoE 組件應用了 INT4 純權重(weight-only)量化。


      這使得 Kimi K2 Thinking 模型能夠在復雜推理和 Agentic 任務中支持原生的 INT4 推理,并將生成速度提升了約 2 倍。INT4 對推理硬件的兼容性更強,對國產加速計算芯片也更加友好。值得注意的是,Kimi 所有的基準測試成績都是在 INT4 精度下取得的。

      現在開始使用


      前往 kimi.com 或更新到最新版 Kimi App,從「工具箱」中打開 K2 模型的「長思考」開關,即可把你遇到的復雜任務丟給 Kimi 一起思考。

      Kimi K2 Thinking 模型 API 已上架 Kimi 開放平臺(platform.moonshot.cn),支持 256K 上下文,價格與 Kimi K2-0905 相同,每百萬 Token 輸入 4 元,輸出 16 元,命中緩存的輸入為 1 元。速度高達 100 Token/s 的 Turbo API 也同步上架,每百萬 Token 輸入 8 元,輸出 58 元,命中緩存的輸入為 1 元。歡迎開發者測試反饋新模型 API。

      關于 Kimi K2 模型


      Kimi K2 模型最初發布于 7 月 11 日,它是一款混合專家架構(MoE)的開源基礎模型,總參數 10,000 億,激活參數 320 億。9 月 5 日,Kimi K2-0905 版更新,進一步提升了代碼能力,并且將上下文窗口從 128K 升級到 256K。截止目前,包括 Cline、Cursor、flowith、Genspark、Kilo Code、Kortix Suna、OpenRouter、Perplexity、RooCode、TRAE、Trickle、Vercel、Windsurf 、YouWare 等在內的產品都接入或在使用 Kimi K2 模型。11 月 6 日,Kimi K2 Thinking 模型發布,全面提升 Agent 和推理能力。




      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      楊絳:當你的孩子主動給你買衣服、買吃的,或者主動給你發紅包時,不管你缺不缺錢,有多心疼孩子賺錢辛苦,你都要欣然的收下。因為..

      楊絳:當你的孩子主動給你買衣服、買吃的,或者主動給你發紅包時,不管你缺不缺錢,有多心疼孩子賺錢辛苦,你都要欣然的收下。因為..

      二胡的歲月如歌
      2026-04-26 08:37:16
      體壇丑聞!嗜賭只是冰山一角,婚內出軌睡有婦之夫,太毀三觀

      體壇丑聞!嗜賭只是冰山一角,婚內出軌睡有婦之夫,太毀三觀

      橙星文娛
      2026-04-25 11:14:17
      賴清德鬧出大笑話、甩鍋大陸!鄭麗文需明白一件事,要警惕盧秀燕

      賴清德鬧出大笑話、甩鍋大陸!鄭麗文需明白一件事,要警惕盧秀燕

      野史日記
      2026-04-25 09:00:15
      東體:在上海舉行的懷舊友誼賽原本還想要邀請瓜林和阿爾貝茨

      東體:在上海舉行的懷舊友誼賽原本還想要邀請瓜林和阿爾貝茨

      懂球帝
      2026-04-25 18:30:45
      美媒痛哭發現,美國瞎折騰了七八年,中國卻已不可阻擋

      美媒痛哭發現,美國瞎折騰了七八年,中國卻已不可阻擋

      阿豐聊娛
      2026-04-26 08:06:11
      中央5臺直播乒乓球時間表:4月25日CCTV5轉播國乒!附乒壇動態

      中央5臺直播乒乓球時間表:4月25日CCTV5轉播國乒!附乒壇動態

      林子說事
      2026-04-25 17:48:24
      與10年前南海對峙相比,解放軍實力提升多少?速度連美軍都想不到

      與10年前南海對峙相比,解放軍實力提升多少?速度連美軍都想不到

      鋒芒點兵
      2026-04-19 11:50:21
      紀實:浙江女教師突然失蹤6年,13歲兒子憑借一個夢找到母親

      紀實:浙江女教師突然失蹤6年,13歲兒子憑借一個夢找到母親

      紅豆講堂
      2024-10-25 09:45:59
      福特CEO把一輛小米SU7運到美國,駕駛半年后,他這樣評價…

      福特CEO把一輛小米SU7運到美國,駕駛半年后,他這樣評價…

      新浪財經
      2026-04-24 07:10:27
      唐家三少從2014年的時候,就已經實現了通過寫網絡小說年入五千萬

      唐家三少從2014年的時候,就已經實現了通過寫網絡小說年入五千萬

      歲月有情1314
      2026-04-25 01:49:33
      鄭維山本來已交接準備回國,聽聞韓總統不服,掉頭怒殲28000韓軍

      鄭維山本來已交接準備回國,聽聞韓總統不服,掉頭怒殲28000韓軍

      談古論今歷史有道
      2026-04-25 10:55:03
      太狠了!3000元招保姆,要求承擔做飯、帶娃并無償試用,引發爭議

      太狠了!3000元招保姆,要求承擔做飯、帶娃并無償試用,引發爭議

      火山詩話
      2026-04-25 16:38:17
      陳思誠怎么也沒想到,自己籌備的新片首映禮,被10歲兒子搶了風頭

      陳思誠怎么也沒想到,自己籌備的新片首映禮,被10歲兒子搶了風頭

      草莓解說體育
      2026-04-26 09:11:29
      嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

      嗜賭成性只是冰山一角,婚內出軌、睡有婦之夫,體壇丑聞毀三觀

      阿訊說天下
      2026-04-25 11:15:04
      日本網友瘋換中文手機界面,直呼清爽十倍,中國文化悄悄出圈!

      日本網友瘋換中文手機界面,直呼清爽十倍,中國文化悄悄出圈!

      行者聊官
      2026-04-24 20:48:30
      央8新劇4.28登陸黃金檔!實力派集結 都市情感劇再出誠意之!

      央8新劇4.28登陸黃金檔!實力派集結 都市情感劇再出誠意之!

      動物奇奇怪怪
      2026-04-26 10:59:22
      第一集就全裸出鏡,女神新劇太生猛了

      第一集就全裸出鏡,女神新劇太生猛了

      來看美劇
      2026-04-24 22:03:11
      拿了錢還不放人!19歲花季少女被困柬埔寨56天,綁匪正臉照曝光!

      拿了錢還不放人!19歲花季少女被困柬埔寨56天,綁匪正臉照曝光!

      今朝牛馬
      2026-04-07 22:43:23
      黃宗澤牙齦萎縮影響顏值,再帥的港圈男神,也扛不住一口牙毀所有

      黃宗澤牙齦萎縮影響顏值,再帥的港圈男神,也扛不住一口牙毀所有

      觀魚聽雨
      2026-04-24 23:08:32
      明查|日本自衛隊坦克炸膛涉“中國制造”?型號搞錯了,且此“中國”非中國

      明查|日本自衛隊坦克炸膛涉“中國制造”?型號搞錯了,且此“中國”非中國

      澎湃新聞
      2026-04-25 07:16:29
      2026-04-26 12:03:00
      真格基金 incentive-icons
      真格基金
      創業,來真格的。
      1543文章數 3663關注度
      往期回顧 全部

      科技要聞

      漲價浪潮下,DeepSeek推動AI“價格戰”

      頭條要聞

      白宮突發槍擊案 250名記者聯名要求將晚宴變維權現場

      頭條要聞

      白宮突發槍擊案 250名記者聯名要求將晚宴變維權現場

      體育要聞

      那一刻開始,兩支球隊的命運悄然改變了

      娛樂要聞

      《八千里路云和月》大結局意難平

      財經要聞

      DeepSeek V4背后,梁文鋒的轉身

      汽車要聞

      預售19.38萬元起 哈弗猛龍PLUS七座版亮相

      態度原創

      藝術
      本地
      手機
      房產
      公開課

      藝術要聞

      鄭麗文訪問清華附中引發熱議,蔣中正信札字跡真實性遭質疑

      本地新聞

      云游中國|逛世界風箏都 留學生探秘中國傳統文化

      手機要聞

      姚安娜喜提華為Pura X Max 網友:又美又颯

      房產要聞

      新一輪教育大爆發來了!海口,開始瘋狂建學校!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品调教| www.日韩av| 色色资源网| 亚洲色婷婷久久精品av蜜桃久久| 麻豆精品一区综合av在线| 色色97| 亚洲激情偷拍| 51国精产品自偷自偷综合| 西西大胆午夜人体视频| 国产亚洲精品成人av一区| 国产av天堂| 免费的很黄很污的视频| 亚洲av永久无码一区二区三区| 一区二区免费| 宜良县| 91青青草视频在线观看| 国模大胆一区二区三区| 成人午夜福利视频后入| 久久香综合精品久久伊人| 性欧美videofree高清精品| 亚洲最大成人在线| 赤峰市| 国产在线一区二区在线视频| 人妻中文字幕网| 亚洲无av在线中文字幕| 国产午夜福利精品久久不卡| 67194欧洲| 久久高清超碰AV热热久久| av无码精品一区二区三区三级| 亚洲成人国产精品| 狠狠色噜噜狠狠狠狠色综合久av| 久国产精品韩国三级视频| 久久精品| 小13箩利洗澡无码免费视频| 喂奶人妻被中出中文字幕| 毛葺葺老太做受视频| 亚洲人成无码网站久久99热国产| 国产精品久久久一区二区三区 | 久久久欧美精品激情| 久久国产精品成人免费| 精品久久久中文字幕人妻|