<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      梁文鋒和楊植麟,第四次撞車

      0
      分享至



      二人為何都瞄準了視覺理解?

      文|《中國企業(yè)家》見習記者 孫欣

      記者 王怡潔

      見習編輯|李原編輯|何伊凡

      頭圖來源|視覺中國

      這已經是2025年以來的第4次,DeepSeek創(chuàng)始人梁文鋒和月之暗面創(chuàng)始人楊植麟在技術路線上精準“撞車”。

      1月27日,月之暗面發(fā)布并開源新模型Kimi K2.5,該模型由K2和K2-Thinking并存演進而來。在官方視頻里,楊植麟將其形容為“全能模型”,視覺理解、代碼、多模態(tài)、思考與非思考模式、Agent及Agent集群能力,都被封裝進了同一個模型中。

      除了代碼能力極大提升之外,K2.5的一大亮點在于“視覺理解能力”的極大增強,可分析用戶上傳的圖片、視頻,并據此編程或解答問題。

      無獨有偶,K2.5發(fā)布的同日,DeepSeek也上線了新一代模型OCR-2。該模型同樣在視覺理解上取得重大突破,解決方法更另辟蹊徑。DeepSeek創(chuàng)新了“視覺因果流”機制,不再需要按照固定順序掃描圖片,而是能像人一樣,根據圖像內容的語義和邏輯,動態(tài)調整閱讀順序。

      屢屢在同一條技術路線上探索,又數次同日發(fā)布成果,梁文鋒與楊植麟的心有靈犀已經很難用偶然來解釋,他們二人又為何不約而同地瞄準了視覺理解這座山峰?

      四次“撞車”

      實際上,梁文鋒和楊植麟模型產品、論文總是選擇同期發(fā)布,并非因為“內卷”。拆解二人的成果會發(fā)現,他們在關鍵技術路線上“和而不同”的創(chuàng)新,背后是對大模型和產業(yè)痛點的相似判斷。

      2025年1月20日,DeepSeek-R1上線后火速破圈。Kimi 1.5也緊隨其后發(fā)布,且同樣采用了“基于結果獎勵的強化學習”路線。

      2025年2月18日,梁文鋒和楊植麟前后腳發(fā)表了關于注意力架構的最新論文,聚焦于解決Transformer注意力機制下,長上下文處理效率低下、算力消耗過高的行業(yè)痛點。

      其中,梁文鋒作為共同作者,提出了DeepSeek-NSA(原生稀疏注意力)架構,通過分層壓縮、關鍵令牌選擇與滑動窗口結合的策略,大幅降低了長上下文處理的算力消耗。

      同日,楊植麟也作為論文共同作者,提出了MoBA(混合塊注意力)架構,并與NSA選擇了不同的優(yōu)化路徑——基于專家混合(MoE)原理,通過分塊處理與動態(tài)門控機制,讓模型自主實現全注意力與稀疏注意力的切換。

      只不過,NSA更側重硬件層面的優(yōu)化,MoBA則傾向于在Transformer框架內做靈活創(chuàng)新。雖路徑不同,但二人的核心目標一致:解決效率瓶頸,讓模型在復雜任務中更具實用性。

      2025年4月,DeepSeek發(fā)布數學推理模型DeepSeek-Prover-V2。通過子目標分解的強化學習推進定理證明,讓模型能夠“自驗證”推理過程的合理性,幾乎同期,月之暗面也上線了數學推理專項模型,同樣采用了“自驗證”核心方式,大幅提升了定理證明的穩(wěn)定性與準確性。


      來源:AI生成

      這一次“撞車”源于,彼時AI深度推理還是行業(yè)的技術難點。而數學推理作為核心場景,直接關系到大模型在科研、金融、工程等領域的落地能力,二人同時聚焦這一方向,背后是對驗證AI落地價值的一致探索。

      而最近的一次同臺競技,DeepSeek的OCR-2和月之暗面的K2.5又不約而同地瞄準了視覺理解。這一次同樣絕非巧合。

      數月前,《中國企業(yè)家》從相關人士處了解到,DeepSeek和月暗一直在圍繞誰能先做出具備前沿能力的視覺語言模型,讓大模型不再成為“聰明的瞎子”而暗自較勁。

      結合2025年7月SuperCLUE發(fā)布的多模態(tài)測評報告,或可找到二人攻堅視覺語言模型的答案。

      報告指出,視覺語言模型正普遍面臨三大痛點:1.專業(yè)領域知識欠缺,特別是在醫(yī)療影像分析、工業(yè)應用等專業(yè)領域得分較低。2.復雜場景適應不足,在自動駕駛、空間推理等任務中表現較差。3.多模態(tài)融合深度不夠,圖文不一致情況下,判斷準確率不足65%。

      由此可見,視覺理解是大模型從“語言交互”走向“全場景交互”的必經之路,也已成為制約模型商業(yè)化落地的瓶頸。梁文鋒與楊植麟同時聚焦這一領域,源于對行業(yè)痛點的相似洞察——誰能率先突破,就能在多模態(tài)商業(yè)化競爭中占據主動。

      如何翻越視覺理解高山?

      實際上,在大語言模型層面,國內模型正在與海外模型日益拉近距離。但業(yè)內人士對《中國企業(yè)家》表示,在視覺理解層面,海外被稱為“御三家”的Google Gemini、OpenAI GPT 5.2和Claude已“卷”到下一階段,國內大模型則還處于追趕和“補課”階段。

      例如,數月前網絡上曾讓大模型做識別車型的測試。特斯拉被車主自貼了一個小米標志,不少大模型將其認錯。“這說明綜合視覺信息,當前對多模態(tài)模型依舊有困難。”前述人士說。

      此次發(fā)布中,楊植麟在視頻中演示了一段視頻,K2.5通過識別圖片或者視頻,復刻出一個網址的功能。此前國內大模型更多需要借助語言、指令來實現。“需要精確地告訴模型,左上角是個按鈕,需求都要用指令來描述。”

      “一圖勝千言。”科技博主海拉魯對《中國企業(yè)家》說。大部分情況下,用戶很難用文字一次性描述出自己想要編出的前端界面,視覺理解核心意義在于讓大模型從“讀文字”升級為“懂信息、用信息。”

      K2.5是月暗在視覺理解上交出的第一份答卷。團隊讓原生的多模態(tài)架構設計與大規(guī)模視覺文本進行聯合預訓練,采用了約15萬億個Token持續(xù)訓練。在這個基礎底座之上,構建Visual Agentic Intelligence(視覺智能體智能)系統(tǒng)。簡而言之,K2.5從視覺理解編碼入手,分解Agent任務,增強Coding能力。

      接近月之暗面的人士告訴《中國企業(yè)家》,訓練中最現實的困難在于多模態(tài)數據的匱乏,以及對數據的處理。“普通人每天拍的照片對模型來說沒什么用。需要高質量的數據,才能讓模型學到東西。像維基百科,也只是中等質量的數據。”

      此外,月之暗面在K2.5中也再次堅持了對“技術品味”的追求,“如果你希望模型更加浪漫,精通軟件的UI界面、美學設計,你該給它匹配什么樣的數據,這都需要對世界有更多審美認知。”前述人士說。


      來源:官網截圖

      1月29日凌晨,月之暗面團隊在Reddit上回答了網友問題,楊植麟表示:“模型的核心在于品味,因為智能本身是非同質化的(non-fungible)。”

      海拉魯評價道,Kimi是國內編程不錯的模型里面第一家真正“開眼”的。AI從業(yè)者徐再世也表示:K2.5與其他多模態(tài)模型最大的區(qū)別在于,把視覺和編程、Agent能力結合得更緊密,這降低了開發(fā)門檻,讓非程序員靠截圖錄屏也能做出原型。

      除了前端設計,伴隨K2.5,Kimi還推出了Kimi Code,可以在終端里直接運行,也能集成到 VSCode、Cursor等主流編輯器中。簡單來說,K2.5可以自動發(fā)現用戶的編程過程,并將用戶現有的Skills(給AI Agent使用的技能包)遷移到新的工作流中。

      相對于K2.5側重在工程化層面解決問題,DeepSeek在視覺技術源頭做出了更多創(chuàng)新。

      傳統(tǒng)的視覺語言模型(VLM)在掃描圖片時,通常是固定地從左到右、從上到下。但人類在理解圖片時,會代入自身的語義順序和取舍,如先看標題,再看正文。

      OCR-2也模仿了人類的邏輯,其替換了原本的CLIP編碼器,引入了全新的視覺編碼器DeepEncoder V2。該架構打破了固定順序(從左上到右下)掃描圖像的限制,而是模仿人類視覺的“因果流(Causal Flow)”邏輯。

      從這個維度上看,DeepSeek和月之暗面雖然都在補齊視覺理解的短板,但二者的創(chuàng)新點發(fā)生在不同環(huán)節(jié)。K2.5是基于多模態(tài)模型提升工程化性能,更靠近商業(yè)落地側;而DeepSeek更側重追溯到技術源頭,進行創(chuàng)新。

      集群重新定義Agent

      除了視覺理解,此次K2.5的Agent集群功能也獲得了不少業(yè)內人士的稱道。

      徐再世在做大語言模型預訓練的工作,他看到,Anthropic的Claude Opus在編程場景上表現突出,一個原因就是它很擅長通過工具調用來執(zhí)行任務。但很多語言模型在工具調用中,出錯概率很高。而K2.5引入的Agent Swarm(智能體集群)架構,從單一Agent進化到Agent集群,意味著模型能力的關鍵提升。

      在楊植麟對Agent集群的介紹中,K2.5不再是一個單打獨斗包攬一切的智能體,而是一支即時組建的“智能體團隊”。即當任務下達時,主Agent能夠生出上百個“子Agent”,由主Agent支配。相較于單智能體模式,其任務執(zhí)行效率提升最高達4.5倍。

      月暗團隊演示了一段視頻,他們給Kimi Agent集群投喂了40篇關于心理學和AI的論文。K2.5先是通過多次調用工具,按順序把論文通讀一遍;隨后,其衍生出數個子Agent負責不同章節(jié)撰寫。最后,成果由主Agent負責把關驗收,將所有內容匯總成一份長達幾十頁的PDF綜述。


      來源:AI生成

      要實現上百個Agent并發(fā)運行并非易事,平衡調度器便是一大難點:在訓練初期,子Agent可能會因協同失敗而放棄并行策略。而月暗團隊采用了PARL (并行智能體強化學習) 的訓練方法,團隊通過分階段獎勵,引導模型建立穩(wěn)定偏好。

      此外,當100個Agent同時工作,通信、算力都將產生巨大負載,Agent之間可能會信息復讀、相互干擾,效率可能會低于單體模型。團隊需要讓模型學習如何自主通信,并動態(tài)調整智能體數量和資源分配。

      據《中國企業(yè)家》了解,K2.5整個Agent集群由K2.5模型全自動創(chuàng)建與協調,用戶無需對子智能體或工作流進行預先定義。即便某個子智能體失敗,主Agent也能迅速感知并重新調度。

      徐再世解釋道,無需預定義意味著K2.5的Agent集群是動態(tài)分工,模型自己會決定這個任務需要什么角色,自動創(chuàng)建子Agent并行工作。

      1月29日,在解答網友詢問K2.5的“智能體蜂群”在運行100個并行推理流時,如何解決延遲和上下文信息丟失問題時,月之暗面聯創(chuàng)吳育昕表示:K2.5的各個子智囊團可以在不“腐蝕”或污染主調度器上下文的情況下獨立執(zhí)行子任務,即子Agent本質上擁有各自的工作記憶,只在必要時將結果返回給調度器。

      “從K2開始,月暗團隊每一步都走得很扎實穩(wěn)重。”雖然徐再世認為,月暗的產品形態(tài)還需要時間打磨。但從長遠來看,Agent集群技術的突破有著重大價值。“這意味著未來的智能體將無需人工設計工作流,真正實現人力的解放。”

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      不要讓別人知道你狀態(tài)的三大重要原因

      不要讓別人知道你狀態(tài)的三大重要原因

      洞讀君
      2025-11-19 13:01:19
      火箭隊主帥在慘敗尼克斯后,公開批評阿門·湯普森和里德·謝潑德

      火箭隊主帥在慘敗尼克斯后,公開批評阿門·湯普森和里德·謝潑德

      好火子
      2026-02-22 22:51:45
      重回榜首!巴薩3-0萊萬特止連敗 貝爾納爾、德容建功費爾明世界波

      重回榜首!巴薩3-0萊萬特止連敗 貝爾納爾、德容建功費爾明世界波

      云隱南山
      2026-02-23 01:28:50
      浙江男子總感覺喉嚨不舒服,脖子右側有腫塊,確診HPV還有癌癥中晚期!這個夫妻親密習慣是誘因

      浙江男子總感覺喉嚨不舒服,脖子右側有腫塊,確診HPV還有癌癥中晚期!這個夫妻親密習慣是誘因

      環(huán)球網資訊
      2026-01-10 19:59:06
      6天虧光90萬,我勸普通人別做夢

      6天虧光90萬,我勸普通人別做夢

      最人物
      2026-02-06 15:53:05
      美國評出世界空軍前三甲,中國在迫近式追趕,已經無力再拉開距離

      美國評出世界空軍前三甲,中國在迫近式追趕,已經無力再拉開距離

      小熊侃史
      2026-01-05 10:37:37
      想不通,為什么別人在診室能聊半小時還不出來?網友的分享真相了

      想不通,為什么別人在診室能聊半小時還不出來?網友的分享真相了

      墻頭草
      2026-02-13 13:24:26
      學醫(yī)后才知道,腦梗最危險信號,不是手腳麻,而是頻繁出現3癥狀

      學醫(yī)后才知道,腦梗最危險信號,不是手腳麻,而是頻繁出現3癥狀

      風雨與陽光
      2026-02-11 19:13:07
      緣分!海港今年前5輪 都有老熟人 不是對手舊將 就是海港舊將

      緣分!海港今年前5輪 都有老熟人 不是對手舊將 就是海港舊將

      80后體育大蜀黍
      2026-02-22 23:00:36
      英超爭四大戰(zhàn):利物浦進球被吹仍絕殺,三隊同積45分

      英超爭四大戰(zhàn):利物浦進球被吹仍絕殺,三隊同積45分

      老瑋是個手藝人
      2026-02-23 00:35:19
      從杭州借道俄羅斯回東北的女孩已抵達黑河家中:耗時5天4夜,比國內直飛節(jié)約500多元,還玩了兩個俄羅斯城市

      從杭州借道俄羅斯回東北的女孩已抵達黑河家中:耗時5天4夜,比國內直飛節(jié)約500多元,還玩了兩個俄羅斯城市

      極目新聞
      2026-02-16 20:11:03
      谷愛凌破王濛紀錄容易,超馬龍奧運6金較難,全靠個人項目太吃虧

      谷愛凌破王濛紀錄容易,超馬龍奧運6金較難,全靠個人項目太吃虧

      楊華評論
      2026-02-22 23:58:56
      山東又一知名企業(yè)家獲聘央企

      山東又一知名企業(yè)家獲聘央企

      小蜜情感說
      2026-02-22 16:20:17
      所有發(fā)達國家都有一個共性:人工很貴,勞動很值錢。

      所有發(fā)達國家都有一個共性:人工很貴,勞動很值錢。

      流蘇晚晴
      2026-01-27 18:18:22
      華工科技:AI高速光模塊訂單排到四季度 春節(jié)期間武漢及泰國兩大生產基地全線運轉

      華工科技:AI高速光模塊訂單排到四季度 春節(jié)期間武漢及泰國兩大生產基地全線運轉

      財聯社
      2026-02-22 09:42:51
      在國安局食堂吃飯時,無意發(fā)現打菜的師傅,竟是我追蹤的千面間諜

      在國安局食堂吃飯時,無意發(fā)現打菜的師傅,竟是我追蹤的千面間諜

      千秋文化
      2026-02-19 10:43:29
      貝加爾湖溺亡事故幸存者被救細節(jié)披露:生死三分鐘,冰縫絕境逃生

      貝加爾湖溺亡事故幸存者被救細節(jié)披露:生死三分鐘,冰縫絕境逃生

      奇思妙想生活家
      2026-02-22 13:09:12
      0-1!0-2!瘋狂一夜,勒沃庫森爆冷,尤文被雙殺,切爾西意外翻車

      0-1!0-2!瘋狂一夜,勒沃庫森爆冷,尤文被雙殺,切爾西意外翻車

      足球狗說
      2026-02-22 03:04:00
      沙特等14國:強烈譴責美國大使言論

      沙特等14國:強烈譴責美國大使言論

      觀察者網
      2026-02-22 09:32:58
      楊秀清如此精明之人,為什么在天京事變中居然輕易被干掉了?

      楊秀清如此精明之人,為什么在天京事變中居然輕易被干掉了?

      掠影后有感
      2026-02-18 10:37:25
      2026-02-23 02:03:00
      中國企業(yè)家雜志 incentive-icons
      中國企業(yè)家雜志
      本賬號由《中國企業(yè)家》雜志社有限責任公司運營
      3008文章數 19878關注度
      往期回顧 全部

      財經要聞

      特朗普新加征關稅稅率從10%提升至15%

      頭條要聞

      男子持霰彈槍燃燒罐闖特朗普私宅被擊斃 細節(jié)披露

      頭條要聞

      男子持霰彈槍燃燒罐闖特朗普私宅被擊斃 細節(jié)披露

      體育要聞

      谷愛凌:6次參賽6次奪牌 我對自己非常自豪

      娛樂要聞

      谷愛凌:真正的強大 敢接納生命的節(jié)奏

      科技要聞

      馬斯克:星艦每年將發(fā)射超過10000顆衛(wèi)星

      汽車要聞

      續(xù)航1810km!smart精靈#6 EHD超級電混2026年上市

      態(tài)度原創(chuàng)

      家居
      時尚
      本地
      旅游
      軍事航空

      家居要聞

      本真棲居 愛暖伴流年

      50+女人更適合基礎款,掌握3個高段位搭配思路,輕松提升品味

      本地新聞

      春花齊放2026:《駿馬奔騰迎新歲》

      旅游要聞

      百余組花燈齊亮!青島這處海邊盛會,年味直接拉滿

      軍事要聞

      約旦基地美軍戰(zhàn)機驟增 包括F-35隱形戰(zhàn)斗機

      無障礙瀏覽 進入關懷版