<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      你的Office被兩個AI接管了:GPT寫稿Claude審稿,微軟默認開啟

      0
      分享至


      新智元報道

      編輯:元宇

      【新智元導讀】微軟最大的對手不是谷歌,是自己曾經(jīng)的獨家依賴。Copilot最新升級默認GPT寫稿、Claude審稿,Anthropic的Agent骨架更被直接焊進Office。從綁定OpenAI到收編所有頂級模型,微軟押注的是:無論誰贏,流量都經(jīng)過我。

      單模型時代,結束了。

      剛剛,微軟把Copilot的引擎換了,在Researcher中引入多模型智能。


      從此,Copilot的Researcher智能體,默認同時調(diào)用GPT和Claude。

      這不是讓你手動切模型的那種「多模型」,而是GPT寫完初稿,Claude自動扮演專家評審員逐條審查,審完再交付給你。

      一個負責「沖鋒」,一個負責「挑刺」。

      微軟表示,這是Microsoft 365 Copilot深度研究代理Researcher邁出的重要一步

      Researcher專為在工作流程中處理復雜研究而設計,這次通過兩項全新的多模型能力:「批判」(Critique)和「智囊團」(Council),進一步提升了準確性、深度和可信度。

      實測效果驚人。

      在DRACO基準測試中,這套「雙模型互搏」架構綜合得分比此前一直被視為深度研究天花板的Perplexity Deep Research(搭載Claude Opus 4.6)高出13.8%。

      但這還不是全部。

      同一天上線的Copilot Cowork,微軟表示是把支撐Claude Cowork的技術平臺引入了Microsoft 365 Copilot,并與Work IQ、企業(yè)權限和治理體系深度整合,讓AI能自主規(guī)劃、跨工具推進多步任務。

      這已經(jīng)不是「接了個API」那么簡單,而是在把外部前沿智能體能力,納入微軟自己的工作系統(tǒng)。

      微軟的牌面已攤開:不把賭注壓在單一模型上,而是把Anthropic、OpenAI等前沿模型納入Copilot的多模型編排框架。

      也就是說,Copilot正在從傳統(tǒng)AI助手,升級成一個面向企業(yè)工作的多模型執(zhí)行與編排系統(tǒng)。

      Critique

      讓AI自己審自己的作業(yè)

      過去的AI研究工作流有一個結構性盲區(qū):規(guī)劃、檢索、綜合、撰寫全部壓在一個模型上。

      讓模型既當運動員又當裁判,這樣幻覺幾乎是必然的。

      微軟這次給出的解法是:把「生成」和「評估」拆成兩個獨立角色。

      具體到大模型,是讓GPT負責上半場:任務規(guī)劃、迭代檢索、起草初稿;Claude負責下半場:以專家評審員的身份,基于結構化評價量表(Rubric)逐條審查。

      這個量表主要聚焦三個維度:

      來源可靠性評估,審查引用是否權威、可驗證;

      報告完整性,檢查是否覆蓋了用戶請求的所有意圖;

      嚴格的證據(jù)溯源,要求每一個關鍵結論都錨定到帶有精確引用的可靠來源。

      更關鍵的是,審閱者的定位不是「第二作者」,而是「同行評審」。它不替你重寫,而是逼你寫得更好。

      微軟365和Copilot企業(yè)副總裁Nicole Herskowitz說:「我們不是簡單地在Copilot里塞了多個模型,我們是讓客戶真正享受到模型協(xié)同工作的好處。」

      未來這套機制還會升級為雙向互審:GPT也能審Claude的稿。

      Critique已經(jīng)是Researcher的默認模式,無需手動開啟

      其實,這算不上什么技術花活,而是把學術界運行了幾百年的同行評審制度,第一次工程化地嵌進了AI系統(tǒng)

      用架構設計來壓制幻覺,而不是一味指望單個模型變得更聰明。

      DRACO跑分拆解

      13.8%的含金量

      數(shù)據(jù)不說謊。

      DRACO(深度研究準確性、完整性和客觀性)是由Perplexity和學術界研究人員于2026年2月推出的基準測試,覆蓋10個領域、100項復雜研究任務,全部源自真實使用場景。

      每個問題經(jīng)過5次獨立運行取均值,評估維度包括事實準確性、分析廣度和深度、表達質(zhì)量、引用質(zhì)量四項。

      評委模型是GPT-5.2。

      微軟特別強調(diào),采用了與基準論文完全一致的評估協(xié)議和配置,確保「同口徑」公平對比。

      搭載Critique的Researcher綜合得分實現(xiàn)了+7.0分(SEM±1.90)的顯著提升,比此前表現(xiàn)最好的Perplexity Deep Research高出13.88%。


      DRACO基準測試綜合得分對比圖:各深度研究系統(tǒng)(含Researcher with Critique、Perplexity Deep Research等)橫向得分對比。其中除Researcher with Critique外,其余對比結果引自Zhong et al., arXiv:2602.11685。

      拆開四個維度看:

      分析廣度和深度提升最明顯,+3.33。其次是表達質(zhì)量+3.04,事實準確性+2.58。引用質(zhì)量同樣有提升。

      所有維度均達到統(tǒng)計學顯著(配對t檢驗,p<0.0001)。

      真正值得注意的是那個+3.33。分析深度的飆升說明Critique最大的價值不是糾錯,而是可以逼出更全面的分析視角。

      在領域?qū)用妫?0個領域中有8個觀察到顯著提升,覆蓋醫(yī)學、技術、法律等核心場景。

      僅有的兩個例外是「學術」和「大海撈針」,這兩個領域測試結果波動較大。


      DRACO基準四項評測維度提升表:Researcher with Critique(多模型)相較單模型 Researcher,在分析廣度與深度、呈現(xiàn)質(zhì)量、事實準確性和引用質(zhì)量上的提升,以及各項對最終總分的貢獻。

      13.8%聽起來是一個數(shù)字。

      在深度研究這個賽道上,此前各家打得難分難解,Perplexity搭載Claude Opus 4.6好不容易爬到的天花板,現(xiàn)在被Critique一個架構創(chuàng)新直接擊穿了。

      當你需要的不是一個答案

      而是一場辯論

      Critique解決的是「怎么讓一份報告更準」的問題。

      但有些場景,你要的根本不是一份精修稿,而是兩個專家吵一架。

      而這,就是Council的定位。

      在模型選擇器中選「Model Council」,GPT和Claude會各自獨立生成一份完整報告,并排展示。

      然后,一個專門的評委模型會對兩份報告進行評估,生成一份綜述(Cover Letter),深入分析雙方在哪些觀點上達成一致、在何處存在分歧,以及各自帶來的獨特見解。


      Council模式產(chǎn)品界面截圖:GPT和Claude各自生成的完整報告并排展示,附評委模型生成的Cover Letter綜述。

      表面上看,這只是「多選一」變成了「全都看」,實質(zhì)上是把決策場景中的信息盲區(qū)暴露出來。

      一個模型可能忽略的事實、權重不同的分析框架、另一條推理路徑……Council把這些全部擺到桌面上。

      做季度戰(zhàn)略報告的時候,你希望看到一份精修稿,還是兩個專家各執(zhí)己見、讓你自己判斷?

      Critique是「編輯審稿」模式,效率優(yōu)先。

      Council是「專家會診」模式,決策優(yōu)先。

      兩個模式精準覆蓋了企業(yè)用AI做研究的兩種核心場景:日常產(chǎn)出要快要準,重大決策要全要思考全面。

      Copilot Cowork

      微軟把Anthropic的撒手锏搬進了Office

      如果說Critique和Council改變的是研究質(zhì)量,Copilot Cowork改變的是工作方式本身。

      Copilot Cowork直接基于Anthropic的Claude Cowork技術平臺構建。

      這里不是「接入」或者「兼容」,而是「基于其技術平臺構建」。

      它的工作方式很簡單:你描述想要的結果,Copilot Cowork自動制定計劃,跨工具和文件進行邏輯推理,在推進過程中實時展示進度,你可以隨時介入和引導。


      Copilot Cowork操作界面:描述目標 → 自動規(guī)劃 → 跨工具執(zhí)行 → 實時進度展示。

      內(nèi)置Claude加上微軟原生技能:日歷管理、每日簡報等,覆蓋從一次性雜事到每月預算審查的各類任務。

      Capital Group等機構已經(jīng)在使用,反饋集中在規(guī)劃、排程、產(chǎn)出成果以及準備管理層審查等高價值場景。

      目前通過Frontier計劃向早期客戶開放。

      這意味著,微軟和Anthropic的關系,已經(jīng)從「模型供應商」進化到了「技術平臺共建」,Cowork把Claude的Agent骨架直接嵌進了M365的肌肉里。

      微軟本月早些時候已以測試模式發(fā)布Copilot Cowork,目標是「抓住市場對自主AI智能體日益增長的需求」。

      所以,這不是一次產(chǎn)品更新,這是一次架構級別的站隊。

      微軟的真正野心

      從AI助手到模型指揮中心

      把以上所有動作連起來看,微軟的戰(zhàn)略意圖已經(jīng)很清晰:它不再押注自己或者某一個模型能贏,而是轉(zhuǎn)向押注無論誰贏,流量都經(jīng)過我

      從對OpenAI的深度依賴,到把Anthropic的技術深度整合進產(chǎn)品線,微軟正在從「模型選手」轉(zhuǎn)型為「編排層」。

      Critique讓GPT和Claude協(xié)作,Council讓它們競爭,Cowork讓Anthropic的Agent能力直接為Office用戶服務。

      這是平臺邏輯,不是模型邏輯。

      正面戰(zhàn)場上,微軟同時在硬剛谷歌Gemini的多模態(tài)路線和Anthropic Claude Cowork的自主Agent路線。

      但當Anthropic、OpenAI、谷歌三巨頭的模型格局已經(jīng)成型,微軟的策略不是下場當選手,而是用生態(tài)開放把所有選手的能力收編進自己的平臺。

      對開發(fā)者來說,信號已經(jīng)非常明確:未來的競爭力不在于綁死一個模型,而在于編排多模型的能力

      但市場對于微軟這次Copilot升級,似乎并不買賬。

      微軟股價當日僅微漲約1%,本季度仍面臨近25%的跌幅:這是2008年金融危機以來最差的單季表現(xiàn)。

      華爾街更在意的,可能是落地數(shù)據(jù):多模型來回調(diào)用的成本誰買單?企業(yè)員工真能把它融入日常工作流?

      可以確定的是,這次升級改寫了微軟與OpenAI的合作關系,OpenAI在微軟生態(tài)里的位置,已經(jīng)從「唯一的王牌」變成了「牌桌上的一張」。

      而對Anthropic、OpenAI、谷歌三家來說,值得警惕的是:當平臺方開始把你的能力當作可替換的模塊來編排,模型能力本身或許就不再是護城河了。

      企業(yè)級AI正在從「聊天機器人」時代翻篇,進入「工作系統(tǒng)」時代。

      這個轉(zhuǎn)折點上,決定勝負的不再是誰家的benchmark最高,而是誰能把多個模型編排成一條可靠的、可審計的、可落地的工作流。

      參考資料:

      https://www.reuters.com/business/microsoft-unveils-ai-upgrades-rolls-out-copilot-cowork-early-access-customers-2026-03-30/

      https://techcommunity.microsoft.com/blog/microsoft365copilotblog/introducing-multi-model-intelligence-in-researcher/4506011

      https://www.microsoft.com/en-us/microsoft-365/blog/2026/03/30/copilot-cowork-now-available-in-frontier/

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      澤連斯基:助力中國崛起的一大功臣

      澤連斯基:助力中國崛起的一大功臣

      賤議你讀史
      2026-03-30 06:45:03
      董宇輝爭議言論炸上熱搜,人設大反轉(zhuǎn)!

      董宇輝爭議言論炸上熱搜,人設大反轉(zhuǎn)!

      陳意小可愛
      2026-04-07 18:09:49
      鄭麗文訪陸受高規(guī)格禮待,隨行的13人,各個身份不簡單

      鄭麗文訪陸受高規(guī)格禮待,隨行的13人,各個身份不簡單

      石江月
      2026-04-07 17:09:01
      越南已被逼入絕境,總理臨卸任死磕中國,賭上國運也要換掉米軌

      越南已被逼入絕境,總理臨卸任死磕中國,賭上國運也要換掉米軌

      生活魔術專家
      2026-04-07 17:55:47
      美媒:“無法無天的世界代價高昂”

      美媒:“無法無天的世界代價高昂”

      參考消息
      2026-04-07 16:50:06
      媒體人:陳濤從冬訓到現(xiàn)在瘦了20多斤,劉建業(yè)瘦了也有白發(fā)了

      媒體人:陳濤從冬訓到現(xiàn)在瘦了20多斤,劉建業(yè)瘦了也有白發(fā)了

      懂球帝
      2026-04-07 15:46:08
      日本網(wǎng)紅印度旅游遭牛糞“洗禮”!高燒住院又因咖喱餐上吐下瀉,差點躺板板?

      日本網(wǎng)紅印度旅游遭牛糞“洗禮”!高燒住院又因咖喱餐上吐下瀉,差點躺板板?

      英國報姐
      2026-04-06 21:06:23
      廣州外賣騎手去年平均薪酬15萬,快遞員、貨車司機收入下降

      廣州外賣騎手去年平均薪酬15萬,快遞員、貨車司機收入下降

      南方都市報
      2026-04-07 18:12:09
      小米聯(lián)合創(chuàng)始人黎萬強、洪鋒退出小米科技,發(fā)生了什么?

      小米聯(lián)合創(chuàng)始人黎萬強、洪鋒退出小米科技,發(fā)生了什么?

      投資時間網(wǎng)
      2026-04-07 15:18:09
      1955年大授銜,張萬年授了什么軍銜?

      1955年大授銜,張萬年授了什么軍銜?

      老范談史
      2026-04-07 16:39:32
      “唐僧”遲重瑞妻子陳麗華去世,2月前還露面,曾談家族財產(chǎn)安排

      “唐僧”遲重瑞妻子陳麗華去世,2月前還露面,曾談家族財產(chǎn)安排

      古希臘掌管松餅的神
      2026-04-07 11:58:30
      伊朗官員號召青年手拉手圍住電站:人鏈護核設施

      伊朗官員號召青年手拉手圍住電站:人鏈護核設施

      桂系007
      2026-04-07 14:53:23
      張本智和觀戰(zhàn)決賽面露恐懼!日本球迷盼他退位:松島已成日乒最強

      張本智和觀戰(zhàn)決賽面露恐懼!日本球迷盼他退位:松島已成日乒最強

      顏小白的籃球夢
      2026-04-07 08:22:42
      看看謝潑德和卡斯爾本賽季的數(shù)據(jù)對比,火箭其實真不必羨慕馬刺!

      看看謝潑德和卡斯爾本賽季的數(shù)據(jù)對比,火箭其實真不必羨慕馬刺!

      田先生籃球
      2026-04-07 15:15:04
      2名飛行員和5億美元哪個更重要?

      2名飛行員和5億美元哪個更重要?

      山河路口
      2026-04-06 12:12:25
      曝小玥兒日本歸來第一次來月事,S家人不教她,網(wǎng)友直呼無底線!

      曝小玥兒日本歸來第一次來月事,S家人不教她,網(wǎng)友直呼無底線!

      古希臘掌管松餅的神
      2026-04-06 21:35:36
      蘋果iPhone Fold折疊屏開始試產(chǎn) 12月全球開售

      蘋果iPhone Fold折疊屏開始試產(chǎn) 12月全球開售

      PChome電腦之家
      2026-04-07 11:18:51
      鄭麗文已到達南京,盧秀燕江啟臣沉默,新黨一人發(fā)聲亮了,不一般

      鄭麗文已到達南京,盧秀燕江啟臣沉默,新黨一人發(fā)聲亮了,不一般

      DS北風
      2026-04-07 17:22:05
      伊朗:以色列承認失敗!

      伊朗:以色列承認失敗!

      極目新聞
      2026-04-07 11:56:31
      王勵勤終于下定決心!4大老將逐步放棄,重點培養(yǎng)新生代為時不晚

      王勵勤終于下定決心!4大老將逐步放棄,重點培養(yǎng)新生代為時不晚

      羅納爾說個球
      2026-04-07 12:00:49
      2026-04-07 22:16:49
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領航智能+時代
      14918文章數(shù) 66754關注度
      往期回顧 全部

      科技要聞

      滿嘴謊言!OpenAI奧特曼黑料大起底

      頭條要聞

      臺灣一些人被指準備"潤" 賴清德曾稱兒子在美"學功夫"

      頭條要聞

      臺灣一些人被指準備"潤" 賴清德曾稱兒子在美"學功夫"

      體育要聞

      官宣簽約“AI球員”,這支球隊被罵慘了...

      娛樂要聞

      女首富陳麗華離世 被曝生前已分好遺產(chǎn)

      財經(jīng)要聞

      10萬億財政轉(zhuǎn)移支付,被誰拿走了?

      汽車要聞

      不止是大 極狐首款MPV問道V9靜態(tài)體驗

      態(tài)度原創(chuàng)

      數(shù)碼
      教育
      親子
      時尚
      軍事航空

      數(shù)碼要聞

      1999元就能買Mini LED電視 海信Vidda小鋼炮S Mini開售

      教育要聞

      地理教材上五種交通運輸方式的比較是不是過時了?

      親子要聞

      科普|科學備孕,需要做好哪些孕前檢查?

      針織衫+闊腿褲=氣質(zhì)穿搭

      軍事要聞

      美軍營救飛行員出動155架飛機

      無障礙瀏覽 進入關懷版