去年春節(jié),DeepSeek R1 橫空出世的那個深夜,國內大廠的產品經理們大概都睡不著覺。
這種集體焦慮,最終都變成產品界面上那行顯眼的小字——無論是大廠還是小廠的 App,都在連夜更新的版本里,給自己的 Logo 加上了「DeepSeek 滿血版」的標簽。
就像一個成績平平的學生,突然把隔壁班滿分的試卷復印了一份,貼在自己腦門上說:「看,這也是我寫的。」
但今年,游戲規(guī)則變了。
![]()
DeepSeek 的辦公室周圍,現(xiàn)在布滿了眼線。字節(jié)、阿里、騰訊這些大廠今年學聰明了,一眾模型廠商也摩拳擦掌,都在等春節(jié)假期這個流量高峰,試圖復刻去年那個「DeepSeek 時刻」,哪怕只是復刻一半。
更魔幻的是,這股「春節(jié)必須搞個大新聞」的風,已經從大模型吹到了機器人。去年宇樹在春晚上跳了一支舞,今年直接引爆了一場「機器人春晚爭奪戰(zhàn)」——目前已有 4 家機器人公司官宣登臺,每家砸下 1 個億,只為了那「30 秒的鏡頭」。
![]()
你品這個數(shù)字,4 家公司,4 個億,相當于優(yōu)必選近一年的研發(fā)費用,就為了在除夕夜刷個臉。
DeepSeek 去年無心插柳的「春節(jié)檔奇跡」,今年已經進化成了全行業(yè)的肌肉記憶。
距離春節(jié)還有兩周,但戰(zhàn)爭從這周就開始了。
國內幾大 AI 廠商的發(fā)布節(jié)奏,已經密集到了一種近乎癲狂的程度——每天早上睜開眼,都有新模型、新功能在朋友圈刷屏,仿佛不在這兩周發(fā)點什么,就會被時代拋棄。
騰訊帶著 10 億紅包和元寶派登場,Kimi 發(fā)布了 K2.5,阿里千問發(fā)布最強推理模型,螞蟻、MiniMax 、Vidu 直接來了「一天一爆」,連 DeepSeek 自己都憋不住,悄悄開源了 OCR 2.0。
別說 AI 圈,在整個科技行業(yè)歷史上都鮮見這樣密集的發(fā)布。
這期 Hunt Good 周報,APPSO 希望在信息轟炸中,幫你理清過去一周到底發(fā)生了什么:
春節(jié) AI 大戰(zhàn)全面開打,10 億紅包只是入場券
模型廠商集體進入「發(fā)布周」模式,一天一爆已成常態(tài)
AI 群聊成為新戰(zhàn)場,所有人都想復刻「微信紅包時刻」
4 家機器人公司砸 4 億,只為春晚那幾十秒
本地 Agent 產品從瀏覽器跳進了你的電腦和手機
當所有人都想抓住新的「DeepSeek 時刻」,這場春節(jié) AI 大戰(zhàn)會走向何方,又會留下些什么。
春節(jié) AI 大戰(zhàn),硝煙四起
BAT 是 Battle 開戰(zhàn)的 BAT
2026 年春節(jié), 互聯(lián)網巨頭的「紅包大戰(zhàn)」戰(zhàn)場已從傳統(tǒng)的移動支付與電商,徹底轉向 AI 大模型。 騰訊、字節(jié)跳動與阿里巴巴,已經開始了一場 在 AI 時代,爭奪用戶入口控制權的生死較量。
這周,騰訊元寶宣布將發(fā)放 10 億現(xiàn)金紅包,百度文心推出 5 億春節(jié)紅包活動,而字節(jié)跳動旗下的豆包則拿下了央視春晚獨家互動合作伙伴席位。
阿里則通過更名后的「千問」大舉進軍 C 端市場,沒有拿到總臺春晚,千問就一口氣拿下了江蘇衛(wèi)視、浙江衛(wèi)視、東方衛(wèi)視、河南衛(wèi)視春晚的冠名,再加上 2025 年底的嗶哩嗶哩跨晚,這力度,是一點不比字節(jié)弱。
![]()
![]()
![]()
![]()
![]()
上下滑動查看更多內容
各大廠都不再滿足于單純的對話功能,而是試圖通過高額補貼、生態(tài)聯(lián)動和高強度曝光,要打造下一個國民級 App,創(chuàng)造新的「微信時刻」。
根據(jù)這周五晚點的 AI 大戰(zhàn)全記錄分析報道, BAT 這幾家大廠都追趕的相當緊。
騰訊招攬了前 OpenAI 研究員姚順雨擔任混元大模型一號位,試圖解決模型此前因「刷榜」導致的實戰(zhàn)能力不足問題,同時 重金投入是不可避免, 10 億元現(xiàn)金紅包的元寶,迎戰(zhàn)春節(jié)。
![]()
根 據(jù) AppGrowing 估算, 騰訊元寶在 2025 年全年投流高達 150 億元,其中下半年就砸了約 105 億 | 圖片來源:每日經濟新聞
馬化騰也曾在前幾天的年會上明確表示,希望元寶能重現(xiàn) 11 年前(2015年)微信紅包的盛況。當年微信憑借「搖一搖」實現(xiàn)了支付普及,如今 AI 應用也試圖利用春節(jié)的強社交裂變效應,完成從「小眾」到「大眾」的跨越。
阿里巴巴則確立了「通云哥」(通義、阿里云、平頭哥)三位一體戰(zhàn)略,計劃將未來三年 AI 基建投入提升至 4800 億元,并推動「千問 App」取代夸克成為核心入口,甚至不惜收縮電商邊緣業(yè)務以集中資源。
里面還有一個細節(jié),晚點提到最近這段時間,每到周一早上和周五傍晚,在阿里園區(qū)辦公樓門禁旁,都堆滿了從廣州、北京飛過來封閉開發(fā)千問 App員工的行李箱;而這種情況至少會延續(xù)到春節(jié)。
作為目前最占優(yōu)勢的字節(jié),在去年年底火山引擎大會上,總裁譚待就曾提到 IDC 報告顯示,火山引擎在中國公有云大模型調用總量穩(wěn)居第一,市場份額來到 49.2%,阿里云約 27%。
![]()
圖片來源:網絡
而字節(jié)的 AI 助手「豆包」更是激進,豆包已經在 2025 年底,成為國內首個日活破億的 AI 產品,日均 Token 處理量達 63 萬億。根據(jù) QuestMobile數(shù)據(jù)顯示,豆包月活達 1.72 億,反超 DeepSeek 登頂。
晚點提到, 騰訊副總裁、混元大模型負責人蔣杰甚至立下軍令狀,「要在半年內趕超豆包」。勢不可擋的豆包,又拿下 2026 年央視春晚合作的豆包,還將配合上線互動玩法,吸引更多流量和用戶。
此外,字節(jié)在人才引進上同樣不遺余力,原 Google DeepMind 副總裁吳永輝已加入負責大模型理論研究,試圖補齊底層技術短板。
這些互聯(lián)網大廠,在 AI 領域,已經 從模型層面的較量,從 技術的比拼,進展到了對未來流量分發(fā)權的爭奪。這明顯和過去很長一段時間來,小打小鬧的局部戰(zhàn)爭不同,「BAT 們」 正通過對算力、數(shù)據(jù)和人才的壟斷性投入,讓自己成為 下一個國民級 AI App 的贏家。
機器人版「我要上春晚」
這一周,魔法原子、銀河通用、宇樹科技、松延動力四家公司相繼官宣將登陸央視春晚。
![]()
銀河通用是 總臺 2026 春晚指定具身大模型機器人,宇樹科技是 2026 年春晚機器人合作伙伴,魔法原子是 2026 春晚智能機器人戰(zhàn)略合作伙伴,松延動力則是 2026 年春晚人形機器人合作伙伴。
![]()
這豐富的 Title 已經頗有當年手機市場火爆的感覺了,一個手機可以有系列代言人、品牌代言人、區(qū)域代言人、甚至是某一個功能的代言人,還有各種大使、體驗官……
這或許會是春晚 史上最大規(guī)模的機器人陣容,也會是機器人行業(yè)歷史上最昂貴的一次集體炫技。
![]()
根據(jù)《財經雜志》的最新消息,除了已經公布的四家機器人, 今年還會有一家機器人公司登陸春晚,暫時還無法確認是誰。而 在這些喜慶的官宣海報背后,是高達 1 億元人民幣一張的入場券,為了這「幾十秒」的鏡頭,四家公司合計砸下了 4 億元。
作為對比,國產 人形機器人第一股,優(yōu)必選在 2025 年上半年的研發(fā)投入僅為 2.18 億元。
![]()
![]()
優(yōu)必選中期報告
https://www.hkexnews.hk/listedco/listconews/sehk/2025/0912/2025091200471_c.pdf
春晚這個大型流量池,已經變成了國產 機器人發(fā)展史上,一個瘋狂而迷幻的注腳。
模型齊發(fā),Kimi 跟緊 DeepSeek 步伐
Kimi K2.5 上線,多個榜單勇奪全球開源第一
月之暗面(Moonshot AI)這周二正式發(fā)布并開源了其最新一代模型 Kimi k2.5。
Kimi k2.5 是一個基于 1.5T(萬億)混合視覺與文本 Token 預訓練的原生多模態(tài)模型,在此底座之上,Kimi 團隊還構建了一套名為 Visual Agentic Intelligence(視覺智能體智能)的系統(tǒng),有能力解決超長且復雜的任務處理難題。
該模型最大的技術突破在于引入了 Agent Swarm(智能體集群)架構。在面對復雜需求時,Kimi k2.5 不再單兵作戰(zhàn),而是能瞬間動態(tài)創(chuàng)建并指揮多達 100 個智能體(如AI搜索員、AI物理學家等)并行工作。
![]()
技術文檔顯示,該模型支持高達 1500 次并行工具調用,相比傳統(tǒng)串行模式,Swarm 架構將端到端任務的執(zhí)行時間減少了 80%,整體效率提升了 4.5 倍。
![]()
視覺與編程能力方面,Kimi k2.5 不僅支持 Visual Coding(視覺編程),還能進行 Visual Debugging(視覺調試)。在權威的 SWE-Bench Verified 測試中,Kimi k2.5 拿下了 76.8 的高分,在多項指標上超越了同為開源頂流的 DeepSeek V3,甚至擊敗了部分閉源的 GPT 和 Gemini 模型。
而在大模型競技場上,Kimi K2.5 的表現(xiàn)更是突出,編程,全球開源第一,僅次于 Claude 和 Gemini 的模型。視覺,同樣全球開源第一,僅次于Gemini 和 GPT 模型。
![]()
![]()
向左滑動查看更多內容
目前,該模型已在 Hugging Face 開源,Agent Swarm 模式也已在 Kimi.com 上線。
上手實測:
DeepSeek OCR 2 發(fā)布,V4 或許就在春節(jié)前一周
同樣是周二,在 Kimi K2.5 發(fā)布之前,DeepSeek 默默地在 HuggingFace 和 GitHub 上,開源新模型 OCR 2,并附上了完整的論文。
![]()
和初代 OCR 主打視覺壓縮不同,這次的模型,主要是為了改進視覺-語言模型(VLMs)中視覺編碼方式。模型核心創(chuàng)新在于引入了 DeepEncoder V2,它能模擬人類的視覺因果推理能力,解決傳統(tǒng)模型在處理復雜文檔布局時的局限性。
傳統(tǒng)的 VLMs 通常按固定的光柵掃描順序(從左上到右下)處理圖像,這種僵化的方式不符合我們的視覺感知,人類是基于內容的靈活掃描,而且在處理復雜布局,如表格、公式、多欄文本時會引入錯誤的信息。
而 OCR 2,就是利用新型編碼器 DeepEncoder V2,給了模型「視覺因果流 Visual Causal Flow」的能力,讓模型能夠根據(jù)圖像內容,動態(tài)地重新排序視覺 Token。
![]()
論文最后,DeepSeek 團隊也提到,由于 Token 數(shù)量上限較低(1120),在處理文本極其密集的報紙類文檔時,表現(xiàn)略遜于預期;此外,報紙類的訓練數(shù)據(jù)也相對不足。
而未來方向集中在真正的 2D 推理,即通過兩個 1D 因果推理器(編碼器+解碼器)的級聯(lián),探索實現(xiàn)真正的 2D 圖像理解;以及原生多模。
原生多模態(tài)的 LLM 式編碼器架構,將有潛力發(fā)展為統(tǒng)一的全模態(tài)編碼器(處理圖像、音頻、文本),只需配置特定模態(tài)的查詢 Token 即可。
Qwen3-Max-Thinking, 阿里發(fā)布千問旗艦推理模型
周一, 阿里通義千問團隊正式推出其最新的旗艦推理模型 Qwen3-Max-Thinking。
模型通過擴大參數(shù)規(guī)模并利用大規(guī)模計算資源進行強化學習,在事實知識、復雜推理、指令遵循,以及人類偏好對齊等多個維度實現(xiàn)了顯著突破。在 19 項主流基準測試中,表現(xiàn)媲美 GPT-5.2-Thinking、Claude-Opus-4.5 以及 Gemini 3 Pro 等行業(yè)頂尖模型。
![]()
除了硬核的推理能力,新模型在交互體驗和開發(fā)者生態(tài)上也做了部分升級。Qwen3-Max-Thinking 具備自適應工具使用能力,無需用戶手動干預,即可自主調用搜索、記憶和代碼解釋器來解決問題。
https://qwen.ai/blog?id=qwen3-max-thinking
社交群聊,「微信時刻」花落誰家
騰訊元寶派上線,春節(jié)派十億現(xiàn)金
周一,騰訊旗下 AI 助手「元寶」正式開啟了全新社交 AI 玩法——「元寶派」的內測。
與主流單一交互的對話機器人(Chatbot)不同,「元寶派」被定義為一個能讓 AI 陪一群人玩的「社交空間」。在這個空間里,元寶將成為具備社交屬性的「派友」。
它不僅能參與聊天、調節(jié)氛圍,還能擔任「監(jiān)督員」角色,協(xié)助用戶發(fā)起健身、閱讀等興趣打卡,甚至執(zhí)行復雜的互動任務。
![]()
基于混元大模型,「元寶派」支持 @ 元寶 進行追問、識別總結文件或圖片、公眾號文章信息,甚至還能讓它設置待辦事項、提醒及定時打卡,以及一鍵總結群內聊天信息。
同時,元寶派內置類似「騰訊會議」的屏幕共享功能,支持音視頻連麥與課件演示,用戶還可私聊討論,經 APPSO 實測,也支持打王者榮耀。
元寶派也是騰訊試圖通過建立 AI 與用戶共存的群組空間,復刻當年微信紅包的社交裂變奇跡,以此彌補騰訊在 AI 社交關系鏈上的短板,畢竟現(xiàn)在還是豆包占據(jù)了 AI 應用的 Top 1。
百度文心 AI 群聊擴大內測范圍,多個智能體「不請自來」
百度文心 APP 在周二,全面擴大了其 AI 群聊功能的內測范圍。該功能最早于 1 月 16 日首發(fā),是國內首個支持群聊的 AI 平臺。
和近期騰訊推出的「元寶派」等競品不同,文心 APP 的群聊功能不再局限于傳統(tǒng)的「單聊搬運」,而是主打「主動交互」與「多智能體協(xié)同」的全新體驗。
![]()
文心 APP 群聊最大的創(chuàng)新在于打破了 AI 必須被「@」才會響應的被動模式。系統(tǒng)能夠根據(jù)群聊上下文,在用戶討論旅游攻略、查詢天氣或尋找美食時,自動識別需求并「主動冒泡」提供建議。
這種設計主要是模擬真實的人類交互邏輯,讓 AI 在需要時自動介入,而非僅作為被動調用的工具。此外,進群的每位用戶都會默認配有一個「文心助手」,作為用戶的數(shù)字分身參與協(xié)作。
OpenAI 秘密研發(fā)社交網絡,打造「全真人」平臺對抗 AI 機器人
AI 社交群聊這塊餅誰都想吃下,ChatGPT 在前段時間也推出了群聊功能,不過一直都不溫不火,少有用戶反饋該功能存在的出彩點。
據(jù) Forbes 周四報道,OpenAI 目前又打算開發(fā)一個自有社交網絡,主要是為了解決長期困擾社交媒體,就其實 X 的機器人泛濫與有害內容等問題。
該項目的核心愿景是打造一個「僅限真人」的平臺,目前由一個不足 10 人的精簡團隊負責開發(fā)。
![]()
為了確保所有賬戶背后都是真實的人類,OpenAI考慮引入嚴格的生物識別驗證機制。據(jù)知情人士透露,團隊探討的方案包括要求用戶通過 Apple 的 Face ID,或 World Orb 進行證明。
World Orb 是由 OpenAI CEO Sam Altman 創(chuàng)立,并擔任董事長的 Tools for Humanity 公司,開發(fā)的一種虹膜掃描儀,能夠生成唯一且可驗證的 ID。這種真正的生物識別驗證,將使該平臺區(qū)別于僅依賴電話、郵件或行為信號進行驗證的 Facebook 和 LinkedIn。
![]()
虹膜掃描儀器
這件事頗具有諷刺意味的是,作為 AI 浪潮的推手,OpenAI 現(xiàn)在的目標卻是通過極其嚴格的生物識別手段(甚至可能需要掃描你的虹膜),來建立一個沒有 AI 機器人干擾的「人類凈土」。
www.forbes.com/sites/annatong/2026/01/28/openai-wants-to-create-biometric-social-network-to-kill-xs-bot-problem/
發(fā)布周,AI 產品比時裝周的大牌還要密
發(fā)布周這個概念是怎么來到 AI 圈的,大概還是 2024 年底,奧特曼宣布一連 12 天的產品發(fā)布周,后面 DeepSeek 也開啟了開源周,開源了多個強大的軟件庫。
AI 大戰(zhàn)確實太火,一個兩小時的發(fā)布會不夠打,一周才是王道。
而就在剛剛過去的這周,一連發(fā)布新模型、新產品的國產 AI 平臺,也暗暗較上了勁,讓本就密集的發(fā)布周,變得更「瘋狂」。
Vidu 全球創(chuàng)想周,多款核心功能上新
周一,Vidu 正式開啟全球創(chuàng)想周,一連五天,Vidu 更新了主體社區(qū)、Q2 參考生 Pro、Vidu Q3,以及 Vidu Agent 1.0 等多款模型和工具。
![]()
周二,Vidu Q2 參考生 Pro 模型上線, 能直接復刻不同視頻效果,實現(xiàn)視頻的精細化編輯。
周三,Vidu Agent 1.0 全球上線, 自動化的工作流,讓 AI 生視頻工具開箱即用,實現(xiàn)一鍵成片。全新升級后的 Agent 功能,還支持上傳背景音樂、刪減旁白、Storyboard 編輯,內置多語言,多音色,多模特,多場景的海量素材庫等。
周四,主體社區(qū)上線, 標準化 + 可組合的方式, 把運鏡、特效、氛圍、表演、構圖、敘事、風格、場景、招式等等,這八大類型打包成「主體庫」,我們只需要在輸入框里 @ 一下,就能調用成片。
周五,Vidu Q3 發(fā)布,這是 全球第一個支持 16s 音視頻直出的模型,主打為漫劇、短劇、影視劇創(chuàng)作而生。
以前這些視頻模型,隨便挑一個放出來都是王炸,現(xiàn)在都是直接一連五天,一口氣端上來。
MiniMax ,全新音樂和 AI 陪伴模型
MiniMax 在去年六月也曾來過一次技術發(fā)布周,為期五天,從推理基座大模型 M1,到視頻和音頻生成模型,以及 Agent 產品,算是承包了一周的熱點。
這周,MiniMax 帶來了 MiniMax M2-Her 角色扮演模型,和 MiniMax Music 2.5 AI 音樂生成模型。
音樂生成方面, 此次更新主打「段落級強控制」與「物理級高保真」兩大核心能力,試圖解決 AI 音樂長期以來面臨的意圖表達不準,和質感塑料味重的問題。
根據(jù)官方更新博客介紹, Music 2.5 最大的亮點在于把創(chuàng)作的選擇權,交回了用戶手中。模型開放了全段落標簽控制,支持包括 Intro(前奏)、Bridge(橋段)、Hook(副歌)等在內的 14 種結構變體。
![]()
而在角色扮演方面,M2-her 是 基于 MiniMax 團隊在 Talkie 和星野(Xingye)產品中,長達三年的觀察與數(shù)據(jù)積累,設計出的模型。
M2-her 試圖解決通用大模型在長程情感交互中,容易出現(xiàn)的邏輯斷裂、風格平庸以及無法深度共情等問題,構建一個真正可用于生產環(huán)境的高質量 Role-Play Agent。
https://www.minimaxi.com/
可靈,上個月剛結束靈感周,馬上又開啟超前內測
去年 12 月初,可靈就開了「全能靈感周」,一連五天發(fā)布了圖片和視頻多款生成模型,以及主體庫、對比模版等功能。
![]()
上下滑動查看更多內容
周六(31 號),可靈又開啟了新一波的「超前內測」,快手正式宣布推出新一代視頻生成模型可靈 3.0 系列。此次更新幅度同樣巨大,一口氣帶來了圖片 3.0、視頻 3.0 以及視頻 3.0 Omni 三個版本。
![]()
根據(jù)快手可靈的官方更新公告, 圖片 3.0 模型主要在畫質和邏輯上有了大幅度更新。新的圖片模型,不僅支持輸出 2K 和 4K 級別的高清圖,適配影視預演等專業(yè)需求,還引入了視覺思維鏈(vCoT)技術。
![]()
簡單來說,模型在動筆畫圖之前,會先進行「隱式思考」,對提示詞中的抽象隱喻、因果關系和常識進行邏輯推演。
視頻生成方面,新的模型采用了統(tǒng)一的多模態(tài)訓練框架。最大的亮點是單次視頻生成時長拉到了 15 秒,并支持 3-15 秒的靈活設置。
功能上,新增的「智能分鏡系統(tǒng)」也能聽懂文本指令,自動調度景別和機位;音畫同步能力也得到加強等多個亮點功能。
https://app.klingai.com/cn/
Manus 們從瀏覽器的標簽頁,跳進了手機和電腦里
Clawdbot,火山引擎、阿里云、騰訊云上線
Clawdbot,曾用名 Moltbot,現(xiàn)用名 OpenClaw,這款歷經兩次改名的產品,在這周刷屏國內外社交媒體。
![]()
沒錯,它又改名字了
憑借 Clawdbot 24h 不間斷的 AI 助手服務,能夠直接打通我們手機上的大部分聊天軟件。像是自動處理發(fā)郵件、回信息、在不同應用之間切換,以及 AI 能做的它都能做等豐富的功能,它都能做到。
這些全方位覆蓋的 AI 智能體,精準切中了網友對 AI 助手的期待,引發(fā)大量部署熱潮,甚至還附帶了 Mac mini 的爆火。
無論是微信還是小紅書,搭建教程的分享隨便一搜,搜索結果一頁都放不下。而國內大廠阿里、騰訊、字節(jié)也紛紛跟進,在自己的阿里云/火山引擎/騰訊云,提供了一鍵部署功能。
![]()
![]()
![]()
阿里云還貼心的提供了和釘釘?shù)倪B接,我們能直接創(chuàng)建一個釘釘機器人,而不需要額外連接到 iMessage 或者其他即時通訊軟件。字節(jié)的火山引擎,也提供了集成飛書應用的功能。 騰訊這邊,雖然網友們想要它能接上微信,但很明顯是不可能。
Clawdbot 的特點是能讓我們在常用的聊天軟件里,像和自己的同事對話一樣,直接吩咐他完成各種任務,通過網關配置,Clawdbot 能接入大部分音視頻娛樂、生產力工具、日常工具如日歷、時鐘、天氣等,直接調用這些工具來實現(xiàn)我們的需求。
![]()
最近還有網友拿它來 24h 監(jiān)控股市炒股,也有網友在手機上就能 vibe coding,創(chuàng)作自己的 App 并且上架到 App Store。
MiniMax Agent 桌面版,中國版 Cowork 上線
本地 Agent 產品是今年的主流,看起來已經是不爭的事實。無論是最近大火特火的 Clawdbot,還是月初發(fā)布的 Claude Cowork,它們的核心都是從瀏覽器的一個標簽頁里面跳出來,在我們手機和電腦里,真正地開始干活。
![]()
Cowork 的爆火應該也沒有人能想到,它只是簡單的把 Claude Code 封裝成了一個有可視化界面的應用。而且,編寫 Cowork 的所有代碼,都是由 AI 完成,就這樣一個看起來本來是「普普通通」的項目,卻收獲了大量關注。
MiniMax 在最近還上線了 MiniMax Agent 桌面端和專家 Agent 功能。在 Mac/Windows 電腦,我們可以選擇本地工作文件夾,讓 MiniMax Agent讀取、分析和批量處理文件,或者描述任務讓 Agent 在瀏覽器中進行自動處理,像完成點擊和提交等操作。
![]()
專家功能就像前段時間大家都在學的 Skills 一樣,它能把這些重復性的任務,保存為可復用的配置,并創(chuàng)建為「專家」,里面包括自定義指令、模型和子智能體等。
根據(jù) MiniMax 官方給出的使用場景, 能夠直接進入用戶本地環(huán)境 Agent,幫助電商運營人員,在面對 500 張商品圖片的分類工作時,通過圖像識別自動完成分類、重命名與歸檔。
在留學申請場景中,Agent 還能整合多種格式的文件內容(如PDF、Word、圖片),生成符合申請要求的個性化文書。
https://agent.minimaxi.com/
? 阿里 QoderWork,也是接管電腦上的本地工作
這周五, 阿里也正式推出了首個桌面 Agent 工具「QoderWork」并開啟邀測。
![]()
Qoderwork 同樣也被稱為是「國產版 Claude Cowork」,主打零門檻和無需部署。在獲得對應文件權限后,用戶只需要通過自然語言指令,就可讓 AI 直接調用已授權的本地應用,完成從文件整理到內容創(chuàng)作的復雜任務。
目前 Mac 用戶可搶先體驗,Windows 版本也將很快上線。
這些本地 Agent 產品, 與過去一年,市面上大多數(shù)依賴云端處理的 Agent,像是 Manus、Kimi OK Computer 不同,它們的核心優(yōu)勢都在于「本地化執(zhí)行」與「自主規(guī)劃」。
Qoderwork 也內置了強大的模型上下文協(xié)議(MCP),以及支持自定義Skills,將任務環(huán)境直接部署在終端設備上等。
https://www.qoder.com/qoderwork
階躍 AI 桌面伙伴,操作系統(tǒng)級的 Agent
最近,階躍也推出了 AI 桌面助手,同樣是在 Claude Cowork 爆火的一周之后。
![]()
升級后的「階躍 AI 桌面伙伴」也是能直接處理我們電腦本地的文件,以及其他系統(tǒng)級工作。
通過 MCP(模型上下文協(xié)議)方式,階躍 AI 桌面伙伴也打通了包括 Excel、QQ 郵箱、飛書、釘釘、Notion、高德在內的 16 款常用桌面工具,我們也可以自行添加更多工具。
![]()
此外,Mac 版本上線了「全局記憶」功能,AI 還能在本地記錄、理解并回溯我們的操作行為,生成工作日報或復盤總結,且所有數(shù)據(jù)均存儲在用戶本地設備上,以確保隱私安全。
![]()
Skills 功能也是必不可少,在階躍 AI 桌面助手里面,是直接引入了 社區(qū)化的「妙計廣場」。用戶可以直接分享自己調試好的 Prompt(提示詞)等,供其他用戶復用。
https://www.stepfun.com/download
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.