![]()
12月17日,階躍星辰升級發(fā)布了全新的 AI Agent 系列模型「Step-GUI」,包括云端模型 Step-GUI、首個面向 GUI Agent 的 MCP 協(xié)議,以及業(yè)內(nèi)首個支持手機部署的開源端側(cè)模型 Step-GUI Edge。
12 月 17 日,騰訊升級大模型研發(fā)架構(gòu),新成立 AI Infra 部、AI Data 部、數(shù)據(jù)計算平臺部,全面強化其大模型的研發(fā)體系與核心能力。
知名AI 研究員姚順雨 (Vinces Yao) 正式出任「CEO / 總裁辦公室」首席 AI 科學家,向騰訊總裁劉熾平匯報;同時兼任 AI Infra 部、大語言模型部負責人,向技術(shù)工程事業(yè)群總裁盧山匯報。
過去一天,國內(nèi)外AI行業(yè)還有更多熱點可以關(guān)注,烏鴉君帶你一起看看。
大模型
1)階躍星辰發(fā)布全新 AI Agent 系列模型「Step-GUI」
2月17日,階躍星辰升級發(fā)布了全新的 AI Agent 系列模型「Step-GUI」,包括云端模型 Step-GUI、首個面向 GUI Agent 的 MCP 協(xié)議,以及業(yè)內(nèi)首個支持手機部署的開源端側(cè)模型 Step-GUI Edge。
「Step-GUI」通過端云協(xié)同的方案,讓隱私邊界可知、可控,同時極大程度拓展 GUI Agent 能力邊界,目前已經(jīng)可以在淘寶、微博、抖音、小紅書、閑魚等超過 200 個 APP 場景中執(zhí)行任務(wù)。個人開發(fā)者、硬件廠商均可通過這套方案,在終端打造具備強大視覺理解能力,并能基于指令為用戶執(zhí)行任務(wù)的 Agent 助手,最快 10 分鐘即可部署上線。
上個月底,階躍星辰率先開源了GUI Agent 模型 Step-GUI Edge,緊隨其后字節(jié)發(fā)布豆包手機助手技術(shù)預覽版,智譜跟進開源 AutoGLM 模型。行業(yè)內(nèi)人士認為,GUI 底層模型技術(shù)的爆發(fā)將加速終端設(shè)備的 Agent 化趨勢,2026 年或?qū)⒊蔀橹厮芙K端入口體驗及市場格局的關(guān)鍵窗口期。
2)騰訊升級大模型研發(fā)架構(gòu),成立多個新部門
12 月 17 日,騰訊升級大模型研發(fā)架構(gòu),新成立 AI Infra 部、AI Data 部、數(shù)據(jù)計算平臺部,全面強化其大模型的研發(fā)體系與核心能力。
騰訊表示,知名AI 研究員姚順雨 (Vinces Yao) 正式出任「CEO / 總裁辦公室」首席 AI 科學家,向騰訊總裁劉熾平匯報;同時兼任 AI Infra 部、大語言模型部負責人,向技術(shù)工程事業(yè)群總裁盧山匯報。
調(diào)整后,AI Infra 部將負責大模型訓練和推理平臺技術(shù)能力建設(shè),聚焦大模型分布式訓練、高性能推理服務(wù)等核心技術(shù)能力,為大模型算法研發(fā)和業(yè)務(wù)場景落地提供穩(wěn)定高效的技術(shù)支持和服務(wù)。
而AI Data 部、數(shù)據(jù)計算平臺部,將分別負責大模型數(shù)據(jù)及評測體系建設(shè)、大數(shù)據(jù)和機器學習的數(shù)據(jù)智能融合平臺建設(shè)工作。
3)騰訊混元發(fā)布國內(nèi)首個開放體驗的實時世界模型
12 月 17 日,騰訊混元發(fā)布世界模型 1.5(Tencent HY WorldPlay)。
據(jù)悉,混元世界模型1.5 是國內(nèi)首個開放體驗的實時世界模型,用戶輸入文字描述或者圖片即可創(chuàng)建專屬的互動世界。
同時,混元世界模型1.5(WorldPlay) 首次開源了業(yè)界最系統(tǒng)、最全面的實時世界模型框架,涵蓋數(shù)據(jù)、訓練、流式推理部署等全鏈路、全環(huán)節(jié),并提出了重構(gòu)記憶力、長上下文蒸餾、基于 3D 的自回歸擴散模型強化學習等算法模塊。
4)Gemini 3 Flash 正式上線
今天凌晨,Gemini 3 Flash 正式發(fā)布,直接對標 OpenAI 和 Anthropic 的旗艦模型,官方號稱比 2.5 Pro 速度快 3 倍,價格砍到 3 Pro 的四分之一,性能還不降反升。
從今天開始,用戶可以在Gemini 產(chǎn)品線中體驗到 Gemini 3 Flash(Fast/Thinking)和 Gemini 3 Pro。基準測試結(jié)果顯示,Gemini 3 Flash 保留了 Pro 級別的推理能力,但延遲、成本直接降到 Flash 級別。
具體來說,在GPQA Diamond 這種博士級推理測試里,它能拿到 90.4% 的成績,跟那些體積更大的前沿模型打得有來有回。而 MMMU Pro 測試 Gemini 3 Flash 直接拿下 81.2%,達到業(yè)界最先進水平,跟自家的 3 Pro 表現(xiàn)相當。
AI應(yīng)用
1)谷歌的Vibe編碼工具Opal登陸Gemini
谷歌的Vibe編程工具Opal即將登陸Gemini平臺。該公司周三宣布,將這款允許用戶構(gòu)建AI驅(qū)動的迷你應(yīng)用的工具集成到Gemini網(wǎng)頁應(yīng)用中,使用戶能夠創(chuàng)建自己的自定義應(yīng)用,谷歌稱之為“Gems”。
Gems是Gemini的定制版本,于2024年推出,專為特定任務(wù)或場景而設(shè)計。例如,谷歌預制的一些Gems包括學習教練、頭腦風暴助手、職業(yè)指導、編碼伙伴和編輯。
投融資情報
1)曝亞馬遜正與 OpenAI 談百億投資,后者還有意采購 AI 芯片
據(jù)The Information 報道,亞馬遜與 OpenAI 進行融資談判,前者計劃為后者投資至少 100 億美元。據(jù)悉,此輪融資對 OpenAI 的估值將超過 5000 億美元。
據(jù)悉,OpenAI 上個月曾宣布,將在未來七年通過亞馬遜網(wǎng)絡(luò)服務(wù)(AWS),租用價值 380 億美元的服務(wù)器。據(jù)報道,OpenAI 目前至少使用包括 AWS 在內(nèi)的五家云服務(wù)提供商來訓練和運行其 AI 模型。
而本次亞馬遜的投資,則有望幫助OpenAI 承擔其此前許下的「七年租用服務(wù)器」承諾。
值得一提的是,本次談判還將幫助亞馬遜售出自研的Trainium AI 服務(wù)器芯片給 OpenAI。知情人士透露,作為討論交易的一部分,OpenAI 將計劃使用 Trainium 芯片。
2)AI 六小龍搶跑 IPO
據(jù)騰訊新聞《一線》獲悉,「AI 六小龍」MiniMax 和智譜 AI,均于本周初獲得了中國證監(jiān)會備案,并參與了港交所的上市聆訊。
報道稱,MiniMax 于 12 月 17 日通過了港交所聆訊。針對智譜 AI 的聆訊事宜,市場也有傳聞稱其于 12 月 16 日在港參與并通過了聆訊,多位相關(guān)人士處證實了該消息。
除此之外,MiniMax 計劃于 2026 年 1 月在港掛牌上市,因為下周開始(即 12 月 20 日),香港開始進入圣誕節(jié)假期。暫未知智譜后續(xù)的上市安排。
公開資料顯示,MiniMax 的保薦人為瑞銀等多家投行,智譜 AI 的保薦人則為中金等多家投行。據(jù)悉,MiniMax 曾于今年 6 月在港通過秘交申請上市,是首個在港提交 IPO 的國內(nèi) AI 大模型公司。
報道指出,這兩家公司可能是內(nèi)地企業(yè)赴港上市「報備制」以來,在港過聆訊最快的案例。
PS:如果你對AI大模型領(lǐng)域有獨特的看法,歡迎掃碼加入我們的大模型交流群。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.