![]()
近日,大模型領域十分熱鬧。
在OpenAI和谷歌先后發(fā)布旗艦大模型產(chǎn)品后,昨天,深度求索 DeepSeek 正式發(fā)布了 V3.2 系列模型,包括標準版「DeepSeek-V3.2」與增強版「DeepSeek-V3.2-Speciale」。其中V3.2模型在公開推理類 Benchmark 中達到了 GPT-5 水平,僅略低于 Gemini-3.0-Pro。
此外,谷歌Gemini被曝出存在安全隱患。韓國 AI 安全團隊在昨天成功對 Google 最新的 Gemini 3 Pro 模型進行越獄,僅用時五分鐘便突破其防護機制。在測試中Gemini 3 提供制造天花病毒的詳細步驟,并在代碼工具中生成了制作沙林毒氣和爆炸物的網(wǎng)頁內(nèi)容,引發(fā)公眾對大模型安全問題的擔憂。
過去一天,國內(nèi)外AI行業(yè)還有更多熱點可以關注,硅基君帶你一起看看。
大模型
1) DeepSeek 發(fā)布兩款新模型,達 GPT-5 水平
昨天,深度求索 DeepSeek 正式發(fā)布了 V3.2 系列模型,包括標準版「DeepSeek-V3.2」與增強版「DeepSeek-V3.2-Speciale」。
DeepSeek-V3.2 的定位是「全能型」模型,目標在于平衡推理能力與輸出長度,適合日常問答與通用 Agent 場景。官方測試顯示,該模型在公開推理類 Benchmark 中達到了 GPT-5 水平,僅略低于 Gemini-3.0-Pro。同時,相比 Kimi-K2-Thinking,V3.2 輸出更為簡潔,大幅降低了計算開銷與用戶等待時間。
DeepSeek-V3.2-Speciale 被稱為「邏輯怪獸」,是標準版的長思考增強版,結(jié)合了 DeepSeek-Math-V2 的定理證明能力。該模型在數(shù)學與編程領域表現(xiàn)突出,成功斬獲 IMO 2025、CMO 2025、ICPC 2025 全球總決賽及 IOI 2025 金牌,其成績已接近甚至超越人類頂尖選手水平。
2)米哈游聯(lián)合創(chuàng)始人蔡浩宇推出「貓貓」互動娛樂 AI 模型
據(jù) 36 氪報道,米哈游聯(lián)合創(chuàng)始人蔡浩宇在美國創(chuàng)立的 AI 公司 Anuttacon 近日上線了一款全新 AI 聊天大模型「AnuNeko」。
該產(chǎn)品以黑貓為默認形象,強調(diào)個性化與互動性,區(qū)別于傳統(tǒng)的工具型 AI,更像是具備情緒與獨立思考的「伙伴」。「AnuNeko」的注冊商標已于 2025 年 9 月 29 日提交美國 USPTO,涵蓋軟件、AI 角色與娛樂等多個領域。用戶可選擇兩種不同風格的虛擬貓角色:回答犀利的「異國短毛貓」Exotic Shorthair 與更溫和的「橘貓」Orange Cat。
3)Google Gemini 3 五分鐘即被「越獄」,安全隱患引發(fā)擔憂
據(jù) Android Authority 報道,韓國 AI 安全團隊在昨天成功對 Google 最新的 Gemini 3 Pro 模型進行越獄,僅用時五分鐘便突破其防護機制。
研究人員來自 Aim Intelligence,他們在測試中要求 Gemini 3 提供制造天花病毒的詳細步驟,模型迅速給出被描述為「可行」的方案。隨后,團隊進一步要求其生成自嘲 PPT,Gemini 3 產(chǎn)出了一份名為「Excused Stupid Gemini 3」的完整幻燈片。
更令人擔憂的是,模型還在代碼工具中生成了制作沙林毒氣和爆炸物的網(wǎng)頁內(nèi)容。首爾經(jīng)濟日報指出,這反映出當前 AI 模型在防護機制上的普遍不足。研究人員強調(diào),Gemini 3 不僅能繞過安全規(guī)則,還能使用「規(guī)避策略」和「隱藏提示」,使傳統(tǒng)防護措施失效。
4)初創(chuàng)公司 Runway 推出 Gen-4.5 視頻模型,性能超越 Google 與 OpenAI
美國人工智能初創(chuàng)公司 Runway 于昨天正式推出新一代視頻生成模型 Gen-4.5。這款產(chǎn)品在獨立基準測試中超越了 Google 與 OpenAI 的同類模型,成為當前行業(yè)領先的視頻生成工具。
Gen-4.5 能夠根據(jù)用戶提供的文字提示生成高清動態(tài)視頻,具備更強的物理規(guī)律理解、人體動作捕捉、鏡頭運動與因果關系處理能力。在獨立 AI 基準測試機構(gòu) Artificial Analysis 的 Video Arena 排行榜中,Gen-4.5 位居第一,Google 的 Veo 3 排名第二,OpenAI 的 Sora 2 Pro 則位列第七。
5)英偉達發(fā)布專注于自動駕駛的視覺語言動作模型Alpamayo-R1
英偉達在NeurIPS 人工智能大會上發(fā)布了 Alpamayo-R1—— 一款面向自動駕駛研究的開源推理型視覺語言模型。該公司稱,這是業(yè)界首個專注于自動駕駛領域的視覺語言動作模型。視覺語言模型能夠同時處理文本與圖像信息,使車輛能夠“看見”周圍環(huán)境,并基于所感知的內(nèi)容做出決策。
該新模型基于英偉達此前推出的 Cosmos-Reason 推理模型構(gòu)建,后者具備在響應前對決策進行邏輯推演的能力。英偉達最初于 2025 年 1 月發(fā)布了 Cosmos 模型系列,并于同年 8 月推出了更多擴展版本。
AI應用
1)豆包手機助手發(fā)布技術預覽版,首款工程機亮相
昨天,豆包宣布其全新手機 AI 助手「豆包手機助手」以技術預覽版的形式正式亮相。據(jù)介紹,這款產(chǎn)品由豆包與手機廠商在操作系統(tǒng)層面合作開發(fā),基于豆包大模型能力與廠商授權,旨在為用戶提供更便捷的交互方式和更豐富的使用體驗。
在演示視頻中,用戶只需點擊手機上的 AI 按鍵即可呼出豆包,實現(xiàn)跨應用執(zhí)行復雜操作,模擬人類點擊、滑動與輸入,實現(xiàn)比價點外賣、自動回復微信等功能。
目前,搭載豆包手機助手技術預覽版的工程樣機 nubia M153 已少量發(fā)售,售價為 3499 元,主要面向開發(fā)者和行業(yè)人士開放體驗。據(jù)悉,字節(jié)跳動與努比亞為這款工程機的首銷備貨量為 3 萬臺。目前,購買頁面顯示「已售罄」,購買需預約等待下次開售。
2)眾擎正式發(fā)布人形機器人T800
12月2日,眾擎機器人宣布,全尺寸極致高效能通用人形機器人眾擎T800正式發(fā)布,產(chǎn)品發(fā)售進程也隨即正式啟動。
據(jù)悉,T800產(chǎn)品定價18萬元起,同步推出的基礎版、生態(tài)版(開源版)、銳化版(Pro版)、旗艦版(Max版)四款梯度化產(chǎn)品矩陣,精準匹配不同場景的差異化能力需求。
投融資情報
1)微軟CEO承諾加碼歐盟AI投資
微軟首席執(zhí)行官于周一表示,微軟正日益將歐洲視為其人工智能戰(zhàn)略布局的核心地區(qū)。薩提亞?納德拉在《高管面對面》播客節(jié)目中稱:“我們正投入資本在德國乃至整個歐盟進行有風險的投資。”他補充道:“這些并非設在美國的人工智能工廠或云計算中心,而是落地于歐洲大陸及歐洲各國本土的實體設施。”
/ 04 /
AI基礎設施
1)Intel 前 CEO「刺破」AI 泡沫:GPU 活不過十年
Intel 前 CEO 帕特 · 基辛格(Pat Gelsinger)近日在接受《金融時報》采訪時表示,量子計算將在未來十年內(nèi)取代 GPU,并可能引爆當前的人工智能泡沫。他強調(diào),量子計算與經(jīng)典計算、人工智能計算共同構(gòu)成 IT 的「三位一體」,其中量子技術正處于快速突破的臨界點。
基辛格指出,量子計算機或?qū)⒃趦赡陜?nèi)走向主流,這與英偉達 CEO 黃仁勛此前提出的「量子計算至少需要二十年才能普及」形成鮮明對比。他認為,當前 AI 市場的狂熱與過往科技泡沫高度相似:估值飆升、投資爆炸,但缺乏明確的盈利路徑。基辛格還將現(xiàn)狀類比為 IBM 與微軟在 1990 年代的關系,認為 OpenAI 與微軟的合作可能導致新的權力格局轉(zhuǎn)移。
PS:如果你對AI大模型領域有獨特的看法,歡迎掃碼加入我們的大模型交流群。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.