硅基日報：DeepSeek發(fā)布兩款新模型；Gemini 3被曝存在安全隱患

2025-12-02 19:47:03　來源: 硅基觀察Pro

北京舉報

分享至

近日，大模型領域十分熱鬧。

在OpenAI和谷歌先后發(fā)布旗艦大模型產(chǎn)品后，昨天，深度求索 DeepSeek 正式發(fā)布了 V3.2 系列模型，包括標準版「DeepSeek-V3.2」與增強版「DeepSeek-V3.2-Speciale」。其中V3.2模型在公開推理類 Benchmark 中達到了 GPT-5 水平，僅略低于 Gemini-3.0-Pro。

此外，谷歌Gemini被曝出存在安全隱患。韓國 AI 安全團隊在昨天成功對 Google 最新的 Gemini 3 Pro 模型進行越獄，僅用時五分鐘便突破其防護機制。在測試中Gemini 3 提供制造天花病毒的詳細步驟，并在代碼工具中生成了制作沙林毒氣和爆炸物的網(wǎng)頁內(nèi)容，引發(fā)公眾對大模型安全問題的擔憂。

過去一天，國內(nèi)外AI行業(yè)還有更多熱點可以關注，硅基君帶你一起看看。

大模型

1） DeepSeek 發(fā)布兩款新模型，達 GPT-5 水平

昨天，深度求索 DeepSeek 正式發(fā)布了 V3.2 系列模型，包括標準版「DeepSeek-V3.2」與增強版「DeepSeek-V3.2-Speciale」。

DeepSeek-V3.2 的定位是「全能型」模型，目標在于平衡推理能力與輸出長度，適合日常問答與通用 Agent 場景。官方測試顯示，該模型在公開推理類 Benchmark 中達到了 GPT-5 水平，僅略低于 Gemini-3.0-Pro。同時，相比 Kimi-K2-Thinking，V3.2 輸出更為簡潔，大幅降低了計算開銷與用戶等待時間。

DeepSeek-V3.2-Speciale 被稱為「邏輯怪獸」，是標準版的長思考增強版，結(jié)合了 DeepSeek-Math-V2 的定理證明能力。該模型在數(shù)學與編程領域表現(xiàn)突出，成功斬獲 IMO 2025、CMO 2025、ICPC 2025 全球總決賽及 IOI 2025 金牌，其成績已接近甚至超越人類頂尖選手水平。

2）米哈游聯(lián)合創(chuàng)始人蔡浩宇推出「貓貓」互動娛樂 AI 模型

據(jù) 36 氪報道，米哈游聯(lián)合創(chuàng)始人蔡浩宇在美國創(chuàng)立的 AI 公司 Anuttacon 近日上線了一款全新 AI 聊天大模型「AnuNeko」。

該產(chǎn)品以黑貓為默認形象，強調(diào)個性化與互動性，區(qū)別于傳統(tǒng)的工具型 AI，更像是具備情緒與獨立思考的「伙伴」。「AnuNeko」的注冊商標已于 2025 年 9 月 29 日提交美國 USPTO，涵蓋軟件、AI 角色與娛樂等多個領域。用戶可選擇兩種不同風格的虛擬貓角色：回答犀利的「異國短毛貓」Exotic Shorthair 與更溫和的「橘貓」Orange Cat。

3）Google Gemini 3 五分鐘即被「越獄」，安全隱患引發(fā)擔憂

據(jù) Android Authority 報道，韓國 AI 安全團隊在昨天成功對 Google 最新的 Gemini 3 Pro 模型進行越獄，僅用時五分鐘便突破其防護機制。

研究人員來自 Aim Intelligence，他們在測試中要求 Gemini 3 提供制造天花病毒的詳細步驟，模型迅速給出被描述為「可行」的方案。隨后，團隊進一步要求其生成自嘲 PPT，Gemini 3 產(chǎn)出了一份名為「Excused Stupid Gemini 3」的完整幻燈片。

更令人擔憂的是，模型還在代碼工具中生成了制作沙林毒氣和爆炸物的網(wǎng)頁內(nèi)容。首爾經(jīng)濟日報指出，這反映出當前 AI 模型在防護機制上的普遍不足。研究人員強調(diào)，Gemini 3 不僅能繞過安全規(guī)則，還能使用「規(guī)避策略」和「隱藏提示」，使傳統(tǒng)防護措施失效。

4）初創(chuàng)公司 Runway 推出 Gen-4.5 視頻模型，性能超越 Google 與 OpenAI

美國人工智能初創(chuàng)公司 Runway 于昨天正式推出新一代視頻生成模型 Gen-4.5。這款產(chǎn)品在獨立基準測試中超越了 Google 與 OpenAI 的同類模型，成為當前行業(yè)領先的視頻生成工具。

Gen-4.5 能夠根據(jù)用戶提供的文字提示生成高清動態(tài)視頻，具備更強的物理規(guī)律理解、人體動作捕捉、鏡頭運動與因果關系處理能力。在獨立 AI 基準測試機構(gòu) Artificial Analysis 的 Video Arena 排行榜中，Gen-4.5 位居第一，Google 的 Veo 3 排名第二，OpenAI 的 Sora 2 Pro 則位列第七。

5）英偉達發(fā)布專注于自動駕駛的視覺語言動作模型Alpamayo-R1

英偉達在NeurIPS 人工智能大會上發(fā)布了 Alpamayo-R1—— 一款面向自動駕駛研究的開源推理型視覺語言模型。該公司稱，這是業(yè)界首個專注于自動駕駛領域的視覺語言動作模型。視覺語言模型能夠同時處理文本與圖像信息，使車輛能夠“看見”周圍環(huán)境，并基于所感知的內(nèi)容做出決策。

該新模型基于英偉達此前推出的 Cosmos-Reason 推理模型構(gòu)建，后者具備在響應前對決策進行邏輯推演的能力。英偉達最初于 2025 年 1 月發(fā)布了 Cosmos 模型系列，并于同年 8 月推出了更多擴展版本。

AI應用

1）豆包手機助手發(fā)布技術預覽版，首款工程機亮相

昨天，豆包宣布其全新手機 AI 助手「豆包手機助手」以技術預覽版的形式正式亮相。據(jù)介紹，這款產(chǎn)品由豆包與手機廠商在操作系統(tǒng)層面合作開發(fā)，基于豆包大模型能力與廠商授權，旨在為用戶提供更便捷的交互方式和更豐富的使用體驗。

在演示視頻中，用戶只需點擊手機上的 AI 按鍵即可呼出豆包，實現(xiàn)跨應用執(zhí)行復雜操作，模擬人類點擊、滑動與輸入，實現(xiàn)比價點外賣、自動回復微信等功能。

目前，搭載豆包手機助手技術預覽版的工程樣機 nubia M153 已少量發(fā)售，售價為 3499 元，主要面向開發(fā)者和行業(yè)人士開放體驗。據(jù)悉，字節(jié)跳動與努比亞為這款工程機的首銷備貨量為 3 萬臺。目前，購買頁面顯示「已售罄」，購買需預約等待下次開售。

2）眾擎正式發(fā)布人形機器人T800

12月2日，眾擎機器人宣布，全尺寸極致高效能通用人形機器人眾擎T800正式發(fā)布，產(chǎn)品發(fā)售進程也隨即正式啟動。

據(jù)悉，T800產(chǎn)品定價18萬元起，同步推出的基礎版、生態(tài)版（開源版）、銳化版（Pro版）、旗艦版（Max版）四款梯度化產(chǎn)品矩陣，精準匹配不同場景的差異化能力需求。

投融資情報

1）微軟CEO承諾加碼歐盟AI投資

微軟首席執(zhí)行官于周一表示，微軟正日益將歐洲視為其人工智能戰(zhàn)略布局的核心地區(qū)。薩提亞?納德拉在《高管面對面》播客節(jié)目中稱：“我們正投入資本在德國乃至整個歐盟進行有風險的投資。”他補充道：“這些并非設在美國的人工智能工廠或云計算中心，而是落地于歐洲大陸及歐洲各國本土的實體設施。”

/ 04 /

AI基礎設施

1）Intel 前 CEO「刺破」AI 泡沫：GPU 活不過十年

Intel 前 CEO 帕特 · 基辛格（Pat Gelsinger）近日在接受《金融時報》采訪時表示，量子計算將在未來十年內(nèi)取代 GPU，并可能引爆當前的人工智能泡沫。他強調(diào)，量子計算與經(jīng)典計算、人工智能計算共同構(gòu)成 IT 的「三位一體」，其中量子技術正處于快速突破的臨界點。

基辛格指出，量子計算機或?qū)⒃趦赡陜?nèi)走向主流，這與英偉達 CEO 黃仁勛此前提出的「量子計算至少需要二十年才能普及」形成鮮明對比。他認為，當前 AI 市場的狂熱與過往科技泡沫高度相似：估值飆升、投資爆炸，但缺乏明確的盈利路徑。基辛格還將現(xiàn)狀類比為 IBM 與微軟在 1990 年代的關系，認為 OpenAI 與微軟的合作可能導致新的權力格局轉(zhuǎn)移。

PS：如果你對AI大模型領域有獨特的看法，歡迎掃碼加入我們的大模型交流群。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.