<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      消費級顯卡可以快速上手跑!面壁智能MiniCPM-o 4.5發技術報告

      0
      分享至

      面壁智能 投稿
      量子位 | 公眾號 QbitAI

      面壁智能公開了自己在全雙工全模態交互領域的核心技術——

      Omni-Flow 流式全模態框架。



      今天,面壁智能聯合OpenBMB開源社區、清華大學THUNLP實驗室和THUMAI實驗室,正式發布MiniCPM-o 4.5技術報告。

      過往大模型均為半雙工交互模式,類似對講機式輪次對話。

      用戶與AI無法并行交流,AI無法實時感知環境、不能被打斷插話,存在交互時空割裂,用戶體驗差,嚴重制約多模態AI落地應用。

      MiniCPM-o 4.5是面壁智能今年2月發布的全雙工全模態模型,也是業界首個端到端全雙工全模態大模型。

      該模型參數規模約9B,支持視頻、音頻、文本流輸入及文本與語音的連續輸出。

      利用MiniCPM-o 4.5,不用聯網、僅用一張消費級顯卡,你就能在個人電腦上擁有一個“邊看、邊聽、邊說、還能主動提醒”的類人AI助手。

      目前,MiniCPM-o 4.5已基于llama.cpp完成模型量化和推理性能優化,實測最低12GB顯存的RTX 5070即可流暢運行全雙工模式(RTF0.4),極大降低了個人端側部署的準入門檻。M1-M5 Max(包含M5 Pro)的MAC設備亦可使用,建議內存超過16G。

      下面這支視頻展示了MiniCPM-o 4.5在個人筆記本上的完整部署與運行過程,包括全雙工語音對話、實時視覺理解、主動提醒等能力演示。

      模型發布至今,抱抱臉下載量已突破25萬+。

      技術報告發布之外,MiniCPM-o 4.5還同步推出在線體驗Demo、全模態全雙工API、端側安裝包Comni和Demo倉庫。

      核心依托Omni-Flow流式全模態框架

      MiniCPM-o 4.5極致流暢的全雙工交互體驗,核心依托于面壁智能與清華大學聯合研發的Omni-Flow流式全模態框架。

      這也是本次技術報告公開的核心底層技術。

      該框架打破傳統模型孤立的回合式交互邏輯,搭建起毫秒級統一時間軸。

      通過時分復用機制,Omni-Flow流式全模態框架將視覺、音頻、文本等多模態并行信息流,精準對齊、拆分重組為周期性時序信息組。

      模型以每秒一次的高頻次持續刷新環境認知,實時更新對場景和用戶意圖的理解,全程無需依賴外部VAD語音活動檢測工具,原生支持持續感知、即時響應、自由打斷。

      在模型架構上,MiniCPM-o 4.5采用輕量化端到端全模態設計,整體僅9B參數,由四大核心模塊高效協同構成:

      • 0.4B參數SigLIP-ViT視覺編碼器負責環境視覺感知;
      • 0.3B參數Whisper-Medium音頻編碼器完成聲音信息采集;
      • 8B參數Qwen3-8B LLM基座承擔核心思考與語義理解;
      • 搭配0.3B參數輕量級語音Token解碼器實現語音生成。



      模塊化分工設計各司其職、高效聯動,既保留了大模型強大的理解推理能力,又規避了復雜聲學任務對核心算力的損耗。

      同時搭配自研TAIL時間對齊交錯語音生成方案,精準匹配文本與語音輸出節奏。

      在保證語音流暢自然、情感飽滿的前提下,最大限度降低交互延遲,徹底解決流式對話卡頓、滯后、銜接生硬的行業難題。

      參數不大,但實力不容小覷。

      在多項權威評測基準中實現越級對標,MiniCPM-o 4.5綜合性能比肩甚至超越多款行業前沿大模型。



      在視覺能力上,模型OpenCompass綜合得分77.6、MMBench英文得分87.6,整體表現對標Gemini 2.5 Flash,圖像理解、數學推理、文檔解析能力表現優異。

      在全模態動態交互、視頻場景理解領域,MiniCPM-o 4.5的優勢更為突出。

      Daily-Omni、Video-Holmes等多項評測數據顯示,MiniCPM-o 4.5優于Gemini 2.5 Flash等大模型的表現;在LiveSports-3K-CC全雙工視頻基準測試中,勝率達到54.4%,領先各類專用流式視頻模型。

      同時模型推理效率優勢顯著。

      INT4量化版本顯存占用大幅降低,僅需12GB顯存即可運行,解碼速度可達212 tokens/s,相較同類模型提速40%以上,響應延遲更低,性價比與落地優勢拉滿。



      除此之外,模型搭載多項實用特色功能,適配多元化使用場景。

      MiniCPM-o 4.5全面支持中英雙語實時語音對話,語音生成質量行業領先,中文CER、英文WER錯誤率低于CosyVoice2等主流模型,情感表現力更強。

      支持簡易參考音頻即可完成聲音克隆與角色扮演,音色自然逼真。

      延續MiniCPM-V系列優勢,擁有前沿的OCR文檔解析能力,支持高清圖像、高幀率視頻處理,多語言解析能力覆蓋30余種語言。

      同時,模型原生兼容傳統輪次對話、Omni-Flow全雙工流式交互兩種模式,無縫切換,兼顧精準問答與實時流式交互需求,適配各類使用場景。

      兼顧普通用戶體驗與開發者二次開發需求

      為讓技術真正落地普惠,MiniCPM-o 4.5打造了全渠道、全人群的開放落地體系,兼顧普通用戶體驗與開發者二次開發需求。

      面向普通用戶,官方開放無需注冊、無需下載的在線體驗Demo,同時推出適配Windows、macOS系統的桌面端Comni一鍵安裝包,簡化部署流程,普通用戶可快速上手體驗全雙工AI交互能力。

      面向廣大開發者,平臺免費開放全雙工實時WebSocket API,提供完整規范的接口文檔,支持快速接入各類應用;同時完整開源Demo前后端代碼,開放Linux部署方案,支持開發者自由二次開發、自定義調試,助力各類全模態AI應用快速落地。

      依托原生全雙工、持續感知、主動交互的核心能力,MiniCPM-o 4.5突破了傳統AI單次問答的場景局限,解鎖了大量全新流式交互應用場景。

      在生活服務領域,有望作為沉浸式智能陪伴助手,在用戶運動、烹飪、日常勞作時實時答疑、主動提醒、全程指導。

      在無障礙公益領域,可為視障人群提供實時環境感知服務,主動播報路況、設備狀態、環境變化,成為可靠的“視覺輔助助手”。

      在智能車載領域,可以持續監測路況與駕駛員狀態,主動預警風險、提示可用車位、輔助泊車,提升駕駛安全性。

      在具身智能領域,可作為機器人核心大腦,持續感知動態環境、自主決策交互時機,適配智能機器人、智能家居等智能化場景,覆蓋生活化、公益化、工業級多維度需求。

      可以說,MiniCPM-o 4.5把“主動式AI”從概念變成了可以在你電腦上跑起來的東西。

      當然,團隊也在技術報告中坦誠指出了當前不足:

      長時間交互的穩定性、主動行為的豐富性、對復雜場景的魯棒性,都還有提升空間。

      但這不妨礙它已經立起了一個新的起點——全雙工全模態、端側可部署、全棧開源,這條路線跑通了。

      目前,MiniCPM-o 4.5在線體驗、API、端側安裝包、Demo代碼倉庫,所有入口都已在GitHub和面壁官網上線。

      感興趣的小伙伴可以直接上手體驗~

      期待大家在評論區反饋。

      技術報告PDF:

      https://github.com/OpenBMB/MiniCPM-o/blob/main/docs/MiniCPM_o_45_technical_report.pdf

      在線體驗:

      https://minicpmo45.modelbest.cn/

      在線體驗(手機端推薦):

      https://minicpmo45.modelbest.cn/mobile/

      GitHub Demo(含本地安裝包):

      https://github.com/OpenBMB/MiniCPM-o-Demo

      抱抱臉:

      https://huggingface.co/openbmb/MiniCPM-o-4_5

      魔搭:

      https://www.modelscope.cn/models/OpenBMB/MiniCPM-o-4_5

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      周樂偉主動投案,曾任格力集團董事長

      周樂偉主動投案,曾任格力集團董事長

      臺州交通廣播
      2026-04-28 23:49:56
      5月1日起!摩托“非禁即行”落地,13省高速禁行,摩友有福了

      5月1日起!摩托“非禁即行”落地,13省高速禁行,摩友有福了

      老特有話說
      2026-04-28 16:04:51
      正大量上市!硒是洋蔥的30倍,中老年人多吃它,手腳靈活,精神棒

      正大量上市!硒是洋蔥的30倍,中老年人多吃它,手腳靈活,精神棒

      阿龍美食記
      2026-04-28 14:08:52
      新華社權威快報|我國自2026年5月1日起對所有非洲建交國實施零關稅

      新華社權威快報|我國自2026年5月1日起對所有非洲建交國實施零關稅

      新華社
      2026-04-28 18:19:09
      2026年全面禁麻將?公安部劃定紅線,不超這個金額全合法!

      2026年全面禁麻將?公安部劃定紅線,不超這個金額全合法!

      筆墨V
      2026-04-28 14:08:20
      攜程集團2025財年凈利潤332.94億元人民幣,同比增長92.97%

      攜程集團2025財年凈利潤332.94億元人民幣,同比增長92.97%

      IT之家
      2026-04-28 18:53:09
      炸裂!“最強降壓藥” 真的來了!30 年一遇,專門收拾頑固高血壓

      炸裂!“最強降壓藥” 真的來了!30 年一遇,專門收拾頑固高血壓

      孟大夫之家1
      2026-04-28 19:07:08
      智能眼鏡終于不是概念嘗鮮了?千問這次來真的了

      智能眼鏡終于不是概念嘗鮮了?千問這次來真的了

      差評XPIN
      2026-04-17 00:08:30
      米飯被點名!醫生直言:米飯冷凍24小時,抗性淀粉翻倍控糖護腸

      米飯被點名!醫生直言:米飯冷凍24小時,抗性淀粉翻倍控糖護腸

      路醫生健康科普
      2026-04-26 19:55:03
      某境外組織大力資助“躺平網紅”,系統性開展“躺平洗腦”,國安部提醒

      某境外組織大力資助“躺平網紅”,系統性開展“躺平洗腦”,國安部提醒

      界面新聞
      2026-04-28 08:10:01
      2026最嚴禁賭來襲!棋牌室、家庭麻將全部核查,紅線已劃定

      2026最嚴禁賭來襲!棋牌室、家庭麻將全部核查,紅線已劃定

      何氽簡史
      2026-04-28 19:31:43
      4000萬粉網紅白冰,偷稅超900萬被查!從發廊小哥到富豪,靠“接地氣、不割韭菜”立人設!

      4000萬粉網紅白冰,偷稅超900萬被查!從發廊小哥到富豪,靠“接地氣、不割韭菜”立人設!

      新民周刊
      2026-04-28 20:08:08
      Manus被取消交易:創業者不能既要、又要、也要、還要

      Manus被取消交易:創業者不能既要、又要、也要、還要

      小星球探索
      2026-04-28 12:08:06
      重磅!俄黑海艦隊高層遭團滅,29集團軍被打殘

      重磅!俄黑海艦隊高層遭團滅,29集團軍被打殘

      史政先鋒
      2026-04-28 18:10:17
      甘肅榆中山洪災害調查評估報告公布

      甘肅榆中山洪災害調查評估報告公布

      界面新聞
      2026-04-28 16:01:49
      突然閃崩,發生了什么?

      突然閃崩,發生了什么?

      中國基金報
      2026-04-28 16:14:20
      10年19冠!曼城官宣31歲功勛自由身離隊 周薪25萬  意甲3豪門哄搶

      10年19冠!曼城官宣31歲功勛自由身離隊 周薪25萬 意甲3豪門哄搶

      我愛英超
      2026-04-28 20:29:10
      Claude自己上“閑魚”:砍價成交186單,實驗結果反直覺

      Claude自己上“閑魚”:砍價成交186單,實驗結果反直覺

      智東西
      2026-04-27 18:08:21
      24小時內,中俄兵分兩路,普京接見伊朗外長,特朗普做出巨大讓步

      24小時內,中俄兵分兩路,普京接見伊朗外長,特朗普做出巨大讓步

      墜入二次元的海洋
      2026-04-28 19:50:47
      煽動躺平,該當何罪

      煽動躺平,該當何罪

      海濤評論
      2026-04-28 22:12:05
      2026-04-29 01:56:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      12551文章數 176458關注度
      往期回顧 全部

      數碼要聞

      OPPO Pad Mini明天首銷:3199元起 同檔最強小平板

      頭條要聞

      19歲中國女孩被困緬甸 交20萬贖金園區仍未放人

      頭條要聞

      19歲中國女孩被困緬甸 交20萬贖金園區仍未放人

      體育要聞

      魔術黑八活塞,一步之遙?!

      娛樂要聞

      蔡卓妍官宣結婚,老公比她小10歲

      財經要聞

      中央政治局會議定調,八大看點速覽!

      科技要聞

      10億周活目標落空!傳OpenAI爆發內部分歧

      汽車要聞

      拒絕瘋狂套娃!現代艾尼氪金星長在未來審美點上

      態度原創

      健康
      旅游
      游戲
      教育
      軍事航空

      干細胞治療燒燙傷三大優勢!

      旅游要聞

      莫讓內卷式競爭削弱旅游消費信心

      這不爽翻了?曝PS6或能穩穩運行60幀+光追的游戲畫面

      教育要聞

      教育部通知,今年9月份開始,上學的規則全變了

      軍事要聞

      德國總理默茨:美國正遭受伊朗領導層的羞辱

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 最好看的电影2019中文字幕| 第一色网| 97碰碰碰人妻无码视频| 欧美VA| 午夜性刺激免费看视频| 风间由美性色一区二区三区 | 国产精品一国产AV麻豆| 美女网站免费观看视频| 无码探花| 亚洲乱亚洲乱妇50p| ,国产乱人伦无无码视频| 久久婷婷是五月综合色| 中文字幕在线观看一区二区| 激情综合色综合啪啪五月丁香| 国产精品美女一区二区三区| 金坛市| 成人亚洲欧美成αⅴ人在线观看 | 亚洲av无码专区在线亚| 日韩在线视频线观看一区| 无码精品尤物一区二区三区| 精品国产一卡2卡3卡4卡新区| 国偷自产视频一区二区久| 国产浮力第一页| 国产97色在线 | 免| 亚洲欧美色欲天天| 成人影片在线观看18| 亚洲AV高清一区二区三区尤物| 日本视频网址一区二区三区| 99久久久无码国产精品动漫| 国产精品一区成人亚洲| 日本丰满熟妇videossex8k| 国产精品色一区二区三区| 成人无遮挡裸免费视频在线观看 | 久久尤物av天堂日日综合| 中国熟妇牲交视频| 扎囊县| 女高中生自慰污污网站| 亚洲第一av网站| 日日噜噜噜夜夜爽爽狠狠视频| 无码午夜| 中文字幕一区av97|