<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      我們拷打了小米最新大模型:全模態(tài)很驚艷,但聯(lián)網(wǎng)檢索仍是短板

      0
      分享至

      4月23日,小米MiMo V2.5系列模型開啟公測。根據(jù)官方介紹,該系列模型具有更強(qiáng)的推理能力、更穩(wěn)定的Agent。

      另外,它還有多模態(tài)感知能力,不僅能看懂文本,還能理解圖片、音頻等信息。而且,在Artificial Analysis榜單中,Xiaomi MiMo-V2.5-Pro綜合智能指數(shù)位列全球開源大模型第一。



      (圖源:小米)

      既然小米這款大模型能力這么強(qiáng),我們就來實(shí)際測試一下,看看它在哪些場景下有出色的表現(xiàn),同時又有哪些要改進(jìn)的地方。

      MiMo V2.5實(shí)測:模型能力很強(qiáng),聯(lián)網(wǎng)檢索稍弱

      目前,MiMo V2.5系列已經(jīng)開放公測,所有小米用戶都能在MiMo官網(wǎng)直接體驗(yàn)MiMo V2.5、MiMo V2.5 Pro等模型產(chǎn)品。

      網(wǎng)頁端這種使用場景不能百分百發(fā)揮出大模型的潛力,但作為摸底考試來說問題不大。我們結(jié)合日常實(shí)際使用習(xí)慣,通過五個具體案例,來看看MiMo V2.5的真實(shí)實(shí)力。

      案例一:文章總結(jié)

      長文概括總結(jié)基本是當(dāng)下主流大模型的基礎(chǔ)能力,作為這次實(shí)測的開胃菜再合適不過了。

      我們把雷科技(ID:leitech)最近寫的一篇關(guān)于ChatGPT Images 2.0評測的圖文內(nèi)容鏈接丟給它分析, MiMo V2.5 Pro的反應(yīng)很迅速,2秒鐘就生成了結(jié)果。它對文章內(nèi)容的概括非常準(zhǔn)確,把文章中針對ChatGPT Images 2.0的優(yōu)缺點(diǎn)評價都提煉了出來。



      (圖源:雷科技)

      當(dāng)然,這只是基本功,主流大模型一般都能比較好地完成這項(xiàng)任務(wù),接下來我們就要加大力度了。

      案例二:盤點(diǎn)一下小米2025年發(fā)布過的手機(jī)型號

      這個問題主要考驗(yàn)的是MiMo-V2.5 Pro的信息聯(lián)網(wǎng)檢索能力,坦率說,它表現(xiàn)得比較一般。

      首先,MiMo-V2.5 Pro羅列出的小米15系列是2024年發(fā)布的,并不是2025年的機(jī)型。



      (圖源:雷科技)

      查看其信息來源后,我們發(fā)現(xiàn)它是被一篇博客文章誤導(dǎo)了,這篇博文羅列了多款小米手機(jī)發(fā)布時間,但很多是錯的,甚至很有可能本身也是AI生成的。



      (顯示錯誤信息的網(wǎng)頁,圖源:雷科技)

      其次,不少機(jī)型被遺漏了,比如最重要的小米17系列。另外,它還出現(xiàn)了一些錯誤,MiMo-V2.5 Pro在檢索了早期的爆料信息后,誤以為小米15S Pro還沒發(fā)布,但實(shí)際上它就是一款2025年發(fā)布的機(jī)型。



      (圖源:雷科技)

      當(dāng)然,圍繞這個問題,其他大模型的表現(xiàn)也都很難稱得上完美。公認(rèn)聯(lián)網(wǎng)搜索能力很強(qiáng)的Gemini 3.1 Pro就翻車了,它出現(xiàn)嚴(yán)重幻覺,居然虛構(gòu)出了小米16系列。而DeepSeek反而是表現(xiàn)相對較好的,把小米和紅米機(jī)型基本都盤點(diǎn)全了,還顧及到了很多大模型忽略的海外品牌POCO,當(dāng)然它也遺漏了小米15S Pro。



      (圖源:雷科技)

      案例三:去洗車店洗車應(yīng)該走路去還是開車去?

      這是之前非常經(jīng)典的「忽悠」大模型的問題,曾經(jīng)ChatGPT等知名模型都翻車了,它主要考驗(yàn)的就是模型本身的邏輯推理能力。一個在真人看來很簡單的邏輯題,但對沒有針對性做過訓(xùn)練的大模型來說,就很容易掉坑里。

      面對這個問題,MiMo V2.5 Pro沒有被繞進(jìn)去,而是直接了當(dāng)?shù)刂赋隽岁P(guān)鍵:要洗的是車,不是人,洗車的前提是車必須得過去。



      (圖源:雷科技)

      案例四:幫我看看醫(yī)院的檢驗(yàn)報告

      MiMo V2.5有一個重要亮點(diǎn)就是支持多模態(tài),根據(jù)官方介紹,它在文本和代碼之外,還支持圖像、視頻和語音(MiMo V2.5 Pro暫不支持)。所以,我們可以以圖片等多媒體文件的形式進(jìn)行輸入。實(shí)際體驗(yàn)中,我找了一張醫(yī)院檢查的圖片給它,MiMo V2.5很快識別出了是哪項(xiàng)檢查,并且結(jié)合獲取到的數(shù)據(jù),給出了具體的結(jié)論和建議。



      (圖源:雷科技)

      另外,普通的照片也能丟給它,比如我塞給它一張很模糊的、logo被遮擋的Switch圖片,MiMo-V2.5準(zhǔn)確識別出了它是Switch,并且表示是OLED版。

      這項(xiàng)功能放在具體的終端設(shè)備上的話,可以進(jìn)一步拓展使用場景,比如手機(jī)打開相機(jī)就能把畫面實(shí)時交給AI分析、導(dǎo)航時根據(jù)相機(jī)識別出用戶所在的精準(zhǔn)坐標(biāo)等。



      (圖源:雷科技)

      案例五:做一個瀏覽器能運(yùn)行的小游戲

      一直以來,大模型的代碼能力都很被看重。作為一個編程小白,我更關(guān)心的是它能不能根據(jù)我的需求生成一個能直接運(yùn)行的程序,不用再做任何額外的工作。

      首先,我提了一個基礎(chǔ)編程課上的簡單案例:生成一個解一元二次方程的程序。MiMo-V2.5 Pro很快就開始寫代碼了,馬上做出了一個可以在瀏覽器上直接運(yùn)行的HTML文件。我只要在程序界面填入對應(yīng)的數(shù)字,它就能算出結(jié)果。



      (圖源:雷科技)

      然后,我們加大了難度,讓它寫一個圍棋的程序,它的代碼更加復(fù)雜,還要圍繞UI設(shè)計(jì)做很多工作。MiMo-V2.5 Pro處理這項(xiàng)任務(wù)也毫無壓力,將它生成的代碼直接運(yùn)行,就能在圍棋程序里面下棋了。



      (圖源:雷科技)

      MiMo Claw來了,小米「龍蝦」好用嗎?

      伴隨著MiMo-V2.5系列的發(fā)布,小米還同步上線了MiMo Claw。不過,這款龍蝦目前還處于測試階段,通過在網(wǎng)頁端運(yùn)行的模式提供給用戶使用。

      它的單次體驗(yàn)限時1小時,超時后原有的數(shù)據(jù)會被銷毀,用戶可以重新創(chuàng)建一個Claw項(xiàng)目再次體驗(yàn)。我們通過新聞抓取、財(cái)報分析和文檔優(yōu)化三個場景來測試這款龍蝦的實(shí)際表現(xiàn)。

      場景一:新聞抓取

      我給MiMo Claw出了一個不大不小的難題:搜索當(dāng)天的科技要聞,并且按照指定的懷舊風(fēng)格生成一張海報。這主要考驗(yàn)它的兩個能力,一是信息檢索,二是作圖。

      從實(shí)測結(jié)果來看,作為一款還在公測的「龍蝦」,它的表現(xiàn)還可以,至少模仿90年代雜志風(fēng)格這方面做得挺不錯的,而且排版基本沒出現(xiàn)大問題。

      當(dāng)然,還是老問題,它的信息聯(lián)網(wǎng)檢索能力一般,搜集了一些舊聞,時效性差點(diǎn)意思。但整體來說,這個效果已經(jīng)很好了,效率也比人工高。



      (圖源:雷科技)

      場景二:財(cái)報分析

      很多海外大公司發(fā)布的財(cái)報文件,篇幅很長、數(shù)據(jù)很多,而且基本是英文,國內(nèi)投資者要看懂看透,難度不小。我們嘗試把一份28頁的蘋果財(cái)報PDF文件丟給MiMo Claw,讓它來分析和總結(jié)。



      (圖源:雷科技)

      MiMo Claw的表現(xiàn)很給力,比較精準(zhǔn)地概括了這份財(cái)報數(shù)據(jù)的重點(diǎn),并且給出了結(jié)論:

      1. iPhone 是絕對功臣
      2. 研發(fā)投入暴增31.7%
      3. 服務(wù)業(yè)務(wù)穩(wěn)健增長但增速放緩
      4. Mac和可穿戴拖后腿
      5. 現(xiàn)金流極其充沛



      (圖源:雷科技)

      在查看MiMo Claw的工作流時,我們發(fā)現(xiàn),它首先會把PDF文件中的文本信息全部提取出來,在云端以TXT文件保存,再將這份文檔進(jìn)行翻譯、分析,最后歸納總結(jié)。不過,由于它是基于網(wǎng)頁端運(yùn)行的,所以實(shí)際體驗(yàn)沒能和主流的網(wǎng)頁端大模型拉開很大的差距。

      場景三:文檔優(yōu)化

      對于MiMo Claw的能力,小米官方提到了它與金山生態(tài)達(dá)成了合作,在Office文檔處理方面會有優(yōu)勢。我個人一直都是PPT苦手,難點(diǎn)不在于內(nèi)容填充,主要是排版。畢竟,PPT給人的第一印象往往是由版面美觀度決定的。

      為了「拷打」MiMo Claw,我特意找了個排版風(fēng)格非常陳舊的大學(xué)課件,這個PPT一打開,完全是90年代的風(fēng)格,而且毫無排版設(shè)計(jì)可言。



      (圖源:雷科技)

      我們將這個PPT喂給MiMo Claw,并且要求它著重美化排版,具體參考科技公司的Keynote。坦率說,我對最后的成品沒有抱太多期待,主要是因?yàn)镻PT美化的難度比純粹修改文本高很多,需要龍蝦工具在模型、智能體和Skills方面都有很強(qiáng)的能力。

      然后,從MiMo Claw最后生成的PPT文件來看,整體排版效果好了非常多,至少字體顏色比原版正常很多,看著更舒服。別的不說,原版PPT那種陳舊毫無美觀度可言的版面,總算消失了。



      (圖源:雷科技)

      終端品牌入局大模型,小米有長遠(yuǎn)打算

      由于還在公測階段,MiMo-V2.5系列大模型以及MiMo Claw在實(shí)際使用中自然還會存在一些問題,但我們已經(jīng)能感受它較為出色的模型和Agent能力。

      同時,這次的大規(guī)模公測,大量用戶的實(shí)測和反饋,也能給小米提供一些改進(jìn)的方向。從小米的規(guī)劃來看,MiMo-V2.5系列不僅面向普通用戶,更面向廣大開發(fā)者。伴隨這次公測,小米MiMo-V2.5系列的Token付費(fèi)服務(wù)也一并上線。

      當(dāng)然,我們也認(rèn)為,對于小米而言,不遺余力地迭代大模型,絕不僅僅是為了在發(fā)布會上秀技術(shù)肌肉和賺點(diǎn)服務(wù)費(fèi),其真正的野心在于深度賦能旗下龐大的消費(fèi)核心業(yè)務(wù)。

      就拿我們最熟悉的小愛同學(xué)來說,如果融入MiMo-V2.5系列的全模態(tài)能力,它將迎來一次跨越式的進(jìn)化。固有印象中的小愛同學(xué),更多是一個被動的指令執(zhí)行工具,用戶發(fā)號施令,它按部就班地開關(guān)電器或是定鬧鐘。

      但在全模態(tài)大模型的加持下,它正在轉(zhuǎn)型成為一位真正的超級管家。它不僅能直接看懂用戶手機(jī)或平板屏幕上的內(nèi)容并進(jìn)行深度交互,更能敏銳地聽懂家庭場景中那些模糊的自然語言,理解背后復(fù)雜的真實(shí)意圖。



      (圖源:小米)

      小米自家的AI技術(shù),不僅能應(yīng)用到手機(jī)這類單品中,還能廣泛融入小米的「人車家」生態(tài)中,為更多產(chǎn)品、更多應(yīng)用場景提供支持。可以預(yù)見的是,小米未來的產(chǎn)品藍(lán)圖肯定不局限于智能家居和汽車,還將包括人形機(jī)器人、其他形式的AI硬件等。

      可以說,如今的大模型已經(jīng)徹底跳出了發(fā)布會上那些干巴巴跑分和技術(shù)指標(biāo),成長為真正打通并盤活各種智能場景生態(tài)的核心大腦。從更行業(yè)視角來看,這不僅是小米一家的戰(zhàn)略,更是整個智能終端賽道的共識。

      小米正依托大模型不斷深化其人車家全生態(tài),而榮耀等廠商也在掌舵人李建的帶領(lǐng)下,加速推進(jìn)底層AI的全面重構(gòu),榮耀的人形機(jī)器人剛在馬拉松賽道上奪冠,就是這一證明。這標(biāo)志著曾經(jīng)單純卷硬件參數(shù)的手機(jī)廠商們,都在默契地跨越傳統(tǒng)的邊界,從終端硬件品牌全面向AI生態(tài)品牌轉(zhuǎn)型。

      2026第十九屆北京國際汽車展覽會將于4月24日至5月3日在北京?中國國際展覽中心(順義館)和首都國際會展中心(新國展二期)舉行,本屆車展以“領(lǐng)時代·智未來”為主題,集中展現(xiàn)汽車工業(yè)的更多黑科技。
      比亞迪、小米、鴻蒙智行(問界等)、小鵬、蔚來、嵐圖等頭部品牌集結(jié),多款重磅新車首秀;地平線、Momenta、卓馭等供應(yīng)商集體秀肌肉,AI大模型深度賦能,高階智駕、動力電池、超快充技術(shù)等前沿科技集中亮相,看點(diǎn)拉滿!
      雷科技旗下「電車通」將派出報道團(tuán)直擊現(xiàn)場,以“關(guān)注電動車,更懂智能化”的專業(yè)視角,帶來一線獨(dú)家報道,敬請關(guān)注!



      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      顛覆認(rèn)知!12306驚現(xiàn)豪華旅游專列:票價超20萬元 運(yùn)營方回應(yīng)

      顛覆認(rèn)知!12306驚現(xiàn)豪華旅游專列:票價超20萬元 運(yùn)營方回應(yīng)

      快科技
      2026-04-23 18:03:11
      4.7萬億!馬斯克打破人類財(cái)富紀(jì)錄:他一個人的錢抵得過160個國家

      4.7萬億!馬斯克打破人類財(cái)富紀(jì)錄:他一個人的錢抵得過160個國家

      通鑒史智
      2026-03-15 11:45:00
      爆雷!9300萬股牢牢封死跌停板:股民想“割肉”都難…

      爆雷!9300萬股牢牢封死跌停板:股民想“割肉”都難…

      新浪財(cái)經(jīng)
      2026-04-23 17:14:44
      專挑富人下手的“騙局”:造假18年,收割4萬人,700億灰飛煙滅

      專挑富人下手的“騙局”:造假18年,收割4萬人,700億灰飛煙滅

      混沌錄
      2026-03-29 22:37:11
      打蛇打七寸!中國全面斷供開始,日本多行業(yè)停擺,高市真慌了

      打蛇打七寸!中國全面斷供開始,日本多行業(yè)停擺,高市真慌了

      嘆知
      2026-04-23 09:55:50
      “最美嬰兒”走紅,像是在娘胎里整了容,網(wǎng)友:看一眼就想抱走

      “最美嬰兒”走紅,像是在娘胎里整了容,網(wǎng)友:看一眼就想抱走

      大果小果媽媽
      2026-04-23 13:35:47
      Mac mini基礎(chǔ)款蘋果官網(wǎng)斷貨!從白菜價到一機(jī)難求只用了半年

      Mac mini基礎(chǔ)款蘋果官網(wǎng)斷貨!從白菜價到一機(jī)難求只用了半年

      科技獸
      2026-04-23 21:43:28
      國家出手!“京圈富少”被判入獄,和童瑤關(guān)系被扒,真實(shí)身份曝光

      國家出手!“京圈富少”被判入獄,和童瑤關(guān)系被扒,真實(shí)身份曝光

      林輕吟
      2026-03-25 07:23:12
      在醫(yī)院你遭遇過最羞恥的事是什么?網(wǎng)友:一個比一個炸裂啊

      在醫(yī)院你遭遇過最羞恥的事是什么?網(wǎng)友:一個比一個炸裂啊

      解讀熱點(diǎn)事件
      2026-02-04 00:05:07
      表態(tài)不滿,趙繼偉交易離隊(duì)?正式確認(rèn),誰注意楊鳴的表態(tài)

      表態(tài)不滿,趙繼偉交易離隊(duì)?正式確認(rèn),誰注意楊鳴的表態(tài)

      林子說事
      2026-04-23 17:50:01
      永不再生! 2022年河北男子潛入保護(hù)區(qū)挖上千斤, 偷偷種在玉米地里

      永不再生! 2022年河北男子潛入保護(hù)區(qū)挖上千斤, 偷偷種在玉米地里

      萬象硬核本尊
      2026-04-23 19:24:17
      演員王大陸一審被判刑

      演員王大陸一審被判刑

      極目新聞
      2026-04-22 12:35:08
      “指紋鎖”退出中國家庭?開鎖師傅說了實(shí)話,我連夜換回了鐵將軍

      “指紋鎖”退出中國家庭?開鎖師傅說了實(shí)話,我連夜換回了鐵將軍

      巢客HOME
      2026-04-08 15:48:09
      史上首次!特朗普請求伊朗:放過這8位女性,美4位前總統(tǒng)表態(tài)

      史上首次!特朗普請求伊朗:放過這8位女性,美4位前總統(tǒng)表態(tài)

      墨印齋
      2026-04-23 16:24:19
      好萊塢風(fēng)流往事:沃倫體力太好,一天數(shù)次求歡,讓麥當(dāng)娜欲罷不能

      好萊塢風(fēng)流往事:沃倫體力太好,一天數(shù)次求歡,讓麥當(dāng)娜欲罷不能

      錢小刀娛樂
      2026-04-15 15:40:52
      不想訪華了?特朗普召回美駐華大使,貝森特?fù)P言:中國“不可靠”

      不想訪華了?特朗普召回美駐華大使,貝森特?fù)P言:中國“不可靠”

      愛吃醋的貓咪
      2026-04-22 21:08:39
      黑龍江省大慶市政府原副市長、市公安局原局長宋鴻源被查

      黑龍江省大慶市政府原副市長、市公安局原局長宋鴻源被查

      界面新聞
      2026-04-23 16:04:08
      奇跡生還!澳洲沖浪者遭全球最毒生物襲擊:全身抽搐,呼吸如穿針

      奇跡生還!澳洲沖浪者遭全球最毒生物襲擊:全身抽搐,呼吸如穿針

      全球風(fēng)情大揭秘
      2026-04-23 23:20:51
      為什么東風(fēng)-41洲際導(dǎo)彈堅(jiān)決不用北斗?不是不用,是絕不能用!

      為什么東風(fēng)-41洲際導(dǎo)彈堅(jiān)決不用北斗?不是不用,是絕不能用!

      一姐說軍史
      2026-04-13 12:27:41
      酒店里,擠滿了偷偷開房的已婚女性

      酒店里,擠滿了偷偷開房的已婚女性

      二胡的歲月如歌
      2026-04-22 19:03:26
      2026-04-24 00:11:00
      雷科技 incentive-icons
      雷科技
      專注AI硬科技
      36917文章數(shù) 812046關(guān)注度
      往期回顧 全部

      數(shù)碼要聞

      電腦徹底裝不起了!CPU漲價20%起步:9700X漲幅逼近60%

      頭條要聞

      媒體:海軍宣傳片出現(xiàn)的"新兵何劍" 傳遞了巨大信息量

      頭條要聞

      媒體:海軍宣傳片出現(xiàn)的"新兵何劍" 傳遞了巨大信息量

      體育要聞

      給文班剃頭的馬刺DJ,成為NBA最佳第六人

      娛樂要聞

      王大陸因涉黑討債被判 女友也一同獲刑

      財(cái)經(jīng)要聞

      關(guān)于AI算力鏈"瓶頸" 這是高盛的最新看法

      科技要聞

      馬斯克喊出"史上最大產(chǎn)品",但量產(chǎn)難預(yù)測

      汽車要聞

      令人驚艷的奇瑞車 風(fēng)云A9可不只是樣子貨

      態(tài)度原創(chuàng)

      本地
      旅游
      家居
      公開課
      軍事航空

      本地新聞

      SAGA GIRLS 2026女團(tuán)選秀

      旅游要聞

      文旅觀察丨玩轉(zhuǎn)“票根+”,山東何以用一張票解鎖一個省?

      家居要聞

      浪漫協(xié)奏 法式風(fēng)格

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      人民海軍成立77周年 主力艦艇亮相上海

      無障礙瀏覽 進(jìn)入關(guān)懷版