免責:
本文純個人觀點,僅測試文本理解、代碼生成能力,結果不代表 ERNIE 5.0 完整、真實水平。
省流:
1、生成速度很慢
2、網頁版居然沒有 html 預覽功能,這事兒不難啊,Kimi、Qwen 都可以
3、各種拉垮,6 個題目,沒有 1 個可以與 Kimi K2 Thinking 掰手腕,只有最后1題完成度高,能勉強與Qwen-3Max對比
4、它對指令的理解很差,但凡與圖像生成沾邊的都會忽略指令,開始直接 AI 繪圖,即便你已經明確告訴它了實現方式也不行。
5、或許我不應該測試它最新這個多模態版 ERNIE 5.0,1022 版本的文心 5.0 號稱文本能力更強,我沒再測。但是話說回來了,多模態就可以不遵守指令嗎?
6、它太喜歡畫畫了
大家好,我是 Ai 學習的老章
最近一周國產大模型還是很熱鬧的
阿里更新了 Qwen DeepResearch、微博開源了基于 Qwen2.5-Math-1.5B 微調 VibeThinker 1.5B 大模型
最讓我感興趣的是“支棱起來”的百度 ERNIE 5.0 來了,對標 ChatGPT,原生全模態支持。
官方宣稱的模型特色之處:
原生統一多模態建模技術,結合文本、圖像、音頻和視頻進行理解和生成 采用超過 2.4T 的 MoE 架構,每次推理激活不到 3 個,降低計算量同時提升推理效率 在 40 多項基準測試中表現出前沿水平的性能
基準測試對比情況
1、文本處理,各項基準平均值,穩贏 DeepSeek-V3.2-Exp 和 Gemini-2.5-Pro,還有幾個基準能打贏 GPT-5
![]()
2、視覺理解各種領先,N 多項上 Gemini-2.5-Pro、GPT-5 都手下敗將
![]()
3、圖像生成秒殺 GPT-image 和谷歌的 Nano-Banana、視頻生成與 Veo3 旗鼓相當
![]()
4、音頻理解、STT、語音識別都各種強過 GPT-4o-Audio、Gemini-2.5-Pro
![]()
真實水平咋樣呢,我就直接單測試其文本處理、代碼能力吧
這些題目與之前我測試 K2 Thinking 和 Qwen3-Max 一致,更容易看出模型差距
測試平臺為官方網站:https://ernie.baidu.com/
模型選擇文心 5.0 Preview
![]()
ERNIE 5.0 1022 預覽版具有更強的文字能力,ERNIE 5.0 預覽版是最新版本 測試 1:總結朱自清《背影》繪制 SVG![]()
字都出格了,跟 Kimi K2 Thinking 沒法比,也比不上一樣沒能正確識別出 4 次背影但繪制 svg 正常的 Qwen3-Max,
Kimi K2 Thinking![]()
Qwen3-Max
![]()
測試 2:生成器官分布
怎么就出發了繪圖功能呢?
![]()
即便告訴它給我 svg 代碼,依然失敗
![]()
![]()
測試 3:用 html 創建一個帶有旋轉星云和動態光照的 3D 粒子星系。
思考過程看,也是用 Three.js 創建 3D 場景、相機和渲染器,但是太太太簡陋了
完敗與 K2 Thinking 和 Qwen3-Max
![]()
沒有對比就沒有傷害
![]()
測試 4:發揮你的最大才能,用你最擅長的工具,生成一組數據后繪制數據大屏,主題自擬。
ERNIE 5.0 不像 K2 和 Qwen,它先用 Python 腳本生成 csv 數據集,但是可視化時,它告訴我要用Power BI實現。。。
![]()
K2 Thinking 生成的是"未來智慧城市運營中心"主題的數據大屏,包含動態生成的多維度城市運營數據。一共 285 行代碼。前兩次均報 bug,第三次成功生成!
![]()
對比 Qwen3-Max??,它第一次的代碼也報錯,第二次成功
![]()
測試 5:3D 動畫演示月食原理及全過程
不遵指令,后面我追問了,給我 html 代碼,依然是繪圖
![]()
Kimi K2??
測試 6:生成一個動態網頁,展現絢麗多彩的煙花盛況,樣式要多,顏色要炫
這次遵守指令了,思考過程是用 html+CSS+js 實現,效果如下,除了相比 K2 和 Qwen 功能上少了,完成度還不錯,甚至比 Qwen3-Max 還要好點的感覺
K2 Thinking 碾壓 Qwen3-Max 的視頻
最后再說一句,即便是我切換成 10 月份擅長文本生成的文心 5.0,它的指令遵循也不穩定,它太喜歡畫畫了,思考過要用 html5 和 webgl 實現后,pia 一下直接 AI 繪畫了
![]()
最后再推薦一個我正在學習的強化學習課程
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.