今日,國外社交媒體上,有用戶吐槽國產模型minimax的表現十分令人失望,甚至可以用垃圾來形容。
![]()
該用戶表示:玩過openclaw的都知道minimax有多垃圾。
在評論區,引發了諸多網友對此的共鳴。有網友表示:MiniMax像是精神分裂,胡思亂想,胡說八道,它把代碼看了,給出的答案都是似是而非。總之問完再問,都不能解決問題。這個可以說是中國AI model最垃圾的一個。
通過整理網絡資料也不難發現,很多用戶在使用MiniMax的確都存在著諸多類似的困惑。
首先,最常被提到的是“幻覺問題”,也就是俗稱的“瞎編”。不少用戶反映,MiniMax 在回答事實性問題時,經常會一本正經地給出錯誤信息,而且內容看起來還挺像那么回事。例如,它可能會編造不存在的論文、虛構歷史事件細節等。如果不去核實,很容易被誤導。雖然這一問題在各類大模型中普遍存在,但不少用戶認為 MiniMax 在這方面的表現相對更嚴重。
其次是“復讀機”現象。很多用戶吐槽它的回答又長又重復,本來一句話可以說清楚的內容,它卻反復換種說法來表達,導致整段回復顯得冗長且信息密度不高。簡單來說,就是“看起來說了很多,其實沒多大信息量”。
第三個爭議點來自安全問題,尤其是圍繞其角色扮演產品 Talkie。在2024至2025年間,這款應用被曝出對未成年用戶保護不足,同時在部分角色扮演場景中生成了不當內容,例如涉及暴力或情感操控等。此外,還有媒體報道稱,一些青少年在與 AI 角色進行深度互動后出現心理問題。這一系列事件引起了監管機構的關注,也對 MiniMax 在海外的口碑造成了較大沖擊。
在實際使用體驗上,很多人還指出 MiniMax 的指令遵循能力不夠穩定。比如,用戶明確要求用表格輸出、限制字數,或者進行角色扮演時,模型經常“聽不進去”,要么不按格式來,要么中途“出戲”。一旦任務稍微復雜一些,比如包含多步驟要求,就容易出現漏步驟或順序混亂的問題。
在推理能力方面,MiniMax 也常被拿來與更強的模型進行對比。無論是邏輯推理、數學問題還是代碼調試,它在多步驟推理過程中容易出現中間出錯的情況,一旦某一步偏了,后面的結果往往就全部錯誤。這使得整體可靠性受到影響。
此外,還有用戶質疑其“跑分表現與實際體驗不符”。也就是說,在官方公布的 Benchmark 測試中,模型成績看起來很不錯,但在真實使用場景中,表現卻達不到預期。一些社區用戶甚至懷疑模型針對測試集做了優化,不過這一點并沒有確鑿證據,但“體感落差”確實是普遍反饋。
比較有意思的是,盡管 MiniMax 是國產模型,但在中文理解上也并非完全穩定。例如,成語和歇后語偶爾會用錯,對網絡梗或雙關語的理解也不總是準確,在涉及特定文化背景的內容時,有時也會出現偏差,這一點讓部分用戶感到意外。
最后,在多模態方面,其視頻生成產品(如海螺 AI)也經歷了“初看驚艷、細看翻車”的評價變化。用戶在深入使用后發現,生成視頻中常見人物一致性較差(同一角色前后長相變化明顯)、物理規律不合理(如穿模、重力異常)以及可控性不足等問題,難以精確實現預期效果。
總體來看,MiniMax 的模型在技術展示層面具有一定亮點,但在穩定性、可靠性和實際使用體驗上,仍存在不少被用戶反復提及的短板。這些問題是否能夠在后續版本中得到改善,也成為不少人持續關注的焦點。
延伸閱讀:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.