![]()
全球觀察者深度出品
縱橫寰宇,洞察時代風云
大家好歡迎收看【】
新加坡最近在AI圈搞了個大動作國家人工智能計劃(AISG)宣布,他們那個東南亞語言大模型"海獅"項目,把原來用的美國MetaLlama模型給換了,換成中國阿里巴巴的通義千問(Qwen)開源架構。
這事在全球AI圈,不少人都在琢磨,為啥放著硅谷的"明星模型"不用,轉頭選了中國方案?
要說清這事,得先看看新加坡當初為啥選Llama。
![]()
2022年Meta發布Llama2時,這模型在開源界簡直是"頂流",參數規模大、推理能力強,被稱作"開源性能天花板"。
新加坡搞"海獅"計劃,本來是想解決東南亞多語言痛點你想啊,東南亞光官方語言就有十幾種,還有無數方言,溝通成本太高。
當時大家都覺得,Llama2這種"全能選手"肯定能搞定。
![]()
可真用起來,新加坡團隊發現不對勁。
東南亞語言哪是那么好對付的?泰語、緬甸語這些非拉丁文字,字母長得跟英語完全不是一回事,Llama2的分詞器根本處理不了,經常答非所問。
更頭疼的是"語碼轉換"新加坡人說英語,動不動就夾幾句閩南語、馬來語,比如"這個project要快點做,不然boss要keng(生氣)了",這種帶文化梗的表達,標準美式AI模型聽得一臉懵。
![]()
最離譜的一次測試,有人問Llama2"東盟成員國里哪些講西班牙語",模型居然把南美洲的委內瑞拉列了進去。
你想啊,連基本地理常識都能搞錯,這模型在東南亞怎么落地?后來團隊才發現,Llama2的預訓練數據里80%以上是英語,非拉丁語系語言就像"邊角料",能不出錯嗎?
![]()
西方模型在東南亞"水土不服",從"開源天花板"到"溝通障礙"
其實不光新加坡,很多非英語國家都遇到過類似問題。
印度朋友就吐槽,他們用西方模型處理印地語時,語法錯誤能堆成山;中東國家更頭疼,阿拉伯語從右往左寫,模型經常把句子順序搞反。
![]()
說白了,這些模型骨子里帶著"英語中心主義",設計時就沒把非英語用戶當回事。
既然西方模型在東南亞"水土不服",那新加坡為啥偏偏選了阿里的通義千問?這就得說說通義千問的幾個"獨門秘籍"了。
通義千問的"本土化密碼",技術適配+低門檻,讓AI落地東南亞
首先是多語言底子厚。
![]()
通義千問的預訓練數據里塞了36萬億個token,覆蓋119種語言,不是簡單翻譯,而是真的懂每種語言的文化語境。
比如處理馬來語里的"kampung(村莊)",它知道這詞不光指物理空間,還帶著"家鄉情懷"的意思,這可不是隨便哪個模型能做到的。
再看底層技術。
![]()
泰語、老撾語這些語言沒空格,全靠上下文斷句,西方模型常用的句子分詞器根本玩不轉。
通義千問直接換了套字節對編碼(BPE)分詞器,從字母組合層面分析,斷句準確率一下提了30%多。
有工程師私下說,就沖這分詞器,他們測試時就覺得"這模型懂東南亞"。
更關鍵的是部署門檻低。
![]()
東南亞很多中小企業算力有限,服務器內存普遍不大。
通義千問團隊專門優化了模型大小,現在這個"海獅"v4版本,普通消費級筆記本只要32GB內存就能跑。
這種"接地氣"的設計,比那些參數堆上天卻用不起的模型實在多了。
還有個聰明的合作模式。
![]()
阿里出通用推理底座(Qwen3-32B)和后訓練技術,新加坡提供1000億個東南亞語言token這些數據都是本地團隊精挑細選的,帶著街頭俚語、地方諺語,版權干凈。
兩邊一融合,模型既有全球通用能力,又懂東南亞的"梗",這不就是"1+1>2"嗎?
這事說小了是新加坡換個模型,說大了其實標志著全球AI格局在變。
![]()
以前大家覺得,AI就得看美國臉色,硅谷出啥我們用啥。
現在不一樣了,新加坡敢放棄Llama選通義千問,說明中國方案在開源生態和應用落地層面,已經有了和美國體系平等對話的底氣。
中國模式的厲害之處,不在于所有基礎領域都領先,而在于能把技術和最復雜的應用場景結合。
![]()
你想啊,中國本身就有56個民族、上百種方言,處理多語言問題經驗豐富。
通義千問開源后,全球開發者都能參與優化,這種生態比單打獨斗靠譜多了。
現在AI圈有個新趨勢,以前比誰參數高、英語任務跑得快,現在比誰能真正解決本土問題。
通義千問在東南亞的成功,說白了就是"適配性勝利"。
![]()
對那些非英語國家來說,終于不用在西方模型里"矮子里面拔將軍"了,中國方案提供了一個更友好、更可靠的選項。
新加坡這次"換芯",就像往平靜的湖面扔了塊石頭。
以后全球AI可能不再是"一家獨大",而是"多元共生"你擅長英語場景,我精于多語言適配,大家各有所長。
![]()
這種競爭對整個行業是好事,畢竟技術最終是要解決問題的,不是用來秀肌肉的。
說到底,AI模型沒有絕對的"好壞",只有"合不合適"。
新加坡選通義千問,不是跟風,而是算明白了賬,能解決自己問題的,才是最好的。
這或許就是給所有國家的啟示,技術選擇,終究要回歸本土需求。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.