內容提要:
前字節跳動工程師、北大教授張池指出,中美人工智能差距并未縮小,反而在擴大。國內大模型沉迷于“刷榜”拿高分,實際應用拉胯;訓練數據質量低、迭代周期是美國2-4倍、用戶付費意愿弱形成負循環。那些美國名人“中國正在趕超”的論調,可能只是美國企業家的“煙霧彈”。
![]()
盡管外界普遍說我們在人工智能領域正在趕上美國,在有些領域可能已經領先。但一位前字節跳動工程師認為,實際上差距正在進一步擴大。
周末,北京大學助理教授、研究科學家兼助理教授張池(音譯)在《進入亞洲》播客節目中說:“我甚至不同意中國模型正在追趕的假設——我認為我們仍然遠遠落后。非常遺憾,我認為差距正在擴大”。
張池表示,他在字節跳動的人工智能部門工作了大約一年,專注于人工智能模型,之后重返學術界。他表示,不否認人工智能的中國初創企業在快速發展,但由于美國的發展可能更快,我們必須認識到在我們快速發展的同時,實際上差異不僅沒有縮小,反而在持續擴大。這應該是正確認識我們的人工智能行業的重要的一部分。
一、中國大模型專注于如何提高基準測試的得分,但在實際應用中表現拉跨。
![]()
張池認為,雖然像字節跳動和阿里巴巴這樣的大公司開放的大模型在基準測試中得分不錯,但這并不意味著它們在現實世界的應用中表現同樣出色。理論上,我們的每家大型科技公司都有好的大模型。但實際上它們還不夠好。因為許多大模型團隊專注于“benchmaxxing”——更注重考試成績而非實際表現的模型。如同于我們的一些名頭響亮的高中,專注于培訓學生如何提高高考得分,成為考試機器,但很少注意如何提高學生的創造力。
字節跳動和阿里巴巴推出了高知名度的AI模型——從像Seedance這樣的視頻生成器到像Qwen這樣的開源系統——但他們也因深度偽造、版權糾紛以及這些模型在現實中是否經得起考驗而遭遇了用戶端的廣泛質疑。
二、中美大模型在基礎設施和訓練數據方面存在難以彌補的差距。
![]()
美國的大模型和中國大模型的基礎設施方面存在的巨大差距,是最公開的差距。這種差別不僅僅表現在我們無法獲取先進芯片,數據中心基礎設施薄弱,這些硬件的差距擺在桌面上,大家容易看到。更大地、大家看不到的差距是大模型訓練數據質量較低。我們的大模型無法獲得高質量的數據,訓練數據甚至被人為污染,這是中國大模型普遍存在結構性劣勢。
而且,訓練大模型的數據質量較低這一劣勢難以逆轉。因為造成這一劣勢的兩大原因是制度性的而非技術性的。比如我們對互聯網普遍存在的敏感單詞的審查導致的語言污染,比如我們的大模型應用產品和軟件一樣難以獲得付費用戶,導致人工智能獲利模式轉向異端——如同互聯網時代的搜索引擎一樣利用關鍵詞獲利,導致訓練數據甚至被人為污染。
邏輯上,在被污染的大模型數據面前,大模型的理論評分,有何意義?
很多人不理解我們的大多數大模型公司,為何熱衷于并依賴于從領先的美國模型中提取數據,而非建立自己的數據管道。公開的評論大都認為這是一條捷徑,可以節省大模型投資。但大家忽略了其背后兩大問題:一是依賴對美國大模型的蒸餾,一些人工智能公司可能是迫不得已,因為他們非常清楚我們提供給大模型訓練的數據質量堪憂。二是美國三大大模型巨頭和白宮,都在出手遏制對其大模型的蒸餾,這必然將限制我們大模型的長期發展。
三、我們的大模型更新迭代的周期是美國的2-4倍。
![]()
張池說,我們大模型差距擴大的一個關鍵問題是速度。他說,美國頂級公司可以更快地迭代大模型。
可以確定的是,谷歌可以在三個月內培訓或完成一整輪LLM培訓,包括培訓前和培訓后。但字節跳動和其他幾乎所有的模型迭代,周期幾乎在半年甚至一年。
我們的大模型迭代較慢,與投入有關,也與用戶有關。
此外,更強的用戶反饋對大模型的優化大有裨益。美國的人工智能企業也受益于更強的用戶反饋循環。像ChatGPT、Claude和Gemini這樣的產品,他們通過與用戶的持續互動而不斷更新、不斷提升,有助于隨著時間推移優化模型。
相比之下,中國的大模型有陷入負循環的風險。往往中國大模型起初表現不佳,但較少有人真正用它們做重要的事情,所以大模型的優化和更新很難依賴于用戶的反饋,導致起點不錯的模型難以在后續中繼續提高。而缺少用戶反饋的主要原因在于大模型使用對象中的中國企業用戶和個人用戶的現有收入水平,難以負擔大模型的收費,比如社交媒體中的專業創作者,他們從平臺獲得的收入越來越少,使用付費的大模型大幅增加成本而難以同步增加收入。
四、不要沉迷于我們正在縮小與美國人工智能差距的幻覺中。
![]()
張池的觀點可能與我們媒體上一些最知名的聲音形成鮮明對比,許多人認為我們正在迅速縮小與美國的差距,甚至可能領先。
我們的媒體經常援引英偉達首席執行官黃仁勛和特斯拉與space創始人馬斯克的觀點來證明我們在人工智能方面可以與美國并駕齊驅甚至超越美國。
黃仁勛曾警告稱,美國的人工智能有落后風險;而埃隆·馬斯克則表示,中國在能源和計算領域的優勢可能幫助其超越競爭對手。人工智能先驅杰弗里·辛頓也表示,美國的領先優勢可能比表面看起來更小,并警告其可能隨著時間推移而縮小。但人們往往忽略了,這些美國的企業家和技術大拿,其表達的背后,并非對我們人工智能發展水平的認可和蓋章,指出一個假想敵,制造危機感,吸引更多的投資和政府的支持,才是他們發表這一觀點的唯一目的,也一直是美國企業家和官員吸引社會關注某一領域的基本手段。
![]()
張池的觀點反映了我們人工智能生態系統內部更為悲觀的觀點——暗示與美國的差距可能正在擴大。但持有這一觀點的人可能更多,只是表達更委婉。比如阿里巴巴董事長蔡崇信認為,人工智能競賽的勝負將更多取決于AI部署的速度,而非模型的評分實力。
三郎自2024年初開始,也一直在使用大模型快速獲得全球和一些特定國家的經濟數據,生成文章的內容提要,自動校對文章的錯字和錯詞。從初期同時使用國內、國外六個模型,到現在主要依賴ChatGPT和Google Gemini,也是因為國內大模型在實際應用中太一言難盡。
三郎也持有與張池一樣的觀點:“公平地說,我認為沒有哪個中國人工智能公司能很快趕上美國的同類企業”。
【作者:徐三郎】
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.