關注飛總聊IT,了解IT行業的方方面面。
這幾天在大模型領域里面最大的瓜,是華為的盤古大模型。
具體來說,就是華為的盤古大模型被質疑套殼和抄襲了阿里的通義千問開源大模型。
事情最初起源于2025年7月4日。 一項發布于GitHub的研究指出,華為盤古Pro MoE 模型(總參數720億)采用了LLM-Fingerprint(模型指紋技術),與阿里通義千問Qwen-2.5 14B模型的注意力參數分布存在高度相似性,平均相關性達0.927(接近完全一致的1.0),顯著超出模型間正常差異范圍,并指向“非獨立開發”的可能性。
作者自稱是哥斯達黎加大學的韓國學生。他在文中指出,盤古開源代碼文件中發現標注“Copyright 2024 The Qwen team, Alibaba Group”,被質疑復制阿里代碼時未刪除版權聲明。
![]()
這個哥斯達黎加大學的韓國學生的身份,發的這篇文章,確實很有意思。
然后就是,有自稱是華為盤古大模型內部人士的人在知乎上發了一貼,網站在這里:
https://zhuanlan.zhihu.com/p/1925163876938391923
總結一下省流版就是真正干活的人用910訓練很辛苦,認認真真做事情。但是總有一些走捷徑的人喜歡套殼,并且還忽悠住了領導,讓真正做事情的人毫無前途,做無用功。
至于這個帖子里面說的是真是假,我也不知道。
最后,華為諾亞方舟實驗室7月5日發布了一個聲明, 全文如下:
![]()
盤古團隊自己的模型部分基礎組件代碼參考了業界開源實踐,涉及其他大模型的部分開源代碼都遵循了開源許可證的要求,在開源代碼文件中清晰標注出來了。
總而言之,就是確實有參考,而且確實也把參考了的都標注出來了。至于參考的是不是通義千問,標注出來的是不是通義千問的源代碼,就沒具體說了。
盤古大模型到底是不是套殼了通義千問這個問題,聲明并沒有直接給出是,或者否的回答。
因此你要問我的話,負責一點回答,我也只能說,我也不知道。
要是大數據,我大概率還能做個自己的判斷。到了大模型,那我真的是不懂。隔行如隔山。看不懂才是常態。
但是知乎這篇文章挺有意思的,不管說的是真的,還是假的,其實都挺有意思的。
我說挺有意思的,是這里面的某些關于華為的描述,包括領導的做事方式的描述,還是很有華為那股味道的。
一個從來都沒在華為干過的人,要想寫出這股味道來,還是頗有難度的。一般人寫不出來。
所以,雖然我無法判斷真假,但是我想不管真的還是假的,似乎,寫這篇文章的人,都是對華為內部很了解的人。
所以這篇文章的內容就很有意思了。
這篇文章里面對昇騰910的描述也同樣就很有意思了。有些時候,我們還是要相信華為的硬件研發能力,910畢竟還是國產卡里能打的。
至于是不是套殼,有沒有抄襲,這些事情,有的時候不僅僅很難界定邊界在哪里,而且也很難界定到底做了還是沒做了。
在這個情況下,我覺得不下結論,也是一種態度。
但是,我有個問題一直想問,為什么DeepSeek一開源,DeepSeek團隊的論文一公布,連Meta都要連夜組織好幾個小組研讀,破解,而盤古大模型一開源,我好像沒看到這種動向。
可能,這盤古大模型開源以后,全世界的反應,本身,也就代表了一種投票吧。
推薦飛總知識星球,在私域場合里暢所欲言,聊聊職場發展的事情,和飛總提問交流,這么低的價格不會一直保留,機會難得,一定不要錯過這個的機會。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.