國際頂級期刊《自然》雜志將梁文鋒評為2025“Nature’s 10”之一,因為他和他的公司 DeepSeek 通過推出 R1 推理大模型,對全球人工智能格局產生了巨大沖擊
具體獲評原因:
2025 年 1 月,DeepSeek 突然發布性能強、成本卻極低的 R1 模型,震撼全球。它不僅在數學、編程等復雜任務上表現出色,還率先開放模型權重,讓全球研究者免費獲取和改造,推動了中美更多公司跟進開放模式。其訓練成本遠低于美國公司,如 Meta 的 Llama 3 405B 成本是其 10 倍以上。
更重要的是,DeepSeek 在 9 月公開了 R1 的完整訓練細節,使其成為首個通過同行評審的大型推理模型,為行業提供了清晰可復制的訓練范式,被認為“教會了世界如何訓練推理模型”。
梁文鋒出身廣東農村,本科碩士就讀浙江大學,早年熱衷開發視頻追蹤算法,后來轉向金融,并于 2023 年利用自己積累的資金創辦 DeepSeek。他提前十年大量購買 NVIDIA GPU,為之后的模型突破奠定基礎。
DeepSeek 的企業文化強調潛力和扁平化管理,甚至有中學生成為 R1 論文作者。公司堅持解決基礎難題而非商業化優先,這在行業內獲得高度評價。
在中國,DeepSeek 模型已滲透日常生活,從政府熱線到微信生態,用戶規模達數千萬。它也被視為中國從模仿者向創新者轉變的象征。
外界正關注 DeepSeek 下一代推理模型 R2,盡管因硬件與數據問題被傳延遲,但團隊強調將繼續堅持開源路線
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.