![]()
編輯|Panda、陳陳
「21 世紀什么最貴?人才!」這句 20 多年前的電影臺詞,如今已在 AI 領域迎來了具象化。
![]()
這兩天,一篇名為《「臥底」Kimi 的 100 小時》的《人物》特稿在科技圈刷屏。報道中提到,這家成立僅 3 年、估值超 1200 億元人民幣的創業公司里,平均年齡不到 30 歲的 300 多名員工,每人肩上扛著近 4 億估值。這里沒有部門墻,沒有職級,沒有 KPI,甚至 17 歲的高中實習生都能以第一作者身份發表讓硅谷大佬盛贊的論文。很顯然,Kimi 正在或者說已經構建了一個高密度的天才集群。
而就在今天,Kimi 又發布的一項名為「穿越計劃」的招募動作,將這場天才爭奪戰的籌碼推向了新高。
![]()
這項計劃專門面向在校學生展開。核心規則非常直接:候選人在 2026 年入職實習時,公司即按照當期估值提前授予并鎖定期權股數。這意味著,這些年輕的技術大腦在實驗室階段,就能提前拿到分享公司估值躍遷的門票,以高彈性的增長紅利對抗傳統的確定性現金流。
作為一家成立僅 3 年的初創 AI Native 企業,Kimi 在現今的超高速擴張期發布這樣的人才招募計劃,無疑向市場釋放了一個清晰的信號:AI 時代的紅利正直接向頂尖技術大腦傾斜,頂級人才完全能夠跳出傳統的職場攀爬路徑,直接與頂級 VC 共享同一張跨越周期的價值門票。
Kimi 憑什么值得賭?
如果你正是一位 00 后乃至 05 后的 AI 技術人才,你可能會問:期權的價值,終究取決于公司能漲到哪里。Kimi,值得押注嗎?我們先來看幾個數字。
過去三年,Kimi 估值增長接近 4 倍,跨越 180 億美元門檻,成為國內成長最快的 AI 公司。字節跳動當年跨越百億美元估值用了 4 年多,拼多多用了 3 年多,Kimi 用了不到 3 年。
這不是簡單的成長快,在這個互聯網紅利還在,市場空間相對清晰的背景下,Kimi 面對的是一個更不確定、競爭更激烈、技術迭代更快的 AI 時代。能在這樣的環境里跑出這個速度,背后需要的不只是運氣。更是對技術路徑、產品節奏與資源調度的綜合把控。
2023 年 10 月,公司成立不久,Kimi 便發布了支持 20 萬上下文的模型,在當時刷新了全球大語言模型的上下文長度紀錄。2024 年 3 月,Kimi 宣布支持高達 200 萬字的超長無損上下文,標志著模型可以一次性處理數百萬字的法律卷宗、醫療記錄或大型代碼庫。
2025 年,Kimi 提出新的混合線性注意力架構 —— Kimi Linear,在業界引發廣泛關注與討論,被視為長上下文與高效推理方向上的關鍵技術突破。
![]()
Kimi Linear 架構示意圖
隨后,開源模型 Kimi K2 Thinking 發布,再次引爆社區討論。該模型在多項核心能力上對標并超越 GPT-5、Claude Sonnet 4.5 等主流閉源模型,引發技術圈與開發者社區的密集關注。HuggingFace 聯合創始人 Thomas Wolf 將其稱為又一次 DeepSeek 時刻,這一評價迅速在業內傳播,進一步放大了其影響力。
自今年以來,Kimi 明顯進入加速期。1 月發布的 Kimi K2.5,在多模態能力上進一步擴展,首次具備視頻理解能力,同時 Coding 能力也顯著提升,并延續開源策略。
從長上下文,到架構創新,再到開源模型的持續迭代,一條清晰的路徑正在浮現,Kimi 并不是在單點追求更強的模型,而是在系統性推進一套能夠理解、推理并執行復雜任務的通用智能能力。
這也是 Kimi 的初衷,專注于通用人工智能(AGI)的研發
而當這條路徑逐漸展開,其價值也不再只體現在技術指標上。對個體而言,它意味著兩種稀缺條件的疊加:一是持續加碼的資源與投入,為高強度試錯提供空間;二是不斷被重寫的技術前沿,讓關鍵問題仍然處于開放狀態。
也正因此,對于那些選擇進入其中的工程師來說,真正的問題早已不只是能獲得多少回報,而是是否有機會站在這一輪智能躍遷的起點,參與塑造它的方向。
除了錢,還有探索前沿的機會和資源
成功入選「穿越計劃」的天才,在拿到這把高昂的鑰匙后,將要面對怎樣的技術版圖?
在近期的 GTC 2026 和中關村論壇上,Kimi 創始人楊植麟給出了清晰的解答。大模型研發的本質是將能源轉化為智能,而新一代的 Builder 們,正致力于在核心維度上全方位突破智能的上限。
為了讓模型勝任前所未有的復雜任務,Kimi 正在三個基礎方向上進行硬核的探索。
![]()
楊植麟 GTC 2026 演講截圖
首先是Token 效率的極限壓榨。在高質量訓練數據總量有限的前提下,Kimi 團隊引入了分布式 Muon 優化器與 QK 裁剪技術。這使得模型能夠在相同參數和訓練數據量下,獲得近乎 2 倍的效率提升。
其次是上下文長度的革命。傳統的全注意力機制面臨著計算復雜度隨長度平方增長的死結。通過引入改進的線性注意力機制 Kimi Linear 架構,他們成功讓模型在處理高達 100 萬 Token 的解碼任務時依然保持極致的高效。
最后是極具潛力的智能體集群(Agent Swarms)。在訓練這類能夠自行分解任務、協同工作的復雜多智能體系統時,為了防止模型在執行復雜任務時退化為單智能體模式的「串行坍縮」或陷入「虛假并行」,Kimi 放棄了人工設計工作流的傳統范式,轉而通過大規模強化學習系統,引入實例化獎勵、完成獎勵和結果獎勵三種層次的信號,讓模型自主學會有效的并行化策略與任務編排。
除此以外,新人們還將直接參與到下一代深度信息傳遞機制的探索中。例如近期引起學術界轟動的「注意力殘差」(Attention Residuals)架構,將原本在序列維度發揮作用的注意力機制做了一次 90 度的旋轉,創造性地應用到了深度維度上。
![]()
Attention Residuals 概覽:(a) 標準殘差: 采用均勻加法累加的傳統殘差連接方式。(b) 全量注意力殘差: 每一層都通過學習到的注意力權重,有選擇地聚合之前所有層的輸出。(c) 塊注意力殘差: 將各層劃分為若干個「塊」,將內存開銷從 O (Ld) 降低至 O (Nd)。
在 Kimi,每一位探索者都能獲得無限的 Token 資源。這里不存在流水線式的枯燥執行,所有人都是構建最前沿 AGI 模型的 Builder。這種充滿未知與挑戰的技術縱深,正是那些頂尖大腦夢寐以求的造物者游樂場。
極高的自由度與論文發布權,實習生也能擁有
除了豐富的回報和資源,加入 Kimi 的人才也能獲得極高的研究自由與論文發布權。這一點從《Attention Residuals》那位 17 歲高中生一作陳廣宇的故事便能看出。
![]()
據了解,陳廣宇一年前才剛剛開始了解大模型,如今卻在 Kimi 團隊中,與知名算法大神蘇劍林和張宇并列成為核心架構「注意力殘差」論文的共同一作。這篇將注意力機制在深度維度進行重構的硬核論文,甚至引發了埃隆?馬斯克等硅谷頂級圈層的關注與嘆服。陳廣宇從北京的黑客松起步,歷經硅谷高強度實習,最終被 Kimi 在底層注意力機制上的開源探索所吸引而加入。在 Kimi,他跳過了傳統大廠實習生的邊緣打雜階段,直接觸碰最底層的核心代碼與頂級算力資源,將純粹的技術興趣轉化為重塑大模型架構的真實能力。
這個故事也能讓我們看見 Kimi 與傳統大廠的不同:在傳統大型互聯網企業的科層制結構中,年輕的技術天才往往容易淪為高薪流水線上的邊緣齒輪。Kimi 則展現出了典型的AI Native公司特質。
這家擁有 300 多名員工、平均年齡不到 30 歲的團隊,內部甚至沒有設立傳統的部門和職級。每個人都可以通過直接溝通來推動工作,形成了一個極致扁平、低熵運行的「天才集群」(Genius Swarm)
在這里,年輕的實習生擁有極高的研究自由度,能夠直接觸碰最前沿的核心決策,并在頂級學術界發聲。
2026 年,頂尖研究員的絕對買方市場
隨著 2026 年 AI 競爭向更深層次的智能上限突破推進,從 OpenClaw 等開源框架的繁榮到各類智能體集群的落地,頂尖技術建設者在行業內已經擁有了空前的話語權。
![]()
面對這種絕對的買方市場,像 Kimi 這樣處于高倍速增長通道的 AI 獨角獸,用提前鎖定估值的方式向新一代天才發出了最硬核的邀請。這是一場人才爭奪戰,更是宣告了 AGI 時代的入場券已經不再為頂級資本所獨享。
最頂尖的技術大腦,完全可以憑借自身的才華,在這個偉大的技術周期里,贏取穿越時代周期的豐厚回報。
申請方式及更多詳情請訪問 Kimi 官方公告:《和 Kimi 一起投身 AGI,穿越成長周期》。
文章鏈接:https://mp.weixin.qq.com/s?__biz=Mzk0NDU1MDkyNg==&mid=2247488323&idx=1&sn=0d38d4131b91b242301ef277a096d65c&scene=21&poc_token=HN6Pz2mjeLlEOT_k0cEFWtIQCFHs0lFmSO1VDH1u
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.