量化方面,有四大天王幻方、九坤、明汯、靈均
幻方做了 DeepSeek
26 年元旦期間,九坤也出牌了IQuest-Coder-V1-40B-Instruct
40B 參數,專攻代碼生成
![]()
IQuest-Coder
但...這個模型,帶來了一點爭議
發布時,SWE Verified 得分是 81.4%,超過 Sonnet 4.5 的 77.2%
但當天,社區就發現評估有問題,經過修正后為 76.2%
模型
先看規格,40B/128K/79.6 GB (BF16)
![]()
模型一覽
以及,IQuest-Coder 系列有三個變體:Instruct/Thinking/Loop
別的沒啥,不過有個值得說的 Code-Flow 訓練
IQuest-Coder 從代碼倉庫的演化、commit和重構軌跡中學習,把代碼當時間序列數據
思路....頗有搞量化的味道
爭議
發布當天,GitHub 上就有人開了個 Issue:Reward Hacking of SWE-Bench
大致就是:這玩意兒,數據有問題
![]()
GitHub Issue 截圖,社區發現評估漏洞
問題出在哪:
測試時沒清理 .git/ 目錄,導致模型的 Agent 可以通過 git checkout 訪問包含修復方案的未來 commit
簡單說就是,模型在考試時,能看到答案
SWE-Bench 官方維護者確認了這個問題,大約 24.4%(122/500)的測試用例受影響
IQuest 團隊隨后重新評估,公開更新了結果:
基準測試
原始得分
修正得分
SWE-Bench Verified
81.4%
76.2%
BigCodeBench
49.9%
49.9%
LiveCodeBench v6
81.1%
81.1%
團隊公開了完整的 trajectory 數據
從處理方式看,更像是無意的評估疏漏,不是刻意作弊
修正后的 76.2% 依然不錯,對于一個 40B 參數的開源模型來說
九坤
九坤投資,2012 年成立,總部北京
極競天數為九,厚德載物為坤
資產管理規模 6000-7000 億人民幣,員工 300 多人,是量化私募里規模最大的,兩個核心創始人,分別是王琛和姚齊聰,分別來自清北
王琛/CEO
清華數學物理本科、計算機博士,師從姚期智,曾在 Millennium Management 做研究員
姚齊聰/CTO
北大數學本科、金融數學碩士,同樣出身 Millennium
兩人在華爾街相識,2010-2012 年回國創業,趕上了中國股指期貨推出的窗口期
![]()
王琛(左), 姚齊聰(右)
目前,九坤超過 60% 的交易已經由 AI 算法驅動
2025 年正式成立至知創新研究院(IQuest Research),獨立于量化投研體系運營,專注大模型、代碼智能、醫療 AI、數學、生物等前沿領域
話說回來
幻方做了 DeepSeek,九坤做了 IQuest
量化四大天王里,兩家已入場
期待看后續,比如...明汯、靈均,以及更多?
2026 的第一周,風云迭起
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.