文 | 金寧
這是一場科技巨頭間的“真金白銀”較量,也是AI大模型能力的殘酷實戰檢驗。
近日,美國人工智能研究實驗室nof1.ai發起了一場引人注目的實盤交易挑戰——“Alpha Arena”(阿爾法競技場)。他們向中美六個頂尖大模型,每家提供了10,000美元的真實資金,在永續合約市場中進行實盤交易。
比賽的核心目標,不是簡單地追求最高收益,而是“最大化風險調整后的收益”。這場為期數日的鏖戰,不僅測試了AI的“財商”,更暴露了它們在面對真實市場時的性格、習慣與缺陷。
截至北京時間10月23日上午,戰績分化已異常明顯。阿里Qwen憑借一場“快準狠”的逆襲,以11,252.34美元的總賬戶價值,強勢超越此前的冠軍DeepSeek,首奪收益榜第一!而OpenAI的GPT-5,則在虧損的大道上一路狂奔,繼續墊底。
![]()
截止至10月23日下午18:00
下面,我們將結合曲線圖和交易數據,深入解析這六大AI模型的“投資人設”和操作習慣。
1、六大AI模型的“投資人設”大曝光
1. Qwen3-Max(阿里千問):出奇制勝的大心臟,單車變摩托(11,252.34美元 / +12.52%)
曲線特征: 波動劇烈,但在10月22日傍晚異軍突起,快速拉升,并在23日穩定在冠軍位置。
投資人設: “果斷的趨勢捕手”。Qwen3相對關注主流標的,交易頻次適中,且相對重視回撤。它最大的特點是善于把握瞬息萬變的趨勢,正所謂:“猶豫就會敗北!”。它在最近一次交易中,果斷出手,一把“梭哈”(重倉)占據第一。其成功逆襲的關鍵,正是因為敏銳的感知到了市場風向,并“快準狠”地把握機會。
2. DeepSeek V3.1 Chat(深度求索):早期王者,佛系長線(10,868.84美元 / +8.69%)
曲線特征: 早期領跑者,曲線在初期達到高峰,但隨后被Qwen反超,整體波動相對平穩,依然保持正收益。
投資人設: “耐心持有主義者”。DeepSeek是六大模型中唯二保持正收益的國產大模型之一。它偏好長線交易,交易次數最低,僅為9次,主打“以不變應萬變”。它曾在10月20日以超40%收益率領跑,三天暴賺36%,顯示出極強的早期方向判斷力。
3. Grok 4(xAI):DeepSeek的影子,錯失良機(8,427.12美元 / -15.73%)
曲線特征: 走勢與DeepSeek非常相似,但在關鍵時刻未能跟上市場變化,目前處于虧損狀態。
投資人設: “跟隨者,但不夠精準”。作為DeepSeek的“影子同伴”,在前期展現出相當不錯的收益,但投資市場瞬息萬變,一次決策失誤就可能導致后續持續虧損,未能守住正收益。
4. Claude 4.5 Sonnet(Anthropic):賺一票就跑,但跑不贏虧損(8,119.46美元 / -18.81%)
曲線特征: 波動較大,有過短暫的盈利高峰,但隨后快速回落至虧損區間。
投資人設: “靠運氣的大單交易者”。Claude總共進行了12次交易,其中只有2次是“大賺”的,它保持了最多的一次盈利記錄(超過1800美元盈利),但其余交易均在虧損,小虧和大虧抵消了其僅有的兩次暴賺。
5. Gemini 2.5 Pro(谷歌):高頻AI“散戶”,小賺不抵大虧(4,444.67美元 / -55.55%)
曲線特征: 持續下行趨勢,虧損尤為明顯,但波動性不如GPT-5極端20。
投資人設: “高頻短線愛好者”。Gemini 2.5偏好短線交易,在短短6天內交易了102次,交易頻次最高。雖然其勝率較高(26.7%),排名第二,但小賺不抵大虧,保持了六大模型中-750.02的單筆大虧記錄,目前虧損已超5500美元。
6. GPT-5(OpenAI):絕對反指,賭徒式爆倉(3,119.38美元 / -68.81%)
曲線特征: 斷崖式下跌,毫無回升跡象,持續處于底部,成為本屆比賽的“地板王”。
投資人設: “市場賭徒”。GPT-5是本屆比賽的**“絕對反指”,在虧損的大道上一路狂奔,Win Rate(勝率)僅為4.5%,倒數第一。其行為類似于賭徒,過度交易和高杠桿導致兩次爆倉,重創本金。截至當前,在43次交易中,盈利屈指可數,虧損已超6800美元。
2、“Alpha Arena”的四大啟示錄
這場實盤投資賽的戰績分化,為我們揭示了AI大模型在金融領域的應用現狀:
1、國產AI在金融實戰中優勢明顯:截至目前,六大AI模型中唯二仍保持正收益的,均為國產大模型(Qwen和DeepSeek)25。這表明在量化交易和風險管理方面,國產AI模型展現出更強的競爭力。
2、高頻不等于高收益:像Gemini 2.5這樣高頻交易(102次)的模型,雖然勝率不低,但一次重大的方向性錯誤足以清空所有微薄利潤,最終深陷虧損,扮演了典型的AI“散戶”角色。
3、高風險高回報的魔力與陷阱:Qwen通過一次大膽的“梭哈”實現逆襲,證明了在短期內“果斷出擊”是超越競爭對手的關鍵。但反觀GPT-5,其賭徒式的高杠桿和過度交易,則直接導致了災難性的爆倉結局。
4、AI投資的“性格”和“人設”:這場比賽生動地展示了不同AI模型“人格化”的投資風格——Qwen的激進趨勢捕捉,DeepSeek的穩健長線持有,以及GPT-5的無腦反指。這也提醒我們,AI模型的最終表現,高度依賴于其底層策略、風險偏好以及提示詞(Prompt)工程的設置。
不過業界認為,量化公司采用AI或進行過類似嘗試已經不在少數,而這輪比賽結果可能是某些模型的風險偏好正好適配了當前的市場行情,從而排名靠前,并不代表所有市場行情都適用,不能作為散戶的投資意見,
最終,哪一個模型能真正“最大化風險調整后的收益”?比賽將持續到美國東部時間11月3日下午5時。這場AI之間的“世紀投資大戰”的結果,值得所有投資者和科技觀察者持續關注。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.