![]()
一場前所未有的全球直播,將世界六大頂尖AI大模型拉到同一個“競技場”。
10月18日起,美國一個名為Nof1的AI研究機構發起了一場名為“Alpha Arena”的實驗。
他們分別給中美AI大模型代表各1萬美元,讓它們在數字貨幣交易市場自主投資,不得人為干預,并對AI的操作方法、收益虧損進行24小時的直播。
相比于過去AI大模型在模擬盤上“操盤”,這是全球首次公開的、真金白銀的AI投資競賽。
實戰證明,中國隊果然更擅長數學。6名參與者包括阿里的Qwen3 Max、DeepSeek V3.1、OpenAI的GPT-5、谷歌的Gemini 2.5 Pro、Anthropic的Claude 4.5,以及馬斯克xAI的Grok 4。一周后,只有中國的AI大模型Qwen和DeepSeek穩穩居于收益曲線圖的上方。
![]()
2025年11月2日的數據顯示,DeepSeek的收益排名第一
11月4日,持續兩周多的AI比賽終于落下帷幕。阿里的Qwen在最后時刻反超DeepSeek,獲得理財冠軍。DeepSeek位居第二,而GPT-5墊底。
![]()
阿里的Qwen獲得冠軍,DeepSeek位居第二,而GPT-5墊底
連項目發起人、迷戀金融博弈論的Jay A Zhang都曾在社交媒體上感嘆:“Qwen用20倍杠桿全倉比特幣——手法強硬、直白卻高效。”他接著評價,“(第二名的)DeepSeek構建了精細的投資組合,持續保持20%~30%的穩定回報率。”
AI的同場競技讓許多普通人萌生想法:利用這些看上去無所不能的AI大模型,讓它們幫人炒股、投資,取得收益。但多位金融圈人士、專家卻依然對AI投資表示謹慎。
“(這次)比賽的隨機性很大。”一位金融科技圈的學者告訴南風窗,“比起關注結果,(這次)比賽應該讓更多人思考,為什么現在AI大模型在投資領域還不成熟。”
AI“諸神之戰”
學術圈里,關于“AI+金融”的測試很多,但是真正出圈的卻很少。10月的全球直播,點燃了許多人對AI投資的熱情,也驗證了許多人過去的猜想:DeepSeek果然出自做量化基金的母公司之手。
自10月18日開盤第二天開始,往后的日子里,DeepSeek的投資收益一直是正收益。第四天(10月22日)早晨,DeepSeek的收入就達到了1.5萬美元,遠遠將OpenAI和谷歌的大模型甩在身后。10月27日,DeepSeek再接再厲,一路直沖,持有的加密貨幣價值從1.3萬美元暴漲至2.1萬多美元,實現了本金翻倍。
達到這些成就時,DeepSeek還在聊天框留下了交易思路:“我目前持有的比特幣、以太幣、狗狗幣、瑞波幣全部倉位均維持盈利區間內;我還分析了幣安幣,目前不適合購入。”
![]()
DeepSeek的收益變化和反饋記錄/來源:nof1.ai
從風格來看,DeepSeek的確表現了嚴謹的交易策略。在10月18日一開盤,它便全倉持有,策略簡單直接,不換手、不止損、不止盈。
相較之下,一直在倒數前二徘徊的Gemini 被網友調侃“交易風格神似散戶”。它的交易策略反復更改,一會做多一會做空,交易次數遠高于前幾名的模型。這在專業的金融交易里是“大忌”:交易費更高的同時,Gemini 越虧越多。
DeepSeek的表現在中美網友之間都引起廣泛討論。這主要是因為,以前,AI大模型往往都基于測試集進行性能測試,屬于仿真環境,而且,AI模型已經在訓練中刷過測試集,導致模型評分高但實際性能不如人意。而這次,AI被用在了真實、有大量參與者的金融市場里進行實時對比。這就好比將全球自稱具有自動駕駛能力的汽車都拉到一個場地參加大賽一樣,吸引眼球。
同樣在10月,香港大學黃超團隊發起了一次“AI Trader”的開源項目,以同樣的思路讓AI參與真金白銀的實戰。他們給DeepSeek V3.1、GPT-5、Claude-3.7、Gemini-2.5、Qwen3 Max各1萬美金,讓5個AI大模型到納斯達克前100名的科技股市場上進行投資。
團隊在設計時強調了AI投資的嚴格規則:每個AI模型,只有自己的賬戶資金和一套用來查股價、搜新聞、下單的交易工具,禁止提前對模型進行微調,禁止人員進行場外指導。
截至11月2日,在AI Trader項目上表現最好的依然是DeepSeek,收益率在13.04%。GPT-5以7.63%的收益率排名第三。而谷歌的Gemini依然墊底。
![]()
在AI Trader項目中,表現最好的依然是DeepSeek
有媒體曾對此做出統計,在這幾個大模型中,DeepSeek屬于其中的穩定派,總交易次數50次。Gemini延續了上述測試里表現出的“急躁”風格,在過去20多天里總計交易了73次,成為唯一跑不過大盤的大模型。Qwen的風格也與上述的“Alpha Arena”實驗類似,交易次數很少,只交易了22次。但Qwen的“躺平”風格在投資科技美股上的表現一般。
有網友綜合上述AI大模型的表現,打趣道:“AI告訴人們,無論是急躁派還是佛性躺平派,都會引起虧損。真正成熟的交易員,需要理性和冷靜,看準機會迅速下單。”
必須說明的是,這次引發全球圍觀的“Alpha Arena”大賽,交易的不是股票和基金,而是六大加密貨幣,例如比特幣、以太幣、狗狗幣。交易的時長和需要分析的市場數據都很有限。
一位不愿意具名的金融科技界學者告訴南風窗,加密貨幣交易本身具有很大不確定性,隨機性也更強,不能代表傳統金融市場的規律。加上這次“比賽”的時間又很短,只有短短兩周的時間,更加劇了投資結果的隨機性。
![]()
“Alpha Arena”大賽中交易的不是股票和基金,而是六大加密貨幣,例如比特幣、以太幣、狗狗幣/來源:nof1.ai
香港科技大學(廣州)金融科技學域助理教授張超也對兩周的測試能否展現AI真實的能力表示懷疑。
他告訴南風窗,金融市場的波動性很大。一般而言,衡量一個金融策略的好壞,需要跨越一個經濟周期,經過回測才能判斷。
“一個完整的經濟周期可能長達數年。用一個足夠長的周期去檢驗策略,才能更有效地過濾掉市場噪聲和運氣成分。”張超說。
但是,對于渴望結論的普通人而言,以年為周期的回測等待時間實在是太長了。Jay A Zhang也抓住了眾人的心理,他“趁熱打鐵”,在社交媒體發預告:我們即將推出第二季AI投資比賽。“這一次,我們自己的模型和人類交易員也會加入。”
不夠強大的AI
AI很強大,金融市場很復雜——這是眾人都能感受到的現實。因此,“AI薦股”“AI炒股”的噱頭近一年在社交媒體上甚囂塵上。部分博主的文案精準地切中普通人的內心渴望:“AI炒股神器,讓你抓住時代機遇”“學會利用AI,讓炒股機遇最大化”。
可惜的是,多位金融圈人士告訴南風窗一致的結論:以當前的AI水準,人類還無法將自己不理解的領域全部交付給AI。
一個最直接的原因是,AI大模型當前無法真正理解復雜的金融市場。
金融市場的復雜性首先是源于多樣的交易者和交易行為。張超告訴南風窗,金融市場有各類投資者,他們的風險偏好性、情緒、投資目的都各不相同。以目前的技術,幾乎不可能構建一個模型能將各類投資者的偏好進行解碼、量化。
而且,金融市場具有信息差,這影響了各個交易者的投資行為。“我們必須承認,這是不完全透明的市場。”張超說,“有的人可能有內幕消息,或者對市場有自己的看法,可以解讀出不同的信號。這些都讓投資行為變得很復雜。”
![]()
AI大模型當前無法真正理解復雜的金融市場/圖源:pexels
更特殊的在于金融市場對數據隱私性的保護。相比于普通散戶需要經過券商等“中介”進行交易,金融市場還存在一些直接在交易平臺擁有席位、不經過券商中介的交易者。這被稱為“自營交易商”或“交易所會員”。
這些交易所會員讓金融市場里有不少“看不見的流動性”——比如冰山單、暗池等。張超解釋,它們并不直接顯示在掛單簿上,只有成交后才部分顯現,所以僅憑公開數據很難看全市場的買賣力量。
這導致了,開發者或研究者在給AI大模型“喂”數據時,很多交易信息是缺失的。真實金融世界的數據無法獲得,更別提讓AI理解整個金融市場和預測未來長期趨勢了。
另一個難點在于,金融市場存在很多“噪聲”。張超指出,在AI大模型尚未出現的時候,AI通過強化學習等算法,在分析金融數據、預測短期市場波動性上取得了進展。
但強化學習暴露出來的問題是,AI基于過往的大量歷史數據分析,試圖找到漲跌規律的過程中,出現了過擬合的現象。
過擬合,是指在用歷史數據的訓練階段時,AI表現得很好,總結出了許多看上去很有道理的規律。它像一個死記硬背的學生,在考試前將各類筆記和規律都歸納得很好,但一上了考場,遇到了新的場景或者試題時,AI卻失去了舉一反三的能力(也叫“泛化”能力)。考試結果一塌糊涂。
![]()
過擬合/圖源:analyticsvidhya
張超對南風窗解釋,AI出現“過擬合”,很大程度上要歸因于噪聲的存在。金融市場存在大量“噪聲交易者”。比如,他們有時心血來潮地買股票,在股票上漲或下跌時趕緊賣掉。“他們的決策往往出于一時沖動,而非嚴謹的分析。”張超說。這種交易者在人類眼里很常見,但AI卻無法理解,很容易將他們的數據過度與各類因素產生關聯,最終令AI找到了看似存在,實則由隨機性導致的虛假關聯。
華東師范大學上海人工智能金融學院金融大語言模型實驗室副主任汪俊霖,此前在多家世界頂級私募股權、對沖基金及投資銀行任職。他告訴南風窗,在AI大模型出現之前,深度學習等人工智能算法已被廣泛應用于量化投資機構,主要用于因子挖掘、組合優化與風險管理。
但這類算法在理解金融的本質上仍存在局限性。“它們主要用于分析結構化數據,即格式規范、可量化的信息。但對商業模式、競爭格局、公司治理等非量化的關鍵要素的理解能力有限,因而難以觸及金融分析邏輯的本質。”
而在以ChatGPT為代表的生成式AI大模型興起后,新的問題也隨之而來。汪俊霖指出,AI大模型的幻覺率普遍很高,容易“一本正經地胡說八道”,這與重視準確、不容忍出錯的金融市場天然相悖。
![]()
在以ChatGPT為代表的生成式AI大模型興起后,新的問題也隨之而來/圖源:unsplash
與此同時,AI算法還存在“黑箱”——人多數時候無法解釋AI算法的決策過程。但在金融領域,透明度被認為是非常重要的一個因素。監管機構維持金融市場穩定的重要步驟之一是了解金融市場的運作過程。
一位有10年經驗的金融機構從業者告訴南風窗,為了防范系統性風險的出現,我國金融市場尤其強調合規。按照規定,金融機構人員在推薦有關股票或者投資建議時,必須先行取得中國證監會授予的證券投資咨詢業務資格證書或證券投資咨詢人員執業證書。
來自監管的要求令AI大模型在金融市場的應用,取得不如多數人預期的進展。該金融從業者表示,即使在機構內部,AI當前也無法代替人進行決策,構成投資建議。相比之下,當前AI大模型更擅長智能客服、數字人等等業務,在涉及語言、對話的工作上發揮長處。
光明未來
專業人士對AI現有能力的審慎,并不預示著AI+金融的未來發展消極。相反,上述金融圈從業者和研究者都認為,長期來看,隨著AI架構和算法的完善,AI將對金融市場展現出更強大的理解力和決策水平。
“目前來看,我們只用到了AI大模型能力的冰山一角。”汪俊霖說,“AI大模型在金融領域的能力還沒被(人類)完全發揮出來。”
頂尖機構OpenAI最近釋放了擁抱AI+金融業的積極信號。據彭博社10月22日報道,OpenAI已秘密聘請超過100名華爾街的投資家,協助其AI系統掌握財務建模技能。
據報道,他們把這個秘密行動命名為“水星(Mercury)”,主要通過外包形式,讓各個頂尖金融專家撰寫提示詞并訓練財務模型。OpenAI還在內部文件里寫下了目標:取代行業里初級銀行從業者承擔的大量重復性工作。
馬斯克主導的xAI也在2025年重點投注了金融方向。今年夏季,馬斯克的xAI預告即將憋出的大招——Grok Finance。他們聲稱,即將發布的這款AI金融分析工具,不僅能實時解讀股市數據,還能結合社交情緒和新聞熱點,為投資者提供前所未有的決策支持。
![]()
Grok Finance首頁展示的平臺特點
作為金融大語言模型實驗室副主任,汪俊霖介紹,AI大模型在金融市場展現出的潛力在于處理非結構化數據的能力上。AI大模型可以分析文字、圖片、視頻等各種形式的數據。這讓他和團隊相信,通過多種形式的數據“喂養”,AI大模型終將具備對企業進行基本面分析的能力,從而可以評估企業的內在價值,甚至評估發展趨勢。
他的團隊正在研發的金融大模型,于一年前采取了與OpenAI的水星計劃相似的路徑。在給AI提供大量數據的基礎上,他們提煉了資深金融人士在分析與決策中的思路,將隱性的認知轉化為逾10萬條思維鏈語料,融入模型訓練中。
由此,汪俊霖介紹,金融大模型可以逐步形成對金融邏輯的內在理解與演繹能力,以資深分析師的思路開展工作,并作為智能員工上崗。
AI業內的另一個主流方向是將強化學習與AI大模型進行結合。強化學習擅長在海量高質量數據中,通過獎勵函數,不斷試錯,從而找到最優的策略。而AI大模型擅長生成語言,根據上一個詞預測下一個詞,在理解財報、情感分析上具有優勢。
![]()
圖源:unsplash
張超告訴南風窗,要想讓強化學習在金融市場上發揮更大作用,關鍵是在訓練AI時,建立高仿真的環境,模擬出真實的金融市場。
他以訓練自動駕駛汽車為例,部署在汽車的AI在學開車時,要通過大量人類在真實環境的駕駛行為的數據來進行訓練。而訓練金融類AI也應同理,應給AI模擬出不同交易者在同一個金融市場里的波動、變化和行為。張超喜歡用游戲舉例,他認為,這就像游戲里的“沙盤推演”一樣,不同玩家都在場上對弈,模擬真實的戰斗機制。只有這樣,AI才有辦法理解金融市場里的復雜“玩家”。
“長期來看,以大模型為代表的AI,在預測(金融市場)上至少能達到普通人的水平。”張超說,“我相信如果我們有足夠多的金融數據訓練,它一定可以學到人的一些行為。而且,AI在處理海量數據上要比人腦更強——它更容易發現事物之間的相關性。”
AI的發展還是要回到理解普通“散戶”身上。那么,在AI飛速發展下,普通人該如何應用AI處理數據的能力,助力資產配置呢?
![]()
圖源:unsplash
張超表示:“我建議普通人當前切勿盲目迷信大模型進行投資。它可以作為一個強大的信息整合與摘要工具。但涉及最終的買賣決策,目前不應完全交由大模型。”
連AI炒幣大賽的“始作俑者”Jay A Zhang也在社交媒體上發出了“提示”。他承認,他發起的比賽在專業角度上并不嚴謹,無法科學地衡量AI大模型在投資上的真實水平。
但圍觀AI投資直播期間,他不忘寫下些哲理性的總結。“市場是個零和游戲。如果你發現一個策略總是虧損,那么它和發現掙錢策略一樣寶貴。你只需要反其道行之。”
文中配圖部分來源于網絡
本文首發于《南風窗》雜志第23期
作者 |朱秋雨
編輯 | 向 現
值班主編 | 張來
排版 | 菲菲
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.