![]()
新智元報道
編輯:元宇
【新智元導讀】OpenAI直接殺進萬億美元的制藥賽道,最新發布的首款生命科學模型系列GPT-Rosalind,RNA預測任務碾壓95%人類專家,不卷AlphaFold,要做科學家的AI搭擋。
這一次,OpenAI瞄準了一個10到15年的生意。
就在昨天,OpenAI扔出了一個跟以往畫風完全不同的模型:GPT-Rosalind。
這個名字取自Rosalind Franklin,就是那位用X射線晶體學揭示了DNA雙螺旋結構的科學家。
![]()
Rosalind Franklin(1920-1958),英國物理化學家,其X射線晶體學研究為揭示DNA雙螺旋結構奠定了關鍵基礎。OpenAI以她命名首款生命科學模型。
OpenAI用自己首個生命科學專用推理模型,直接沖進了生物學、藥物發現和轉化醫學的腹地。
![]()
在與基因治療公司Dyno Therapeutics的合作測試中,這個模型在RNA序列功能預測任務上,超過了95%的人類領域專家。
在美國,一款新藥從靶點發現到拿到監管批準,平均要10到15年。
OpenAI想用AI把這個流程的早期階段大幅壓縮。
靶點發現、假設生成、實驗規劃、文獻合成,這些傳統上科學家需要在海量論文、數據庫和實驗數據之間反復橫跳的工作,Rosalind想通過AI一手串起來。
不是聊天機器人
是實驗室搭檔
GPT-Rosalind不是GPT-5.4的升級版。
它是OpenAI「生命科學模型系列」的首款產品,專門針對科研工作流做了優化,核心能力覆蓋五個方向:
化學反應機理推理、蛋白質結構與突變效應理解、基因組學解讀、實驗規劃,以及海量文獻的綜合分析。
但模型本身只是一半。
OpenAI還同步推出了一個Life Sciences Research插件。
插件代碼/包已在GitHub公開,能連接50多個公共多組學數據庫和科學工具,覆蓋人體遺傳學、功能基因組學、蛋白質結構、生物化學、臨床證據等領域。
![]()
https://github.com/openai/plugins/tree/main/plugins/life-science-research
這樣一來,查PubMed、跑BLAST序列比對、調AlphaFold看蛋白結構、搜臨床試驗數據,都可能在一個對話窗口里完成。
想象一下一個藥物研發科學家的日常:
早上打開PubMed查文獻,切到UniProt看蛋白質數據,再跳到NCBI比對基因序列,中間還要在Excel里整理實驗數據,下午開組會匯報假設進展。一天下來,真正用于「思考」的時間可能不到三分之一。
GPT-Rosalind要做的事,是把這些散落在十幾個平臺上的工作流,壓縮到一個界面里完成。它不替你做實驗,但它能幫你在動手之前,把方向想得更清楚。
首批合作方都是清一色的業內巨頭:Amgen、Moderna、Allen Institute、Thermo Fisher Scientific。
不止如此,OpenAI還拉了麥肯錫、BCG、貝恩三大咨詢公司做落地伙伴,幫藥企識別場景、集成模型。
這架勢,已經不是在賣模型了,是在賣整套解決方案。
RNA預測
95%人類專家排在它后面
GPT-Rosalind到底有多強?
OpenAI拉了一個硬核外部合作方來驗證:Dyno Therapeutics,一家做AI基因治療的公司。
雙方用一批未公開、未被訓練數據污染的RNA序列做了兩項測試,對比基準是57位AI生物領域人類專家的歷史成績,結果顯示:
在RNA序列功能預測任務上,模型提交10次取最佳,成績超越了95%的人類領域專家;在序列生成任務上,約在84%的人類專家之上。
給一段RNA序列讓它判斷功能,它可能比絕大多數人類專家都要準;但讓它自己設計一段新序列,表現就稍遜一檔。
這恰好是當前AI在生命科學領域的真實邊界:理解分析強于創造設計。
當然,需要注意的是,這只是一個特定的RNA預測任務,不等于「AI已經全面超越生物學家」。
即便如此,這個成績在AI+生命科學領域仍然是最亮眼的數據之一。
![]()
從圖示結果看,GPT-Rosalind在五項生物與化學基準上均取得最高分,其中實驗設計與分析的提升幅度最大。
基準測試也同樣出色。
在BixBench這個圍繞真實生物信息學任務設計的基準上,Rosalind在已公開成績的模型中處于領先。
在LABBench2的11項任務中,有6項優于GPT-5.4,其中提升最大的是CloningQA,要求模型從零設計一個完整的分子克隆方案。
![]()
注意對比對象:GPT-5.4,在這些專業任務上被自家垂直模型反超。
這說明,通用模型在專業領域確實有天花板,可能不如一些專門優化的垂直模型好使。
所有這些成績都來自特定基準測試,并非來自真實的臨床管線。從跑分到真正縮短10到15年的新藥周期,中間還有一條巨大的鴻溝。
顯微鏡和研究助手
說到生命科學AI,很多人第一個想到的名字是Google DeepMind的AlphaFold。
這是一個繞不開的問題,熟悉這一領域的人很容易拿兩者比。
那Rosalind和AlphaFold什么關系?兩者完全不同層級的工具。
AlphaFold是一個計算引擎。
它只把一件事做到極致:輸入氨基酸序列,輸出蛋白質3D結構,它解決的是困擾結構生物學幾十年的「蛋白質折疊問題」。
AlphaFold數據庫里已經有超過2億個結構預測,AlphaFold 3進一步擴展到蛋白-配體、蛋白-核酸等復合物的相互作用預測。
![]()
https://alphafold.ebi.ac.uk/?pStoreID=techsoup%2F1000&utm_source=chatgpt.com
GPT-Rosalind則更像是一個研究伙伴。
它可以幫你做文獻綜合、假設生成、實驗規劃、序列功能解讀、工具調用。
如果把AlphaFold比作一臺超級顯微鏡,Rosalind是坐在顯微鏡旁邊幫你分析數據、查文獻、設計下一步實驗的研究助手。
因此,兩者的關系不是誰取代誰,更像是一種互補關系,也代表了兩家公司在「AI+科學」上不同的路線:
AlphaFold打造了生命科學的「超級顯微鏡」,在計算環節「單點爆破」,解決了一個諾獎級的問題;而Rosalind試圖成為調度這一切的「大腦」,從橫向的「工作流」包抄,想重塑整個實驗室的生產力。
誰能夠跑得更遠,現在下結論還太早。
可以肯定的是,當這兩種力量在生命科學領域交匯時,那個人類科學發現的奇點離我們就更近了。
參考資料:
https://openai.com/index/introducing-gpt-rosalind/
https://x.com/OpenAI/status/2044861690911850863?s=20
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.