html ![]()
年終實(shí)驗(yàn):大型語言模型如何看待人工智能在長(zhǎng)壽領(lǐng)域的領(lǐng)導(dǎo)者
年末將至,我們?cè)絹碓诫y以忽視大型語言模型對(duì)我們所見、所讀和所記憶內(nèi)容的影響。它們總結(jié)研究、挖掘?qū)<摇⑦M(jìn)行相關(guān)性排名,并且越來越多地充當(dāng)流動(dòng)、爭(zhēng)議和快速發(fā)展的領(lǐng)域中的權(quán)威裁判。長(zhǎng)壽科學(xué)——尤其是它與人工智能的交集——正好屬于這一類別。
因此,Longevity.Technology并沒有提供傳統(tǒng)的編輯排名,而是進(jìn)行了一項(xiàng)小實(shí)驗(yàn)。我們向多個(gè)大型語言模型提出了相同的結(jié)構(gòu)化問題:他們認(rèn)為在將人工智能應(yīng)用于人類長(zhǎng)壽和衰老研究方面,全球領(lǐng)先的個(gè)人是誰,以及他們認(rèn)為的下一個(gè)領(lǐng)導(dǎo)者層級(jí)。我們的目的是考察當(dāng)AI系統(tǒng)被要求綜合其影響領(lǐng)域的領(lǐng)導(dǎo)力時(shí),會(huì)出現(xiàn)什么樣的模式,而不是為了外包判斷。
實(shí)驗(yàn)是如何進(jìn)行的
我們向幾個(gè)廣泛使用的LLM獨(dú)立提出了相同的提示,包括ChatGPT、Gemini、Grok、DeepSeek、Claude和Perplexity。每個(gè)模型被要求識(shí)別一個(gè)個(gè)人的排名列表,并附上簡(jiǎn)要解釋,涉及AI方法論、轉(zhuǎn)化影響、生物標(biāo)志物、治療學(xué)和對(duì)該領(lǐng)域的影響。措辭保持不變。收集的回答沒有經(jīng)過迭代、推動(dòng)或后續(xù)提問。
接下來發(fā)生的事情更像是一個(gè)收斂的過程,而不是投票。我們并不尋求一致性,而是尋求一致性:不同模型在不同語料庫(kù)上訓(xùn)練并針對(duì)不同目標(biāo)優(yōu)化,但仍然得出相似的結(jié)論。
一個(gè)顯著的共識(shí)點(diǎn)
盡管在強(qiáng)調(diào)和框架上存在差異,但在每個(gè)測(cè)試的模型中,有一個(gè)名字以驚人的一致性出現(xiàn)。在每種情況下,推理遵循了類似的邏輯:不僅僅是出版量或可見性,而是AI在整個(gè)長(zhǎng)壽研究鏈條中的持續(xù)應(yīng)用——從生物標(biāo)志物開發(fā)、靶點(diǎn)發(fā)現(xiàn)到分子設(shè)計(jì)和臨床轉(zhuǎn)化。
![]()
亞歷克斯·扎沃龍科夫博士
在各個(gè)模型中,亞歷克斯·扎沃龍科夫被反復(fù)描述為在構(gòu)建和運(yùn)作專注于衰老生物學(xué)的端到端人工智能平臺(tái)方面脫穎而出,并將這些系統(tǒng)轉(zhuǎn)化為實(shí)際的治療方案。無論模型的整體趨勢(shì)如何,關(guān)于生成化學(xué)、衰老時(shí)鐘、集成的靶向到臨床工作流程以及人類臨床試驗(yàn)的提法反復(fù)出現(xiàn)。
幾個(gè)模型強(qiáng)調(diào)了速度和執(zhí)行,指出人工智能發(fā)現(xiàn)的靶點(diǎn)和設(shè)計(jì)的分子進(jìn)入第二階段試驗(yàn),作為證據(jù)表明,人工智能與生物學(xué)緊密結(jié)合時(shí),能夠超越理論上的承諾。其他模型則強(qiáng)調(diào)基礎(chǔ)設(shè)施和影響力,指出這些平臺(tái)被制藥合作伙伴采用的程度,以及它們?nèi)绾嗡茉臁耙匀斯ぶ悄転橄取钡乃幬锇l(fā)現(xiàn)在實(shí)踐中的樣子。
扎沃龍科夫本人對(duì)這種活動(dòng)的重要性持謹(jǐn)慎態(tài)度。在反思結(jié)果時(shí),他告訴我們:‘當(dāng)我第一次看到每個(gè)大型語言模型在衰老領(lǐng)域?qū)⑽遗琶谝粫r(shí),我感到相當(dāng)高興。因?yàn)樵谡w全球排名方面,我更信任大型語言模型,而不是那些往往優(yōu)先考慮籌集資金數(shù)量或與炫目機(jī)構(gòu)、投資者關(guān)系的行業(yè)分析師或媒體。’不過,令人遺憾的是,我們至今還沒有一款人工智能發(fā)現(xiàn)的衰老藥物獲得批準(zhǔn)。提供新穎有效的衰老治療藥物應(yīng)該是行業(yè)的主要目標(biāo)。
這段評(píng)論強(qiáng)調(diào)了實(shí)驗(yàn)的吸引力和局限性;模式識(shí)別系統(tǒng)的認(rèn)可并不等于以患者為標(biāo)準(zhǔn)的成功。
第二梯隊(duì)更加分散
在頂尖位置之外,大家的共識(shí)明顯減弱。雖然有幾個(gè)名字反復(fù)出現(xiàn),但它們的排序會(huì)根據(jù)模型對(duì)基礎(chǔ)生物學(xué)、轉(zhuǎn)化生物技術(shù)、生物標(biāo)志物開發(fā)或公共影響的重視程度而有所不同。
大衛(wèi)·辛克萊經(jīng)常出現(xiàn)在排名靠前的候選人中,尤其是在那些強(qiáng)調(diào)生物標(biāo)志物、表觀遺傳時(shí)鐘和支撐人工智能應(yīng)用于衰老的概念框架的模型中。他對(duì)公共話語的影響,以及將生物年齡作為可測(cè)量的量的規(guī)范化,顯然與經(jīng)過十年長(zhǎng)壽文獻(xiàn)和媒體訓(xùn)練的語言模型相契合。
克里斯滕·福特尼也多次出現(xiàn),特別是在那些優(yōu)先考慮以人為本的數(shù)據(jù)、生物庫(kù)的機(jī)器學(xué)習(xí)分析,以及將人工智能衍生目標(biāo)轉(zhuǎn)化為臨床項(xiàng)目的情況下。模型通常將她的工作視為對(duì)更以疾病為中心的方法的對(duì)立,強(qiáng)調(diào)與長(zhǎng)壽相關(guān)的數(shù)據(jù)集和結(jié)果。
![]()
左至右:大衛(wèi)·辛克萊博士(哈佛醫(yī)學(xué)院)和克里斯滕·福特尼博士(BioAge)
其他模型提升了那些貢獻(xiàn)不在于算法本身,而在于促進(jìn)生態(tài)系統(tǒng)的角色的領(lǐng)導(dǎo)者:這些領(lǐng)導(dǎo)者建立了機(jī)構(gòu)、標(biāo)準(zhǔn)化數(shù)據(jù)集,或創(chuàng)建了人工智能方法所依賴的生物和臨床基礎(chǔ)設(shè)施。在這里,瓦迪姆·格拉季謝夫、布賴恩·肯尼迪和史蒂夫·霍瓦斯等名字浮現(xiàn),通常會(huì)伴隨著這樣的解釋:生物標(biāo)志物和系統(tǒng)級(jí)生物學(xué)是任何有意義的人工智能驅(qū)動(dòng)的衰老干預(yù)的前提條件。
榮譽(yù)提名與推動(dòng)者
在前五名之外,還有一群人偶爾出現(xiàn)在回應(yīng)中。有些人因構(gòu)建了人工智能系統(tǒng)在大規(guī)模運(yùn)作所需的龐大多模態(tài)數(shù)據(jù)集而受到認(rèn)可;另一些人則因推動(dòng)臨床框架,使衰老被視為可修改的過程而不是被視為抽象的風(fēng)險(xiǎn)因素而受到贊譽(yù)。
像克雷格·文特爾、尼爾·巴茲拉伊、達(dá)芙妮·科勒和詹姆斯·柯克蘭這些人物被提及,并不是因?yàn)樗麄兦『梦挥陂L(zhǎng)壽人工智能的中心,而是因?yàn)樗麄冊(cè)诨蚪M學(xué)、臨床老年科學(xué)和生物學(xué)中的機(jī)器學(xué)習(xí)等相關(guān)領(lǐng)域的貢獻(xiàn),使得當(dāng)前的時(shí)刻成為可能。在幾份回應(yīng)中,他們的提及帶有明確的警示,反映出大型語言模型在區(qū)分直接應(yīng)用與基礎(chǔ)影響方面的困難。
這告訴我們什么 – 以及不告訴我們什么
在一個(gè)排名列表中解讀過多是很誘人的,特別是當(dāng)結(jié)果在頂部如此干凈地對(duì)齊時(shí)。但這個(gè)練習(xí)更像是一面鏡子,而不是一個(gè)判決。大型語言模型更看重一致性、信號(hào)的密度和可驗(yàn)證的轉(zhuǎn)化;它們浮現(xiàn)出那些其工作始終出現(xiàn)在人工智能方法、衰老生物學(xué)和現(xiàn)實(shí)世界執(zhí)行交匯處的個(gè)體。
這同樣可能反映了當(dāng)前長(zhǎng)壽領(lǐng)域領(lǐng)導(dǎo)力的形成方式,也反映了誰“應(yīng)得”這一榮譽(yù)。基于公共話語訓(xùn)練的模型不可避免地反映了注意力、資本和敘事動(dòng)量已經(jīng)匯聚的地方。它們擅長(zhǎng)于整合共識(shí),但在識(shí)別尚未被廣泛關(guān)注的事物時(shí)則顯得不足。
盡管如此,隨著人工智能系統(tǒng)越來越多地介入發(fā)現(xiàn)、資金和聲譽(yù)的過程,關(guān)注它們?nèi)绾慰创F(xiàn)在所幫助塑造的領(lǐng)域似乎是值得的。這個(gè)實(shí)驗(yàn)突顯了從抽象承諾轉(zhuǎn)向可衡量成果的轉(zhuǎn)變——一個(gè)信號(hào)表明,長(zhǎng)壽科學(xué)及其人工智能的雄心,正越來越少地以愿景來評(píng)判,而更多地以實(shí)際執(zhí)行來評(píng)判。
這是否讓人感到安慰或不安,可能取決于個(gè)人對(duì)算法反映我們集體關(guān)注的接受程度。無論如何,這都是一個(gè)在未來一年中不太可能消退的對(duì)話。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.