![]()
圖源:Unsplash / Lush Kooch
撰文|張?zhí)炱?/strong>
溫州醫(yī)科大學(xué)一名大四學(xué)生,最近引起了不小的關(guān)注。
他的 Google Scholar 個人主頁顯示,從 2024 年 7 月至今的一年多時間里,他已累計發(fā)表學(xué)術(shù)論文 48 篇。如果將時間進(jìn)一步壓縮到 2025 年,這一數(shù)字就顯得更為集中。一年之內(nèi)發(fā)表論文超過 40 篇,平均下來,幾乎不到 10 天就有一篇新作上線。
初步梳理發(fā)現(xiàn),其中僅有 4 篇未被 SCI 收錄,其余 44 篇均被 SCI 期刊收錄。這些論文并非主要集中在低分區(qū)期刊。按中科院期刊分區(qū)口徑估算,約有 10 篇發(fā)表在一區(qū)期刊,20 篇左右發(fā)表于二區(qū)期刊。
需要說明的是,這 48 篇成果不全是研究論文,其中包含了致編輯的通信(letter)、綜述性文章以及觀點(diǎn)類短文。但即便不計這些文章,他的發(fā)表量和發(fā)表速率也足夠驚人,特別是對本科生來說。
從作者結(jié)構(gòu)看,這位學(xué)生本人多以第一作者身份出現(xiàn),并兼任通訊作者。因?yàn)橐蛔鲾?shù)量極多,外界有人懷疑他是靠家庭或者導(dǎo)師提攜的學(xué)二代。但單看他的論文署名情況,“學(xué)界大佬”掛名通訊的情況并不多見,甚至連導(dǎo)師作為通訊作者署名的比例也并不高。實(shí)際上,論文的合作者更多來自同一所學(xué)校、和他年紀(jì)相仿的本科生。
在發(fā)表渠道上,這些論文多發(fā)表于開放獲取(Open Access)期刊。這類期刊通常需要作者在論文接收后支付一定數(shù)額的版面費(fèi)。相關(guān)費(fèi)用從何而來尚不清楚,不過從學(xué)校現(xiàn)行制度來看,僅通過校內(nèi)渠道,他就可能獲得至少兩類與論文直接相關(guān)的經(jīng)費(fèi)支持。
據(jù)溫州醫(yī)科大學(xué)官方通知,本專科學(xué)生在創(chuàng)新創(chuàng)業(yè)方面取得成果的學(xué)生、指導(dǎo)教師和學(xué)院予以獎勵。獎勵的成果包括學(xué)生為第一作者公開發(fā)表的論文(二級及以上)、學(xué)生為第一發(fā)明人獲得的專利、學(xué)生參加各級“挑戰(zhàn)杯”競賽所獲獎項(xiàng)等。
2021年公布的《溫州醫(yī)科大學(xué)大學(xué)生創(chuàng)新創(chuàng)業(yè)工作獎勵辦法》顯示,溫州醫(yī)科大學(xué)大學(xué)生創(chuàng)新創(chuàng)業(yè)資金,每年投入預(yù)算500萬元。本專科學(xué)生作為第一作者發(fā)表SCI、SSCI、A&HCI收錄刊物獎勵4000元。對學(xué)科競賽獲獎的學(xué)生集體,也有根據(jù)競賽級別和獲獎名次的獎勵[1]。
在校內(nèi),各類科技創(chuàng)新項(xiàng)目幾乎貫穿了這位學(xué)生的整個大學(xué)階段。僅在院級公眾號上,就能搜索到該同學(xué)申報2024年度溫州醫(yī)科大學(xué)本專科學(xué)生科研課題、年度大學(xué)生創(chuàng)新創(chuàng)業(yè)重點(diǎn)孵化團(tuán)隊(duì)。2024年浙江省大學(xué)生科技創(chuàng)新活動計劃(新苗人才計劃),以及2025年國家級大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計劃項(xiàng)目、2025年第十屆全國大學(xué)生生命科學(xué)競賽的記錄。這些科技創(chuàng)新項(xiàng)目也有各自的資助。
這位學(xué)生發(fā)表論文的合作者,很多就是各個科技創(chuàng)新項(xiàng)目的小組成員。同一批項(xiàng)目中,多名學(xué)生都以不同方式參與論文產(chǎn)出,陸續(xù)獲得了多篇論文署名,甚至共同第一作者。只是由于其個人發(fā)表數(shù)量更為集中,相關(guān)關(guān)注更多聚焦于他一人。
這些文章在研究對象上,涉及腫瘤、免疫、神經(jīng)系統(tǒng)疾病、醫(yī)學(xué)影像、藥物和醫(yī)療器械評價等多個領(lǐng)域,但在具體做法上卻高度接近。多數(shù)論文采用的是孟德爾隨機(jī)化(Mendelian Randomization,MR)、組學(xué)、生物信息學(xué)篩選或網(wǎng)絡(luò)毒理學(xué)方法,也有一部分直接基于 GBD 等公共數(shù)據(jù)庫撰寫流行病學(xué)研究。這些研究幾乎都建立在現(xiàn)成數(shù)據(jù)之上,并不需要進(jìn)入實(shí)驗(yàn)室開展實(shí)驗(yàn)。
這種方法上的集中,在論文標(biāo)題中就能直接看出來。在他 Google Scholar 主頁顯示的 48 篇文章中,至少有 11 篇在標(biāo)題中明確標(biāo)注了“孟德爾隨機(jī)化”。即便不計算那些未寫入標(biāo)題、但在正文中同樣以孟德爾隨機(jī)化作為主要分析工具的論文,相關(guān)方法在其研究中所占的比重也已經(jīng)十分突出。
很多文章都是統(tǒng)計A成分與B疾病之間的關(guān)系。例如,圍繞 PFAS(全氟和多氟烷基物質(zhì))與癌癥的關(guān)系,他在不同時間點(diǎn)陸續(xù)發(fā)表了多篇論文。先是 PFAS 與肝癌,隨后是 PFAS 與乳腺癌,又有將 PFAS 放入多種癌癥框架中同時討論的研究。同樣的數(shù)據(jù)庫,相似的分析邏輯,只需更換疾病的靶點(diǎn)數(shù)據(jù),就能像拼積木一樣拼湊出新的成果。
部分論文的內(nèi)容還有復(fù)用的嫌疑。他在2025年初發(fā)表了一篇關(guān)于Busulfan導(dǎo)致無精癥的機(jī)制論文,而在同年年末的全國大學(xué)生生命科學(xué)競賽中,類似的內(nèi)容又以《多組學(xué)整合揭示Busulfan誘導(dǎo)無精癥的關(guān)鍵靶點(diǎn)與分子機(jī)制》為題出現(xiàn)。
很難判斷這些論文是否有論文工廠的助力,但如果幾位本科生已經(jīng)能夠搭建一條論文生產(chǎn)流水線,這或許并非孤立現(xiàn)象。與以往依賴家庭背景或?qū)熤С值膶W(xué)術(shù)不端事件相比,它同樣需要被認(rèn)真對待。
01 AI時代,制造流水線論文只要兩小時?
類似溫州醫(yī)科大學(xué)這位學(xué)生,利用公共數(shù)據(jù)庫和特定的方法,越過做實(shí)驗(yàn)的步驟大量快速發(fā)表論文,現(xiàn)在已經(jīng)被視為一條論文發(fā)表捷徑。
一個難以忽視的現(xiàn)象是,低質(zhì)量、重復(fù)性論文的快速增長,在時間上幾乎與AI生成能力的躍升同步發(fā)生。這種重合并不必然意味著因果關(guān)系,但已經(jīng)足以引起警覺。
研究者們也注意到了這一點(diǎn)。來自英國薩里大學(xué)和澳大利亞昆士蘭科技大學(xué) 的兩位研究者,近期專門對 AI 工具與這類快速生產(chǎn)論文之間的關(guān)系展開了調(diào)查。研究者對 2021 年至 2025 年(截至 7 月底)已發(fā)表的相關(guān)研究進(jìn)行了系統(tǒng)性梳理,試圖回答:圍繞同一套數(shù)據(jù),學(xué)術(shù)界到底出現(xiàn)了多少“換題不換數(shù)據(jù)”的重復(fù)研究?
梳理對象聚焦于使用美國疾病控制與預(yù)防中心(CDC)國家健康與營養(yǎng)調(diào)查(NHANES)數(shù)據(jù)庫的論文。在統(tǒng)計時,研究者將“重復(fù)”界定為這樣一類研究:研究對象來自同一國家、同一人群,討論的仍是相同的暴露因素與相同的健康后果,只是在題目、表述或分析方法上作出細(xì)微調(diào)整。
在對文獻(xiàn)進(jìn)行系統(tǒng)檢索和匹配后,研究者共識別出 411 篇成對的重復(fù)“暴露—后果”論文。最常見的情形是:同一個暴露—后果組合,被發(fā)表成兩篇論文,這一情況涉及 190 篇文章。某些主題的密集程度尤其高,例如“氧化平衡得分與慢性腎臟病之間的關(guān)聯(lián)”,在一年之內(nèi)就被發(fā)表了 6 次。
從時間維度看,這類重復(fù)發(fā)表幾乎是一個近幾年才迅速放大的現(xiàn)象。在 2023 年之前,圍繞 NHANES 的重復(fù)論文仍然十分有限:2021 年僅 3 篇,2022 年為 12 篇。但到了 2024 年,這一數(shù)字驟然攀升至 198 篇,短短兩年間增長了 17 倍。
更進(jìn)一步,研究者們基于已發(fā)表的論文,使用大模型直接生產(chǎn)了三篇看似全新的稿件。求新文本在句法結(jié)構(gòu)上必須與原文不同,以降低被剽竊檢測工具識別的可能性。研究者坦言,LLM 并不能被指令生成完全無誤的論文,但即便如此,每一篇論文從頭到尾的生產(chǎn)時間,也僅僅只需要兩個小時。
研究者隨后將三篇由大語言模型生成的合成稿件提交至 iThenticate。三篇稿件在剔除參考文獻(xiàn)后的總體相似度均低于 30%,且沒有任何單一來源的相似度超過 5%。按照當(dāng)前主流編輯流程的標(biāo)準(zhǔn),這樣的得分不會觸發(fā)自動的預(yù)警。
當(dāng)然,越過了第一道關(guān)卡,不意味著一篇論文就能夠被接收。但是僅僅兩個小時就能出產(chǎn)一篇通過自動檢測的論文,如此之低的制造成本下,即便單篇論文的成功率并不高,只要不斷重復(fù)提交,總會有一部分進(jìn)入發(fā)表通道[2]。
這一問題在中國尤其嚴(yán)重。今年年初的一項(xiàng)研究顯示,基于 NHANES 健康數(shù)據(jù)庫垃圾論文數(shù)量的激增幾乎完全集中在中國。2021至2024年間,全球共發(fā)表了316篇此類論文,其中有292篇的第一作者來自中國單位,占比超過92%。作者猜測,AI能夠很方便的調(diào)用NHANES數(shù)據(jù),是論文暴增的來源之一[3]。
類似的“數(shù)據(jù)挖掘論文”服務(wù),在國內(nèi)社交平臺上并不難找到。在一些平臺的廣告中,造假的暗示已非常露骨。例如有平臺寫道:“因公共數(shù)據(jù)庫的開放性,我們提供的統(tǒng)計服務(wù)可不斷更換研究主題,挖掘數(shù)據(jù),直至分析出發(fā)表級的統(tǒng)計分析結(jié)果。”
甚至在一些稍早的廣告公眾號文章里,溫州醫(yī)科大學(xué)這位同學(xué)發(fā)布的論文成了正面的宣傳案例,“抓住一個研究目標(biāo),換個疾病就能復(fù)制粘貼出多篇文章”,這種方法適合“急需文章”的人群。公眾號的目標(biāo)也很明確,推銷論文定制與“個性化”服務(wù)。
02 期刊開始收緊標(biāo)準(zhǔn)
今年很多出版商已經(jīng)對此做出了限制。Frontiers 將這種方式炮制的論文稱為“快速生產(chǎn)的科學(xué)”(Fast-churn science),指出這類研究會“讓期刊充斥著低質(zhì)量、重復(fù)性的發(fā)現(xiàn)”。
2024 年年中,F(xiàn)rontiers 的編輯部注意到一個異常現(xiàn)象:基于孟德爾隨機(jī)化的投稿量在短時間內(nèi)激增。緊隨其后,又出現(xiàn)了一波大量使用美國國家健康與營養(yǎng)檢查調(diào)查(NHANES)公共數(shù)據(jù)集的論文。
佛羅里達(dá)大學(xué)教授 Arch G. Mainous III 指出。大型公共數(shù)據(jù)庫中可調(diào)用的變量數(shù)量極其龐大,當(dāng)可用變量足夠多時,研究者只需不斷調(diào)整變量組合,憑借純粹的數(shù)據(jù)篩選制造出看似顯著的相關(guān)性。
他直言,這些數(shù)據(jù)庫本來是許多重要流行病學(xué)研究和疾病負(fù)擔(dān)評估的基礎(chǔ)工具,問題在于,一些研究并非從清晰的科學(xué)問題出發(fā),而是反其道而行之.先在數(shù)據(jù)中尋找顯著性,再為結(jié)果補(bǔ)寫假設(shè)。
"由于可用變量太多,一些投機(jī)團(tuán)體似乎只是構(gòu)建一個龐大的變量矩陣,通過窮舉相關(guān)性來尋找統(tǒng)計學(xué)顯著結(jié)果。這些分析中缺失的,是具有明確結(jié)果的假設(shè)”。Mainous說。
Mainous 進(jìn)一步指出,嚴(yán)肅的研究還必須考慮 NHANES 這類美國數(shù)據(jù)集所依賴的社會背景與制度條件,以及研究結(jié)論在其他國家和文化情境下是否成立的問題。但在大量涌現(xiàn)的稿件中,這些討論往往被完全省略。
“不幸的是,這些在科學(xué)上存疑、但在統(tǒng)計學(xué)上顯著的關(guān)系,恰恰可以被論文工廠用作待售稿件的基礎(chǔ)。”Mainous 說。只要結(jié)果顯著,論文被接收和發(fā)表的概率就會大幅提高。然而在進(jìn)行足夠多次統(tǒng)計比較的前提下,即便純屬偶然,也會有一些結(jié)果顯示出統(tǒng)計學(xué)意義。結(jié)果是,大量質(zhì)量可疑的稿件在短時間內(nèi)涌入期刊系統(tǒng),給編輯和審稿人帶來了極大的壓力。
2024 年 7 月,F(xiàn)rontiers 成為首批對這一問題作出明確回應(yīng)的出版商之一。期刊宣布:所有基于健康數(shù)據(jù)集的孟德爾隨機(jī)化研究,必須提供獨(dú)立的外部驗(yàn)證。凡是僅依賴公共數(shù)據(jù)庫、缺乏新增驗(yàn)證數(shù)據(jù)或機(jī)構(gòu)數(shù)據(jù)支持的 MR 稿件,將在編輯初審階段直接被拒。
政策實(shí)施后的第一個月,F(xiàn)rontiers 接收到的 MR 投稿量下降了 61%。今年年初,F(xiàn)rontiers 又進(jìn)一步收緊了標(biāo)準(zhǔn),明確要求所有“僅基于公共數(shù)據(jù)簡單查詢”的論文必須進(jìn)行外部驗(yàn)證。在新政策實(shí)施后,F(xiàn)rontiers 已累計拒絕了 5,513 篇孟德爾隨機(jī)化研究投稿(自 2024 年 7 月起),以及 1,382 篇基于 NHANES 數(shù)據(jù)的論文(自 2025 年 5 月起)[4]。
PLOS ONE也進(jìn)行了類似的改革。PLOS ONE總編輯 Emily Chenette 表示,PLOS 旗下的期刊收到的投稿量激增,這些論文通常在特定人群(如 35 歲以下的女性)中尋找健康狀況(如抑郁癥)與潛在原因(如維生素 D 水平)之間的統(tǒng)計聯(lián)系。研究人員推測,“論文工廠”可能正在大量產(chǎn)出此類論文,可能是通過AI進(jìn)行助力,并向研究人員出售。
PLOS ONE更新了“評估使用公開健康和社會科學(xué)數(shù)據(jù)庫進(jìn)行研究的標(biāo)準(zhǔn)”。PLOS 旗下期刊的編輯將自動拒收基于這些數(shù)據(jù)集的論文,除非研究人員做了額外的后續(xù)工作(如實(shí)驗(yàn))。Chenette 稱,在新政策實(shí)施的第一個月,此類論文的退稿率已從 40% 上升至 94%[5]。
一些專門領(lǐng)域也有同樣的現(xiàn)象。在藥物安全領(lǐng)域,基于FDA 不良事件報告系統(tǒng)(FAERS)的數(shù)據(jù),進(jìn)行單一藥物及其與特定不良事件關(guān)聯(lián)的研究。2021 年,大約有 100 項(xiàng)。2024 年 ,這一數(shù)字達(dá)到了 600 項(xiàng)。
為了應(yīng)對論文泛濫的情況,《藥理學(xué)前沿》(Frontiers in Pharmacology)今年開始要求使用公共數(shù)據(jù)集的研究必須經(jīng)過獨(dú)立驗(yàn)證。 《藥物安全專家意見》(Expert Opinion on Drug Safety )則在 7 月下旬決定完全停止接收使用 FAERS 數(shù)據(jù)庫進(jìn)行此類研究的稿件[6]。
參考文獻(xiàn):
- [1] 溫州醫(yī)科大學(xué)大學(xué)生科研工作委員會辦公室. (2023, October 30). 關(guān)于做好溫州醫(yī)科大學(xué)2022年度本專科學(xué)生創(chuàng)新創(chuàng)業(yè)成果報送工作的通知. 溫州醫(yī)科大學(xué).
- [2] Maupin, D., Suchak, T., Barnett, A., & Spick, M. (2025, September 12). Dramatic increases in redundant publications in the Generative AI era (Preprint). medRxiv.
- [3] Suchak, T., Aliu, A. E., Harrison, C., Zwiggelaar, R., Geifman, N., & Spick, M. (2025). Explosion of formulaic research articles, including inappropriate study designs and false discoveries, based on the NHANES US national health database. PLOS Biology, 23(5), e3003152.
- [4] Frontiers Communications Editor, F. C. (2025, September 15). Cutting through fast-churn science: How Frontiers raised the bar. Frontiers | Science news.
- [5] O’Grady, C. (2025, October 8). Journals and publishers crack down on research from open health data sets. Science.
- [6] Travis, K. (2025, September 16). Exclusive: Journal bans drug safety database papers as they flood the literature. Retraction Watch.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.