<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      每3篇就有1篇涉嫌造假?中國癌癥研究遭遇“最大規?!辟|疑

      0
      分享至



      36%,17萬,這是讓中國科研界無法回避的數字。

      2026年1月30日,《英國醫學雜志》發表了一項震撼學術界的研究。研究顯示在1999年至2024年間發表的中國癌癥研究論文中,超過17萬篇被人工智能標記為疑似論文工廠產物,比例高達36%。

      這意味著每3篇中國癌癥研究論文中,就有超過1篇被AI識別為可能存在誠信問題。

      當然,這項研究并非針對中國,而是展示了一個系統性問題的冰山一角。在這項研究掃描的全球超過260萬篇癌癥論文中,26.1萬篇(9.87%)被標記為疑似論文工廠產物,其中中國占了17.7萬篇,占全球疑似論文的68%。

      撰文 | 木木

      1月30日,醫學領域頂級期刊《英國醫學雜志》(The BMJ)發表了一項令人震驚的研究:在1999年至2024年間發表的癌癥研究論文中,每10篇就有1篇疑似論文工廠產物;其中中國的情況尤為嚴重,每3篇就有1篇疑似問題論文。

      這項研究的主導者,正是幾周前剛剛在Nature雜志上宣布“論文減產50%”以踐行“慢科學”理念的澳大利亞昆士蘭科技大學教授Adrian Barnett。如果說之前他用數據證明“90%的研究是垃圾”,那么這次,他用機器學習找到了最底層的“垃圾”,即由論文工廠批量生產的工業化產品。他的團隊開發的BERT機器學習模型,通過分析論文標題和摘要的文本特征,在已知真假的論文中達到了91%的準確率。

      更令人不安的是,這個問題不僅存在于低質量期刊。研究顯示,那些高影響因子期刊(排名前10%的期刊)的標記率從1999年的接近零,一路攀升到2022年的超過10%。這意味著論文工廠的“假貨”已經滲透到學術金字塔的頂端,即便是最受尊敬的學術期刊也未能幸免。

      這不是針對中國的“抹黑”,而是基于260萬篇論文的科學分析。但我們必須直面一個現實:這個數字會被國際學術界長期記住。它不僅影響中國科研的國際聲譽,更可能誤導全球癌癥研究的方向。同時,它也對那些恪守學術誠信的中國研究者造成了不公平的“污名化”。

      問題究竟有多嚴重?論文工廠是如何運作的?AI又是如何識破這些造假的?中國科研該如何應對這場危機?

      模板化生產留下“文字指紋”:AI如何識破論文工廠

      論文工廠(paper mills)通常是指“學術合同作弊組織”,它們為客戶批量制造虛假論文。根據BMJ論文引用的數據,過去20年間,超過40萬篇疑似論文工廠產物被發表,論文工廠的年收入達到數千萬美元。2022年,Wiley出版社在收購Hindawi后,一次性撤回了近1.1萬篇疑似論文工廠產物,并關閉了19本期刊,讓這個問題獲得了前所未有的關注。

      這些論文工廠依賴預制句子的模板,只需替換特定領域的術語,以流水線方式大規模制造論文。根據俄羅斯學者Abalkina的調查,論文工廠的收費直接與期刊的影響因子掛鉤,影響因子越高,售價越高。

      正是因為論文工廠使用模板化生產,這給AI檢測提供了可能。Barnett團隊的核心假設是:論文工廠使用的文本模板會延伸到標題和摘要,這些模板特征雖然對人類可能不明顯,但AI能夠識別。他們選擇了BERT機器學習模型來分析文本,讓AI讀了幾千篇真假論文后,學會識別“造假腔調”。

      研究團隊從Retraction Watch數據庫篩選出2,202篇標記為“Paper Mill”的癌癥研究論文用于模型訓練,并從學術誠信專家數據集獲得3,094篇用于外部驗證。作為對照組,他們從北歐國家和高影響因子期刊中選擇論文,特別納入了部分中國的高質量論文,以避免模型僅僅學習語言特征而非造假特征。

      模型表現令人信服:在驗證集上準確率達到0.91-0.93,敏感性為0.87,特異性高達0.96-0.99。更重要的是,在交叉驗證中,模型成功標記了72%已知包含錯誤核苷酸序列和細胞系的問題論文,盡管模型在訓練時并未獲得這些信息。這說明模型確實學會了識別論文工廠的文本特征本身。

      有了這個強大的AI工具,研究團隊開始了一項前所未有的大規模掃描:檢查1999年至2024年間發表的260萬篇癌癥研究論文。

      全球9.87%,中國36%:癌癥研究中的論文工廠有多猖獗?

      這是迄今為止針對論文工廠最大規模的檢測研究。研究團隊從PubMed數據庫的3800萬篇生物醫學論文中,經過嚴格篩選,最終得到2,647,471篇癌癥原創研究論文,跨越11,632本期刊,時間跨度26年。每一篇論文的標題和摘要都被輸入到訓練好的BERT模型中進行分析。

      核心數字令人震驚:在2,647,471篇癌癥原創論文中,261,245篇被標記為疑似論文工廠產物,占比9.87%。這意味著每發表10篇癌癥論文,就有約1篇可能來自論文工廠,是之前估計的3倍以上。



      每年被標記為疑似論文工廠產物的癌癥研究論文數量 |圖源:The BMJ

      從時間趨勢看,問題呈指數級惡化。1999-2009年標記率約1%,到2022年已超過15%(171,656篇癌癥論文中有26,457篇被標記)。論文指出,標記論文數量遵循指數趨勢,R2=0.92,這意味著這是一個系統性的、加速的危機。值得注意的是,2022年后標記率略有下降,論文分析可能與出版商反擊、論文工廠轉向AI生成新模板等因素有關。

      當研究團隊按第一作者所屬國家統計時,中國的數字尤其突出。在中國機構發表的497,672篇癌癥論文中,177,907篇被標記,標記率高達36%。讓我們用數字來理解這意味著什么:這是全球平均水平(9.87%)的3.6倍,是美國(2%)的18倍;中國癌癥論文總量占全球18.8%,17.7萬篇被標記論文,占全球被標記論文的68%。

      值得注意的是,這個問題并不限于中國。伊朗的標記率達到20%,沙特阿拉伯為16%,埃及為15%,巴基斯坦和馬來西亞都達到13%。盡管這些國家的標記率也不低,但中國因為科研體量巨大,在絕對數量上最為驚人。與之形成鮮明對比的是,美國的標記率為2%,日本、德國、英國的標記率約為3%-4%。

      從癌癥類型看,論文工廠顯示出明顯的“偏好”。胃癌論文的標記率最高,達到22%;肝癌為20%;骨癌為21%。論文指出,胃癌和肝癌研究中標記論文比例較高,可能部分是因為這些癌癥在中國的高患病率。更值得注意的是,某些錯誤識別的細胞系,如BGC-823和BEL-7402,幾乎只出現在來自中國機構的出版物中。這意味著論文工廠針對性地瞄準這些“需求旺盛”的領域。

      從研究領域看,基礎研究是重災區。癌癥生物學和基礎研究、治療開發、診斷和預后等領域的標記率超過10%,而臨床流行病學、支持性護理等領域的標記率低于2%。這符合論文工廠的“經濟理性”:基礎研究相對容易偽造,臨床研究則需要真實患者數據。

      在出版商分布方面,Verduci Editore的標記率高達67%,主要來自European Review for Medical and Pharmacological Sciences期刊。更令人擔憂的是,即便是Springer Nature、Elsevier和John Wiley and Sons這些主流大型出版商,標記率也約10%,標記論文數量分別達到4萬、近4萬和2.8萬篇。

      從期刊影響因子看,排名前10%的期刊標記率從1999年的接近零增長到2022年的超過10%。這說明論文工廠問題不僅限于“掠奪性期刊(純粹以商業盈利為目的而發行的低品質期刊)”,連頂刊們也未能幸免。



      影響因子排名前10%期刊中被標記為疑似論文工廠產物的癌癥論文比例(按發表年份)|圖源:The BMJ

      研究人員指出:“影響因子的同步增長和標記論文的蔓延表明,這兩種現象可能都源于‘發表或消亡’文化的壓力?!闭撐墓S按影響因子定價,瞄準高端市場,而研究者追求高影響因子的壓力為其提供了市場。這也印證了Adrian Barnett“影響因子與論文質量并沒有直接關系”的觀點。

      整體而言,這些數字勾勒出一幅令人不安的圖景:全球9.87%的癌癥論文被標記,中國高達36%;問題論文標記率從1999年的1%飆升到2022年的15%以上,呈現指數級惡化;從掠奪性期刊到頂級期刊,從基礎研究到臨床應用,論文工廠的觸角無處不在。這不是冰冷的數字,而是一場正在發生的學術誠信危機的真實寫照。

      “標記”不等于“造假”:統計工具不是終審法官

      當我們看到36%這個驚人數字時,很容易得出簡單的結論:中國有36%的癌癥研究論文是假的。但科學研究需要嚴謹,BMJ這篇論文展現了可貴的學術誠實,它用大量篇幅討論了研究的局限性。

      首先,研究確實證實了三個關鍵事實:論文工廠使用文本模板(模型在不同驗證集上準確率達0.91-0.93);癌癥研究的污染比想象嚴重(10%的標記率是之前估計的3倍以上);高影響因子期刊不能保證質量(頂級期刊標記率從0增長到10%以上)。

      其次,研究團隊指出研究本身存在局限性。最關鍵的是:“標記”不等于“造假”。根據模型的靈敏度(0.87)和特異度(0.96-0.99),論文作者計算了一個假設場景:如果癌癥研究中真實的論文工廠論文比例是10%,那么也就意味著在被標記的論文中,約70%確實是論文工廠產物(陽性預測值),而約30%是誤判。但真實的論文工廠比例究竟是多少,目前仍然未知。

      研究強調,即使存在誤判,被標記的大量論文仍然值得警惕和深入調查。以中國的17.7萬篇被標記論文為例,如果假陽性率為30%,可能有5.3萬篇是被誤判的真實研究。但即便如此,仍有12.4萬篇可能是真實的論文工廠產物。

      論文特別強調,分類器是概率模型,不是不端行為的確定仲裁者。所有標記論文代表基于文本特征的統計預測,應解釋為需要人類判斷和進一步驗證的信號,而不是確認的欺詐案例。

      關于可能的地理偏見,論文承認訓練數據中中國論文過多可能引入偏見,但緊接著提供了反證:模型誤分類分析顯示假陽性很少,而中國論文在假陰性中過度代表(占90%),這恰恰說明不存在系統性過度標記。此外,論文特別指出:論文工廠的原產國可能與作者的國家不同,比如一家俄羅斯論文工廠向至少39個國家銷售出版物,也就是說,即使第一作者單位在中國,不等于造假者就來自中國。

      根源在“發表或消亡”文化

      BMJ論文給出了明確的診斷:高影響因子期刊中標記論文百分比的上升表明,論文工廠論文不僅是低影響期刊的問題。影響因子的同步增長和標記論文的蔓延表明,這兩種現象可能都源于publish-or-perish(發表或消亡)文化。

      論文指出癌癥研究受影響更嚴重,原因包括“高發表壓力、專業化領域中簡單易偽造的數據和技術,以及有限的同行評審能力”,其中“高發表壓力”排在首位。論文工廠按期刊影響因子定價,這創造了一個惡性循環:研究者需要高影響因子論文來滿足晉升要求,論文工廠瞄準高影響因子期刊以賣出更高價格,結果導致高影響因子期刊的標記率從接近零上升到10%以上。

      雖然論文沒有直接分析中國的科研評價體系,但提供了幾個客觀事實:中國是被標記論文最多的國家,某些出版商被中國政府標記為“與學術嚴謹性沖突”,BGC-823和BEL-7402等細胞系幾乎只出現在中國機構出版物中。這些暗示中國的發表壓力可能特別嚴重,為論文工廠提供了最大市場。

      論文警告了論文工廠問題的多重危害:浪費編輯和審稿人時間,誤導臨床決策和后續研究,以及系統性風險——Wiley收購Hindawi后一次性撤回近1.1萬篇論文、關閉19本期刊就是活生生的證據。論文還警告,ChatGPT等AI工具的興起可能讓論文工廠生成更逼真的文本,使未來檢測更具挑戰性。

      在應對措施方面,論文報告模型已整合到三家期刊的投稿系統中,強調“最終決定始終由人類做出”“投稿永遠不會僅基于工具就被拒絕”。論文呼吁出版商和政策制定者協調行動,持續改進檢測技術,整合多種工具(文本分析、圖像檢測、數據驗證)來遏制論文工廠蔓延。

      中國科研的警鐘與轉機

      對中國而言,36%的標記率和17.7萬篇被標記論文的數據將被國際學術界長期記住。當然,具體的造假情況有待進一步審查。考慮到約30%的假陽性率,真實的造假比例可能在25%左右。但即便是25%,也意味著每4篇中國癌癥研究論文中就有1篇可能存在嚴重誠信問題。

      這是無法回避的現實。

      在悲觀的數據中,我們必須看到希望的一面。36%被標記,意味著64%的中國癌癥研究論文沒有被標記。絕大多數中國科研人員是誠實的,他們在努力做真實的研究。誠實研究者們承受著“發表或消亡”的巨大壓力,看著造假者快速晉升,卻依然堅持學術誠信。他們才是中國科研的希望所在。

      正因如此,中國科研當下面臨著關鍵的路徑選擇。如果繼續現有路徑,論文數量將繼續膨脹而質量繼續下降,論文工廠繼續繁榮,國際聲譽繼續受損,誠實研究者繼續吃虧,“劣幣驅逐良幣”的局面繼續惡化,最終可能面臨某種程度的“學術孤立”。如果選擇改革之路,就要徹底改革評價體系(從數量到質量),重建學術誠信文化(從“發表或消亡”到“慢科學”),從論文大國走向科研強國。

      而且必須看到,做出改變的時間窗口正在關閉。BMJ論文警告:不作為的風險是允許論文工廠進一步蔓延,可能危及整個期刊和出版商。Barnett在Nature上的警告同樣適用于中國科研:如果我們不放慢速度,出版系統的更多部分將會崩潰,科學進步將被阻礙。

      Barnett的研究也提出了一些解決方案:問題是系統性的,不是個別研究者的道德問題,而是激勵結構導致的集體困境,所以解決方案必須是制度改革。完整的改革路徑需要三管齊下:技術檢測(開發AI工具)、制度改革(推動評價體系改革)、文化重建(倡導“慢科學”理念)。

      36%是震耳的警鐘,但警鐘也是轉機。問題已經被量化、被識別、被公開,技術工具已經存在,解決路徑已經清晰,國際經驗可以借鑒。現在需要的,是決心和行動。

      :本文所有數據和引用均來自2026年1月30日發表在The BMJ上的研究論文"Machine learning based screening of potential paper mill publications in cancer research: methodological and cross sectional study"(BMJ 2026; 392:e087581),以及Adrian Barnett在Nature雜志、eLife雜志和Median Watch博客上發表的系列文章。

      關于Adrian Barnett早前關于“90%研究是垃圾”和“論文減產50%”的研究,詳見我們之前的報道文章《“90%的科研都是垃圾!”這位學者拿自己開刀,要把論文數量砍一半》。

      參考文獻

      [1] Barnett, A.G., Smail, B., Cherbuin, D., & Byrne, J.A. (2026). Machine learning based screening of potential paper mill publications in cancer research: methodological and cross sectional study. The BMJ, 392, e087581. https://doi.org/10.1136/bmj-2025-087581

      [2] Barnett, A. (2026, January 19). I'm going to halve my publication output. You should consider slow science, too. Nature. https://doi.org/10.1038/d41586-025-04061-w

      [3] Barnett, A. (2025, January 7). 90% of scientific research is crap. Median Watch. https://medianwatch.netlify.app/post/sturgeon/

      [4] Chalmers, I., & Glasziou, P. (2009). Avoidable waste in the production and reporting of research evidence. The Lancet, 374(9683), 86-89. https://doi.org/10.1016/S0140-6736(09)60329-9

      注:本文封面圖片來自版權圖庫,轉載使用可能引發版權糾紛。



      特 別 提 示

      1. 進入『返樸』微信公眾號底部菜單“精品專欄“,可查閱不同主題系列科普文章。

      2.『返樸』提供按月檢索文章功能。關注公眾號,回復四位數組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類推。

      版權說明:歡迎個人轉發,任何形式的媒體或機構未經授權,不得轉載和摘編。轉載授權請在「返樸」微信公眾號內聯系后臺。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      汪小菲一家六口團聚!迎接馬筱梅肚子里的小馬寶,三代同堂好溫馨

      汪小菲一家六口團聚!迎接馬筱梅肚子里的小馬寶,三代同堂好溫馨

      老吳教育課堂
      2026-02-22 23:00:22
      萬榮縣出租司機稱當地強制他們給游客打折:一天可能50塊都賺不到

      萬榮縣出租司機稱當地強制他們給游客打折:一天可能50塊都賺不到

      映射生活的身影
      2026-02-22 08:39:24
      北京一教師被罰6728萬!

      北京一教師被罰6728萬!

      感覺會火
      2026-02-22 12:07:21
      9.5億買一堆邊角料!曼聯今夏重建,B費逼宮紅魔,卡里克走他就走

      9.5億買一堆邊角料!曼聯今夏重建,B費逼宮紅魔,卡里克走他就走

      體壇鑒春秋
      2026-02-22 13:53:48
      兒子在越戰犧牲,老母親無路費去掃墓,等了20年終于摸到兒子墓碑

      兒子在越戰犧牲,老母親無路費去掃墓,等了20年終于摸到兒子墓碑

      歷史龍元閣
      2026-02-03 11:15:07
      終于有人把話說透了:當普通人存款到20–50萬,危險的不是沒錢

      終于有人把話說透了:當普通人存款到20–50萬,危險的不是沒錢

      生活新鮮市
      2026-02-22 06:40:40
      全球最小的發達國家,快被中國人“買”下了,中國移民占比87%!

      全球最小的發達國家,快被中國人“買”下了,中國移民占比87%!

      財叔
      2025-12-28 22:59:30
      比恒大還慘!中國第二大民企倒了,負債7500億,創始人被帶走

      比恒大還慘!中國第二大民企倒了,負債7500億,創始人被帶走

      芳芳歷史燴
      2025-12-25 20:32:52
      惠若琪全家出游太養眼,妹妹顏值不輸姐姐,網友:神仙姐妹花

      惠若琪全家出游太養眼,妹妹顏值不輸姐姐,網友:神仙姐妹花

      風月得自難尋
      2026-02-22 06:05:00
      晚上8點,中國隊收官!狂攬5金4銀6銅,歷史第二好,最差項目出爐

      晚上8點,中國隊收官!狂攬5金4銀6銅,歷史第二好,最差項目出爐

      侃球熊弟
      2026-02-22 20:17:52
      哈爾濱冰雪大世界發布閉園公告:冰雪景觀融化嚴重,退票游客可免費游覽下一屆

      哈爾濱冰雪大世界發布閉園公告:冰雪景觀融化嚴重,退票游客可免費游覽下一屆

      環球網資訊
      2026-02-22 15:24:25
      蘇翊鳴日本籍教練:中國隊曾高薪邀我做專屬教練 我花30秒拒絕了

      蘇翊鳴日本籍教練:中國隊曾高薪邀我做專屬教練 我花30秒拒絕了

      風過鄉
      2026-02-22 09:48:04
      某航飛行員有空姐妻子卻愛上其她空姐,被停飛!

      某航飛行員有空姐妻子卻愛上其她空姐,被停飛!

      中國民航人
      2026-02-22 11:34:21
      黃巖島以東發生激烈對峙!052D合肥艦不顧阻撓,強行加入美菲艦隊

      黃巖島以東發生激烈對峙!052D合肥艦不顧阻撓,強行加入美菲艦隊

      諦聽骨語本尊
      2026-02-19 23:47:56
      終于知道為什么有的房東只租給女租戶,網友分享很真實,畫面感很強

      終于知道為什么有的房東只租給女租戶,網友分享很真實,畫面感很強

      墻頭草
      2026-02-21 10:06:26
      33輪僅取1勝,謝周三積-7分提前13輪降級創造英冠聯賽紀錄

      33輪僅取1勝,謝周三積-7分提前13輪降級創造英冠聯賽紀錄

      懂球帝
      2026-02-22 22:48:39
      綠云軟件沖刺港股:9個月營收2億利潤3457萬 估值25億

      綠云軟件沖刺港股:9個月營收2億利潤3457萬 估值25億

      雷遞
      2026-02-22 08:15:14
      四川成都一佳人好漂亮, 身高169cm,體重48kg 美的讓人移不開眼

      四川成都一佳人好漂亮, 身高169cm,體重48kg 美的讓人移不開眼

      喜歡歷史的阿繁
      2026-02-07 14:21:17
      嚴重下滑!曾經的底特律超跑,艾維能否追上曾經的自己?

      嚴重下滑!曾經的底特律超跑,艾維能否追上曾經的自己?

      籃球實錄
      2026-02-23 00:39:57
      當利潤跌破4%,一場比新車更慘烈的戰爭開始了

      當利潤跌破4%,一場比新車更慘烈的戰爭開始了

      大佬灼見
      2026-02-20 09:03:49
      2026-02-23 03:20:49
      返樸 incentive-icons
      返樸
      科學新媒體“返樸”,科普中國子品牌,倡導“溯源守拙,問學求新”。
      4105文章數 15890關注度
      往期回顧 全部

      科技要聞

      馬斯克:星艦每年將發射超過10000顆衛星

      頭條要聞

      男子持霰彈槍燃燒罐闖特朗普私宅被擊斃 細節披露

      頭條要聞

      男子持霰彈槍燃燒罐闖特朗普私宅被擊斃 細節披露

      體育要聞

      谷愛凌:6次參賽6次奪牌 我對自己非常自豪

      娛樂要聞

      谷愛凌:真正的強大 敢接納生命的節奏

      財經要聞

      特朗普新加征關稅稅率從10%提升至15%

      汽車要聞

      續航1810km!smart精靈#6 EHD超級電混2026年上市

      態度原創

      親子
      時尚
      旅游
      數碼
      公開課

      親子要聞

      萌娃看見阿姨的大肚子竟這樣說,著急的樣子萌化了

      50+女人更適合基礎款,掌握3個高段位搭配思路,輕松提升品味

      旅游要聞

      百余組花燈齊亮!青島這處海邊盛會,年味直接拉滿

      數碼要聞

      古爾曼:蘋果3月2 - 4日發布“至少五款產品”

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版