2025年,隨著DeepSeek等新的大語言模型的推出,關于其在社會各領域應用的討論,特別是關于大語言模型在內容創作領域的討論不斷升溫。對于科普創作者來說,最受關注的問題是:大語言模型的應用究竟能不能替代人類作者?在人工智能時代,科普創作者又該何去何從?
一、大語言模型會取代科普創作者嗎?
當前,科普創作形式多樣,除了以文本為主的文章或圖書外,還有短視頻、音頻、漫畫以及舞臺劇等多種形式。本文討論的科普創作主要是科普文章和科普圖書,因為文本是最基礎的表達形式,其創作邏輯和其他形式也有相通之處。
大語言模型的快速發展為科普創作提供了一種強力工具,與此同時,也對創作者提出了新的要求,帶來了新的挑戰。大語言模型可以分析和總結科學信息,并以預設的邏輯和形式(包括文字、圖片和視頻)進行呈現,以達到向受眾人群傳遞信息的目的。通過自然語言處理技術,大語言模型可以適配不同受眾的認知水平,提供個性化的知識傳播方案。
在實際工作中不難發現,大語言模型收集整合數據的效率遠遠高于人工,并且大語言模型還能發現看似不相關的“獨立事件”之間的關聯性,為創作者提供新的創作視角。
大語言模型創作的質量取決于投給模型的“語料”(數據)。就目前大語言模型生成的內容來看,這些內容通常不是模型自己創造出來的,而是對既有數據庫和網絡數據的深度整合;就其給出的觀點而言,基本也是對已有學術觀點的呈現或整合,或者只是在闡釋方法上有些改進。有時,會出現一些頗具“創造性”的內容或觀點,但很多都是“知識幻覺”,甚至是錯誤的。
在現階段,大語言模型就像神筆馬良手中的畫筆,本質上是強大的工具,并不是替代人類的內容生產者。要想生產優質的科普內容,主導者仍然是人。
二、利用大語言模型開展科普創作的核心是什么?
什么樣的科普書才是好的科普書?數據精確、通俗易懂這些都是必要條件。其實,“有問題”的科普書才是好的科普書。一部優秀的科普書,一定是圍繞一個有趣且有意義的問題展開。
今天,知識更新的速度已經遠超人們的想象。以生物學領域為例,30年前,人們認為DNA上那些不能編碼蛋白質的片段(non-coding DNA)就是“垃圾DNA”;30年前,科學家還在努力破解人類全基因組精細圖譜……30年來,科學家完成了首個完整的人類基因組測序,發現那些“沉默”的基因片段是非常重要的開關[1]。
如今,以教授知識為核心的教育很難跟上科學技術的發展速度。面對迅速變化的科學世界,科普作家的創作還有意義嗎?答案肯定的。
科普創作的重心并不是一味地輸出知識,而是倡導科學方法、傳播科學思想、弘揚科學精神[2],讓受眾具備用科學方法來分析和解決問題的能力。比如,對于“人是從猿猴變化而來的”這一說法,科普創作者可以引導受眾思考“動物園里的猴子為什么沒有變成人”,并基于現代生物進化理論,給青少年讀者講一個關于人和猿有共同祖先的故事——在食物、氣候等條件為變量的自然選擇過程中,人和猿走上了不同的演化道路。在講述過程中,除了普及生物學知識,更重要的是讓受眾理解如何基于生物進化理論去看待、分析問題。
好的科普作品應當展示科學研究歷程,而非科學知識的簡單匯集。創作一本優秀的科普圖書,首先需要確立一個核心問題,并且這個問題是需要經過資料收集、分析整理才能夠清楚作答的。圖書內容應當圍繞核心問題層層展開,引導讀者隨著作者的思路去了解、剖析和學習這個問題,經過探索最終獲取答案。
大語言模型可以協助科普創作者梳理、明確核心問題,讓科普作品在創作之初就帶有優秀基因。學習掌握科學知識、科學方法、科學思維和科學精神,需要進行長時間的反復訓練,學習如何去收集資料、如何分析和解決科學問題并提升思維層次。帶有明確問題意識的優秀科普作品是重要的學習素材,它們給讀者提供的價值遠超過科學知識本身,從“授人以魚”變成“授人以漁”[3]。
三、如何理解大語言模型在科普創作中的價值?
尤瓦爾·赫拉利(Yuval Harari)在《人類簡史》(Sapiens:A Brief History of Humankind,中信出版社2017年版)中闡述了一個頗為獨特的觀點。赫拉利認為,人類的大腦并不是為了處理精確的數字而生的。人類在演化的漫長時間里,所面對的大多數是圖像信息和社會關系信息。進入農業社會之后,數字才變得越來越重要,但存儲和處理數字信息不是人類大腦擅長的工作[4],人類用創造工具的能力來彌補人腦在直接處理海量數字信息時的不足。
數字系統的建立以及電子計算機的出現,讓人類有了處理復雜數字問題的機會。比如,專業研究人員可以利用電子計算機等工具計算出行星的軌道,計算出飛船太空旅行的路線,甚至可以推算出太陽系外正在發生的大事件。大語言模型的出現,讓普通公眾擁有信息處理層面的強大工具。
不同的大語言模型進行推理的方式不同,但是它們都可以幫助科普創作者實現三個層面的工作。一是高效收集和整理資料。大語言模型擁有極強的收集和整理資料的能力,可以節省科普創作者的大量時間。但需要注意的是,創作者要為大語言模型提供盡可能精準的“語料”供其學習,與此同時,創作者仍然需要去精讀高質量的文獻原文,以加深自己對內容的理解。二是發現話題之間的相關性,帶來新的思路。基于大語言模型的運行邏輯,它們不難找出一些隱含在不同科學問題之間的相關性,這對于啟發創作者的思路大有裨益。三是拓展創作形式。大語言模型不僅可以幫助創作者潤色語言、調整文字風格,甚至可以幫助創作者突破原有的內容形態,不再拘泥于文字、繪畫和視頻的界限,將內容用最適合的方式表現出來,創作者在創作過程中不再被表現技法所限制,可以盡情釋放自己的創意。
需要說明的是,有些創作者在嘗試過大語言模型之后,認為對其內容生產沒有幫助。實際上,如果僅僅提供一個簡單的問題,就期待大語言模型創造出一個完美的作品,這樣的嘗試肯定是無效的。創作者必須清醒地認識到大語言模型的特性,并將其結合到自己的創作過程中。
四、如何應對大語言模型對科普創作者提出的挑戰?
隨著大語言模型輔助創作的推廣,單純的文字寫作、繪畫以及視頻剪輯工作很大可能會被模型取代,與核心內容有關的創意、想法將成為稀缺資源。想要成為一個出色的科普創作者,關鍵在于能夠提出讓受眾眼前一亮的科學問題。
對于經歷過很多科研訓練的創作者而言,可以把科研邏輯運用于大模型輔助科普創作當中。科研訓練本身就是一個建成世界觀的過程,構建一個完整且自洽的世界觀對于科普創作者分析和闡釋科學問題大有裨益。比如,所有的生物學問題都可以歸結到生物進化問題上,那么要想做好生物學科普,就需要理解生物進化的理論,以及不同理論之間的差異和生物進化理論的發展過程,而不是簡單停留在“自然選擇”和“用進廢退”這些詞匯的表層意思上。
要做到這點,最簡單的方法就是閱讀經典著作。作為一個生物學工作者,應當深入閱讀《物種起源》(The Origin of Species)等經典著作,并且能夠理解達爾文闡釋的概念,以及論證的邏輯和證據。這不僅僅是一個構建世界觀的過程,也是一個學習講述科學故事技巧的過程。利用大語言模型,構建屬于自己的知識體系,賦予科普作品鮮明的個人色彩,是當下所有科普創作者必須做的事情。
現階段,大語言模型產生幻覺這個問題依然突出,大語言模型產生的非虛構類作品,需要創作者仔細核查,以保證其精確性。前文提到,創作者需要自行閱讀學習高質量的文獻原文,讓自己具備判斷大模型生成內容正確性的能力。作為一種強大的內容生產工具,大語言模型可以輔助科普創作者,提升科普創作效率,新時代的科普創作者應積極擁抱新技術,探索出人機結合的新的創作道路。
通信作者:
史軍,玉米實驗室科普工作室創始人,研究館員,研究方向為植物學和科學傳播。
參考文獻
[1] PENNISI E. ENCODE Project Writes Eulogy for Junk DNA[J]. Science,2012,337(6099):1159-1161.
[2] 中華人民共和國科學技術普及法 [EB/OL].(2024-12-25)[2025-05-07]. https://www.gov.cn/yaowen/liebiao/202412/content_6994555.htm.
[3] 王大鵬 . 愿景與門道:40 位科普人的心語 [M]. 南京:江蘇鳳凰科學技術出版社,2023.
[4] 尤瓦爾·赫拉利 . 人類簡史 [M]. 北京:中信出版社,2017.
本文轉自《科普創作評論》2025年第2期
《科普創作評論》期刊征稿信息
編輯:齊 鈺
審核:鄒 貞
終審:陳 玲
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.