![]()
圖源:Unsplash
撰文 | 張天祁
過去幾年,“人工智能學院”在中國高校中迅速鋪開,據不完全統計,已經有超50所高校開設了“人工智能學院”。在這一波浪潮中,北京大學深圳研究生院選擇了建立一所面向“科學智能”(AI for Science)的學院,把人工智能的重心放在基礎科學問題上。
傳統的AI教育更多是培養算法和工程人才,而 AI for Science 的目標,則是用AI去重塑和加速基礎科學的發現過程。正如AlphaFold對生物學產生的影響,這種模式試圖將AI從一個應用工具,轉變為驅動物理、化學、材料等基礎科學產生源頭創新的關鍵。
“我們認為,未來從事數學、物理、化學、生物、材料等基礎研究的科學家,應當積極擁抱AI,適應這種科研范式變革,否則他們的研究很可能就會落后”。北京大學深圳研究生院副院長、科學智能學院執行院長田永鴻在與《知識分子》的對談中,這樣表達學院選擇AI for Science的考量。
知識分子:我們注意到現在很多高校都在成立人工智能學院,為什么北京大學深圳研究生院會選擇“科學智能”(AI for Science)這個方向?
田永鴻:之所以選擇AI for Science這個方向,主要有兩個層面的考量。
首先,我們看到一個清晰的趨勢:人工智能正在深刻地改變科學研究的范式。一個非常典型的例子就是蛋白質折疊預測。AlphaFold一出來,在一兩年之內,幾乎把全球所有的蛋白質結構都預測完了。這就是AI的魅力。它作為一個強大的工具,正在重塑科學研究的模式。
我們認為,未來從事數學、物理、化學、生物、材料等基礎研究的科學家,應當積極擁抱AI,適應這種科研范式變革,否則他們的研究很可能就會落后。
其次,這個選擇也與北京大學整體的發展布局相契合。北京大學深圳研究生院建院二十多年來,形成了學科交叉氛圍濃厚的學術環境。這為我們探索AI for Science的新模式提供了一塊創新的試驗田。北大本部在數、理、化等基礎學科上力量非常雄厚,我們希望在深圳先探索經驗,如果成功,未來可以將這些好的經驗和模式推廣到北大本部乃至全國,起到一個探索的作用。
知識分子:在您看來,當前制約“AI+Science”快速發展的最大瓶頸是什么?科學智能學院的成立,能在多大程度上改變這種局面?
田永鴻:核心要解決的,就是人才短板問題。
現在在很多傳統行業,比如醫藥領域,大家都知道AI重要,但具體怎么做很少有人知道。舉個例子,我們對一些公司的調研時發現,從他們的院長到研究員,都意識到要用AI工具。但他們實際在用的,很多還是十年前的傳統統計學習方法。對于大模型等新技術,他們一方面覺得很重要,另一方面又不知道該怎么用。
連領軍企業都面臨這種困惑,可想而知廣大企業有多么缺少既懂AI又懂基礎科學的復合型人才。我們希望通過建立這個學院,能夠大量培養這樣的人才,以解決現存的短板問題。
知識分子:過去很多“AI for Science”項目,往往是由具體的實驗室或科研團隊以跨學科合作的方式完成的。為什么現在需要將AI for Science系統化,專門建立一個學院來培養交叉人才呢?這種培養模式和傳統的跨學科合作有何不同?
田永鴻:坦白說,傳統的跨學科合作模式我們已經走了很多年,但始終存在一些難以解決的痛點。
首先是合作問題。比如一個做生物的老師和一個做 AI 的老師要合作,對方可能自己的項目都忙不過來,未必有精力參與,這種情況大量存在。即便合作了,第二個難題是成果的知識產權歸屬。項目做完后,論文誰做第一作者,誰做通訊作者?直到今天,這依然是高校里難以解決的難題。
搞科學的人往往認為,自己定義了科學問題、提供了數據,理應是主導。而做AI的人則認為自己提供了關鍵的工具和方法,也應獲得相應的認可,這個矛盾很難調和。
最關鍵的,對于參與合作的學生來說,完成的交叉學科學位論文,由哪個學科的學位委員會來評審和把關?傳統的學科體系是分離的,搞數學的、化學的、計算機的各有各的委員會和評價標準。一篇交叉學科的論文,兩邊的評委可能都看不懂,也找不到合適的評審人,導致學生的畢業和評價都面臨困難。
知識分子:科學智能學院的模式,與傳統跨學科合作相比,有什么不同?
田永鴻:我們推行雙導師制,兩位來自不同學科的老師從一開始就有共同的責任,他們的成果就是培養AI for Science的人才。這樣一來,合作的意愿問題自然就解決了。兩位導師共同指導一個學生,知識產權的問題也更容易通過協商解決,學生的歸屬是明確的,不必再去爭“一作”或“通訊作者”。
學院會設立專門的交叉學科學位評定分會,來負責評審這類跨學科的論文。這樣從制度上改變了過去那種依賴個人自學或零散合作的模式,使得交叉人才的培養能夠系統化、制度化,從而真正推動AI for Science的發展。
知識分子:您剛才提到了雙導師制,這個制度在實際運作中是如何分工的?
田永鴻:雙導師制是我們針對當前現實的一個核心設計。坦白說,現在全球范圍內既懂AI又懂Science的科學家鳳毛麟角,我們很難找到足夠多的單一導師來培養這樣的學生。所以,我們采用兩位導師共同指導一個學生的模式。這兩位導師最好過去有合作基礎,至少也要有強烈的合作意愿。
在指導過程中,他們的分工是明確的。科學導師負責定方向,也就是判斷哪些科學問題是值得做的、是這個領域幾十年來沒解決的難題。AI導師則負責定技術路線,他要分析這個科學問題是否能用AI技術來加速或解決。
兩者結合,共同指導學生。也意味著學生匯報工作時,兩位導師需要同時參加。這個制度增加了導師的時間成本,學生的學習時間和內容也更多,但獨特的培養和研究經歷也會帶來更優秀的競爭力。
知識分子:談到評價,過去有一種說法,交叉學科在現有的科研評價體系里其實是比較吃虧的。作為一個新學院,科學智能學院會如何改革科研評價體系,避免被現有體系同化?
田永鴻:科研評價是指揮棒,如果指揮棒沒弄好,交叉學科一定做不好。我們當然不可能憑學院之力徹底解決這個歷史問題,但我們正面臨一個很好的改革機遇。現在全社會已經認識到,發展交叉學科是必須要做的事情,整個學術界對交叉學科的包容度也在提高。
在學院內部,我們已經有了一些初步的探索。首先,對于學生的評價,北京大學專門設有一個交叉學位評定分會,我們AI for Science的學生論文就歸這個分會來評審。這個分會是從交叉學科的視角來評價學生的學位論文。
其次,在教師的科研成果認定上。學院會在自己的學科領域內,率先認可共同第一作者、共同通訊作者具有同等貢獻,在計算工作量、認定成果時予以同等考量。我們認為,在一項AI for Science的研究中,科學和AI兩個方面的貢獻是同等重要的。這個成果是雙方緊密合作才能做得又快又好,必須拋棄傳統的主次之分觀念。
當然,我們一所學院的探索只是局部的。更大范圍的評價體系改革,還得靠國家來調整這個指揮棒。這會是一個長期的過程,不可能一蹴而就,但我們希望通過這樣的探索,慢慢引導形成一種新的、認可交叉融合的科研文化。
知識分子:在課程設置上,AI會與哪些學科交叉?
田永鴻:在課程設置方面,我們首批設立的交叉方向主要集中在AI與物理、化學、生命科學和材料科學的融合。當然,這只是我們的起點。未來,AI的應用會滲透到更多理工學科,如能源、環境等,甚至會擴展到人文社科領域。
在我們當前的培養體系中,課程設計概括為“一體六向”。“一體”指的是所有學生都要修的公共基礎課程平臺。這個平臺包括三類課程:一是導論課,如《人工智能導論》和《科學智能導論》;二是計算與智能課,涵蓋機器學習、科學計算和編程;三是交叉基礎課,如《科學第一性原理》和科學實驗方法。
在完成這個“一體”的學習后,學生再根據自己的興趣和方向,進入不同的專業選修課模塊,也就是所謂的“六向”。例如,選擇AI for Life Science方向的學生,會選修計算生物學、蛋白質組學、AI藥物設計等課程;而AI for Materials方向的學生,則會學習計算材料學、材料模擬等專業課程。
知識分子:在具體的平臺建設上,學院如何規劃“AI for Science”的落地?
田永鴻:AI for Science 的研究與教學,與傳統 AI 有很大不同。傳統 AI 培養中,一個學生可能有算力平臺支撐就夠了。但我們不僅需要算力和數據,更關鍵的是要有一個“干濕閉環”的實驗平臺。這里的“干實驗”指 AI 模型的設計與計算,“濕實驗”則是真實的物理、化學、生物實驗。我們希望將兩者緊密結合,讓學生在校期間就能在這樣的平臺上訓練,掌握新的科研模式。
舉例來說,假設要設計一種新藥分子,首先會在計算機上用 AI 大模型生成候選分子序列,篩選出最有希望的幾個,并自動生成實驗方案,由自動化實驗機器人執行合成與驗證。自動化設備不僅提高效率,也降低了 AI 背景學生操作復雜實驗的門檻。實驗完成后,數據會自動回傳、可視化分析,并反饋給模型,形成高效的自動化迭代閉環。這樣的設施與環境,是傳統 AI 或傳統實驗室所不具備的。
知識分子:在數據資源和算力共享方面,學院會如何推動“AI for Science”的基礎設施建設?
田永鴻:在建設這樣的平臺過程中,我們的目標不僅是提供 AI for Science 的科研基礎架構,更重要的是推動科學數據的共享。長期以來,許多科學家習慣將自己的數據牢牢掌握在手中,結果就形成了成千上萬個零散孤立的“數據孤島”。
但在未來的大科學研究中,只有把分散的數據匯聚起來,才能取得真正突破。那些率先收集、整理并共享大科學數據的團隊,將更有機會產出重大成果;而堅持“數據私有化”的模式,則會大大放慢研究進展,甚至難以取得實質性成果。這一趨勢也會推動科學界的數據共享模式發生根本變化。
我認為這是一個重大的機遇。鋪設這樣的新型設施,就像建設高鐵或發展電動汽車一樣,是具有長遠價值的基礎性工作,對國家科技發展意義重大。
知識分子:學院地處粵港澳大灣區,這里有非常活躍的創新文化和企業集群。學院會如何與產業界合作?
田永鴻:我們正在和多家企業探討合作,合作形式可以很多樣,比如共建實驗平臺,或者采用企業出題的方式,由企業提供真實的產業疑難,作為我們學生的實訓課題。而我們的角色,就是把企業帶來的這些實際問題進行提煉和升華,剝離掉具體的工程細節,找出其中最本質的科學或技術挑戰,讓我們的師生來攻克。
知識分子:現在很多人在討論,AI有沒有可能自主發現一些新的科學定律,而不只是在現有框架內做一些高效的預測和計算?您對此有什么看法?
田永鴻:這可以說是AI for Science研究的終極目標之一。隨著技術的發展,這種可能性是一定會有的。在當前階段,AI的主要作用還是加速科學發現。
它體現在“干實驗”環節,我們用大模型高效探索合成路徑;也體現在“濕實驗”環節,我們用自動化機器人并行做實驗,效率遠超人工。過去做碳納米管材料,一天可能才能做一組數據,現在,機器人一晚上就能得到十組,而且數據重復性非常高。這種速度本身就對科研推動巨大。
實際上,AI自主發現的苗頭已經出現。我們下一步就是要讓AI模型通過學習海量的科學數據,進一步具備提出科學假設,甚至對某些科學問題進行自主探索的能力。我相信這一天的到來不會太久。當然,要解決像哥德巴赫猜想那樣更深層次、更難的問題,還需要很長的時間。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.