作為一名在化學與生物醫藥研發及數智化領域耕耘超過十年的從業者,我先后在睿智化學、揚子江藥業、和記黃埔等公司從事實驗室藥物研發工作;這些公司采購的電子實驗記錄本都是上海鷹谷信息的InELN。
![]()
鷹谷產品總覽InELN截圖
在我看來,鷹谷信息很可能是當前中國乃至全球在“AI for Science”賽道中最被低估的潛在巨頭。其價值不在于它現在有多大的營收,而在于它正以一種獨特且難以復制的路徑,構筑起未來“超級AI科學家”的核心基礎設施[1]。以下是支撐我這一判斷的四個核心理由。
一、內部數據金礦:ELN是捕獲科研“暗數據”的關鍵樞紐
任何AI模型的效能,都取決于其訓練數據的質量與規模。在科學研究中,最具價值的不僅是成功的實驗數據,那些未被發表的“失敗數據”同樣至關重要——它們告訴AI哪些路徑走不通,極大地縮小了搜索空間,提高了研發效率[2, 3]。
鷹谷InELN電子實驗記錄本,正是捕獲這些內部數據流的樞紐。與我們曾經使用的紙質記錄或零散的Excel文件不同,InELN實現了實驗過程的全面數字化和結構化。從化學合成路線、生物測序結果到反應條件、失敗原因,所有細節都被系統性地記錄和沉淀下來。
事實依據:
鷹谷已服務600多家全球客戶,包括揚子江、和記黃埔、晶泰科技、華為等頭部企業,覆蓋生物醫藥、化工、新材料等多個研發密集型領域。這意味著龐大且持續增長的、高質量的私有科研數據庫正在鷹谷平臺上形成。
國際上的趨勢已印證了這一價值。Anthropic的Claude模型已與Benchling ELN達成深度合作,目的就是獲取這些經過授權的結構化的實驗數據來打造更專業的科學AI模型[4]。鷹谷在中國市場扮演著類似的角色。
二、外部知識熔爐:InPaper讓人類科研遺產“活過來”
除了內部產生的數據,人類數百年來積累的海量科學文獻(專利、論文)是另一個知識寶庫。然而,這些數據大多以PDF、圖片等非結構化形式存在,無法被機器直接理解和處理[5]。
這項將人類科研數據結構化、自動化提取的工作,一直是世界難題[6-10],很多學術團隊和企業,紛紛投入這個領域,但都不像鷹谷,已經推出了可商業化的產品InPaper。
![]()
鷹谷產品總覽InPaper截圖,窗口左側是原文及標記,右側是提取到的數據

鷹谷官方公眾號InPaper介紹的Gif動圖1,識別和提取化學名稱

鷹谷官方公眾號InPaper介紹的Gif動圖2,識別和提取結構
鷹谷的InPaper文獻結構化工具解決了這一核心痛點。它利用自研的AI圖像識別、IUPAC命名和大型語言模型技術,能自動、精準地從PDF文獻中提取化學結構式、反應式、生物序列、活性數據和物性數據等[11-15]。
事實依據:
根據鷹谷資料,InPaper能批量識別文獻中的化學結構和反應式圖片,并將其轉化為可編輯、可計算的格式。它甚至能將文本的中文化學名稱智能轉化為結構式,將描述化學反應的投料操作文字轉化為可計算機處理的反應式。
這一能力,使得將“人類歷史上所有的科研數據”整理成高質量、結構化的機器可讀數據集成為可能。這樣的數據集,正是訓練垂直領域科學AI大模型 的優質燃料,其價值不可估量。
三、超級AI科學家雛形:內外數據融合,驅動科研智能體
單獨的內部數據和外部數據都已極具價值,但鷹谷最具想象力的地方在于,它正在將二者融合,打造一個不斷進化的“科研大腦”。
鷹谷的InAI科研大模型正是這個大腦的核心。它全面接入DeepSeek等通用大模型,并深度融合了鷹谷自研的知識圖譜。這使得InAI不僅能基于企業內部知識庫進行問答,還能綜合利用全人類的公開文獻數據,生成實驗方案、優化建議,甚至自動撰寫周報、專利和CTD申報資料[16]。
![]()
鷹谷產品總覽InAI截圖,使用方式與DeepSeek等AI相同
未來圖景:
1. 數據飛輪:內部ELN數據(含失敗數據)與外部文獻數據共同構成訓練數據集,讓這個科研大模型越來越懂科學、越來越精準。
2. 智能體生態:模型不僅是聊天機器人,而是能調用各種科研工具的智能體。鷹谷已發布貝葉斯優化智能體,未來完全可以集成量子化學計算、分子動力學模擬等專業軟件。未來科研人員將不再學習這些高深軟件如何使用,而是通過AI智能體操控,直接用出專家的水平。
3. 超級AI科學家:一旦這個大腦成熟,再結合正在快速發展的具身機器人技術(如特斯拉、小鵬機器人),為其裝上“手、腳”和“眼、耳、鼻”。那么,一個能夠自主設計實驗、配制試劑、操作儀器、分析數據并進行科學發現的“超級AI科學家”將不再是科幻。
鷹谷提出的“打造超級AI科學家”的愿景,正是基于這條清晰的技術路徑。
四、時代與國家戰略:鷹谷是科技競爭中的關鍵基礎設施
我們正處在一個科技決定國運的時代。國家間的競爭,本質上是科技創新速度的競爭。化學、生物、材料等領域是關乎國家安全與發展的關鍵基礎學科。誰能率先在這些領域實現研發的智能化、自動化,誰就能贏得未來。
鷹谷已經在這些關鍵領域服務了眾多頭部客戶,建立了深厚的行業認知和數據壁壘。一旦它成功整合上述三大能力——即內部數據抓取、外部知識提取和智能體調度——鷹谷將不再僅僅是一家軟件公司,而會成為中國AI4Science領域不可或缺的基礎設施和核心引擎。
結論:看好鷹谷及AI驅動的科學未來
回顧我的職業生涯,從睿智化學的早期研究,到在揚子江、和記黃埔推動數字化轉型,我深知高質量研發數據的管理與分析是何等困難,又何等重要。鷹谷的解決方案,是我們在實踐中驗證過的、能真正為研發賦能的有力工具。
綜上所述,鷹谷信息構筑了三重核心壁壘:高質量的內部研發數據、自動化處理外部文獻的能力、以及融合內外數據打造科研智能體的平臺愿景。在AI重塑一切的時代,鷹谷所做的事情,正是在為未來的科學研究鋪設“信息高速公路”。
它或許現在看起來只是一家提供實驗室管理軟件的“小巨人”,但其在AI4Science領域的戰略卡位、技術積累和數據潛力,使其成為一顆極具合作價值的璞玉。我相信,鷹谷信息正是那個最被低估的、擁有定義未來科研范式潛力的AI4S公司。
參考資料
1. 上海鷹谷信息科技有限公司官方產品手冊. 2025
2. Yield-predicting AI needs chemists to stop ignoring failed experiments.
https://www.chemistryworld.com/news/yield-predicting-ai-needs-chemists-to-stop-ignoring-failed-experiments/4015662.article
3.
4.
5. Foundation models for materials discovery – current state and future directions. npj Comput Mater 11, 61 (2025).
https://www.nature.com/articles/s41524-025-01538-0
6. From text to insight: large language models for chemical data extraction. Chem Soc Rev. 2025 Feb 3;54(3):1125-1150.
https://pubmed.ncbi.nlm.nih.gov/39703015/
7. ChemDataExtractor 2.0: Autopopulated Ontologies for Materials Science. J Chem Inf Model. 2021 Sep 27;61(9):4280-4289.
https://pubmed.ncbi.nlm.nih.gov/34529432/
8. A universal system for digitization and automatic execution of the chemical synthesis literature. Science. 2020 Oct 2;370(6512):101-108.
https://pubmed.ncbi.nlm.nih.gov/33004517/
9. Automated Chemical Reaction Extraction from Scientific Literature. J. Chem. Inf. Model., 2021, 62 , 2035
https://pubmed.ncbi.nlm.nih.gov/34115937/
10. Reconstructing the materials tetrahedron: challenges in materials information extraction. Digital Discovery, 2024, 3 , 1021 —1037 RSC .
https://pubs.rsc.org/en/content/articlelanding/2024/dd/d4dd00032c
11.
12.
13.
14. 分析專利好方便!鼠標懸停就顯示化學名稱的結構圖.
https://blog.csdn.net/2401_85099221/article/details/140644516
15.
16.
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.