![]()
靈巧手堪稱具身智能產業珠峰級的問題。
本文為IPO早知道原創
作者|蘇打
“人工智能到底做什么?我想任何的事情都需要走自己的發展之路。AI發展有兩個維度:一是攀登珠峰,追求最大的投入做最強的模型;二是可以修建公路,有更多的人、更多的場景,讓模型可規模化的使用。這是兩個不同思路”。
據IPO早知道消息,11月22日,IDEA研究院創院理事長、美國國家工程院外籍院士沈向洋在2025 IDEA大會上,從算法范式、智能載體、交互范式、計算架構和數據五個維度梳理了智能的演進,希望幫助創新者在這場智能浪潮中,找到技術的、產品的、商業的切口。
從交互角度看創新同樣非常重要。他認為,今天作為一個產品開發者,“必須要去理解今天的智能特性,會帶來什么樣的交互創新機會。”
作為低空經濟的“探險者”,今年,IDEA不僅帶來《低空經濟發展白皮書4.0:通導監網絡之路》,還發布了由沈向洋領銜的著作《低空時代》。全書從基礎、應用、法規、系統、技術、安全、開放七個篇章,梳理IDEA對低空經濟的認知與實踐框架。
大會現場,IDEA還宣布了兩個新的創新平臺:國際先進技術應用推進中心(深圳)與深港高等研究交流中心(SHARE),以及一系列創新項目。
據悉,目前其創新項目包括DataArc(合成數據促小語種模型發展)、DINO-X Grasp(萬物抓取賦能具身大腦)、經濟超腦、KAIROS決策智能體、Mozi平臺(早期藥物計算發現Copilot)、脫胎于通用編程語言的開發者平臺MoonBit、OpenSILAS 2.0、LIM金融時間序列基座大模型Quant 5.0、GPU原生渲染器SMARAY以及思維實驗室。
目前,研究院創新平臺已包括福田實驗室、國際先進技術應用推進中心(深圳)和深港高等研究交流中心(SHARE)。
以下為沈向洋演講實錄(經編輯):
歡迎大家來到IDEA大會。過去五年,我們得到很多關心和關注,今天非常感慨,也想梳理五年來IDEA研究院做過的工作。
創新有不同的維度,真正大規模的創新最多的錢投入是在工業界,深圳95%的科創投入在企業界和產業界。IDEA有一條自己的創新曲線。
眾所周知,AI三大要素是算力、算法、數據,我再加兩點——交互和載體。
先看第一個維度,算法架構。從2024年9月前OPENAI o1出來到現在,一年間,DeepSeek改變了中國大模型、世界大模型和開源大模型的發展。
新的算法在哪里?應該做什么?我有一些不成熟的想法,很多智能的東西不是全新的概念,我們應該重新讀維納的《控制論》,真正的智能和控制論是徹底連在一起的。強化學習背后的數學原理也是最優控制的一套理論,其中有很多想象空間。
第二個維度是智能載體。早起的模擬實際上都是從語言模型開始的,然后經歷了從抽象到具體、從虛擬到物理的擴展過程。后來大家一直在做多模態,IDEA也做了很多工作。
最近常說的世界模型就是多模態模型的向前一步,加上很多物理規律。世界模型具體到機器人、自動駕駛的車、飛行器就是所謂具身的模型。從載體的維度來看,AI幫我們從理解這個世界到改變這個世界。
第三個維度是交互范式。過去七八十年計算機科學蓬勃發展,很重要的事情是計算機和人類世界交互的方式變化。
在模擬世界階段,AI是被動響應的工具,就像最初的ChatGPT,問一句答一句,這也非常像傳統的搜索。探索世界階段更像持續迭代、循環的過程,你問他答,答了以后再問再答,幫你做Research。我們期望技術能夠強大到,不止能夠問一個問題給一個答案,而是更加像人在做科研時的過程。
第四個維度是計算架構。GPU在2006年開始通用的并行計算系統,一開始是用來打游戲的,后來發現可以挖礦,可以做大模型。
今天探索世界的發展,我們需要的芯片不僅僅是做訓練,越來越多是推理,并逐漸向端側、強化學習專用的芯片發展。這樣的應用需求是非常不一樣的,比如強化學習的芯片要支持快速交互、大規模并行;推理芯片一定要做低功耗、高吞吐專用的需求。我們對整體算力的需求會越來越大,今天的GPU能耗對電力的需求,對整個世界來講都不堪重負。
未來有沒有超越馮·諾依曼的新型計算架構出現?最近量子計算方面就有很多突破性的成果令我們有很多想象空間。
第五個維度是數據。預訓練發展得這么好,要感謝互聯網把世界上有用的數據存到網上。但到GPT3的時候,網上的數據就開始不夠用了,互聯網有400多T的數據,洗干凈只有幾十T的數據可以用,它是靜態的數據、靜態的教材。
所以AI預訓練做得很好的模型,到了探索世界、強化學習的時候,就需要動態的反饋。強化學習需要有系列的動態反饋數據才能真正把探索世界的智能做上去。像騎自行車,光看書不可能學會。未來AI會越來越自主,它要能自己提出假設、收集證據,真正提升智能水平。
![]()
數據和智能的演進是互相推動的,但不是數據越大越好,質量同樣很重要。IDEA研究院有一個很小的團隊最近孵化了一家公司,DataArc團隊,做的就是合成數據。最早的方向是在小語種方面突破語料稀缺瓶頸,比如英文互聯網網上的語料有不到500T,阿拉伯語言只有4.5T,其中有100倍的差距。
今天我們非常高興發布DataArc SynData開源框架,幫助做小語種的用戶專注業務場景提高研發效率,把過去所需的2000行代碼縮小至50行,提升非常大。這個團隊從福田IDEA研究院幾個小伙子的兩篇論文開始,一年內就成為初創企業,接下來還有很多海外拓展機會,比如中東。
![]()
我想通過這個案例表達的是,人工智能到底做什么?
我想任何的事情都需要走自己的發展之路。AI發展有兩個維度:一是攀登珠峰,追求最大的投入做最強的模型;二是可以修建公路,有更多的人、更多的場景,讓模型可規模化的使用。這是兩個不同思路。
數據之外,模型層面也有很多大的機會,例如,IDEA的郭健院長一直帶領團隊在金融方面做了很多的工作,從2021年全球最大的金融行為知識圖譜、2022年的Quant4.0,還有2023年的Alphagpt,以及2024年端到端金融預測模型。物流數據的微調提效,還是金融這種垂直場景里摸高,智能的演進中蘊藏無限機會。
![]()
另外,Agent是模型落地的一個重要產品載體。今年,我們迎來了Agent創新的爆發,在個體、公司、治理和創新等方面帶來了改變。
一個事實是,“個體+AI”已經能夠完成過去一個團隊才能完成的工作。例如,IDEA思維實驗室的一位設計師同事,為一家時尚品牌做的廣告片,從市場調研到內容策劃和制作,都由他一人利用AI工具完成。
生產力決定生產關系,當生產力發生如此大的躍遷,封裝在公司這個組織形態下的生產關系,必然發生根本性變化。這將是一個全方位的演化。
傳統公司里,復雜任務需要拆解成多個環節,分配給不同角色,用流程來銜接,用考核質檢來保證品質。這個體系的核心前提是,單個人能力的水平必須通過分工協作、規定具體任務來完成復雜任務。
但當個體能力被放大10倍、100倍后,很多原本需要多環節協作的任務,可以由單個超級個體端到端完成。這個時候,公司的核心職能不再是“拆解任務、分配工作”,而變成如何成就超級個體,讓他們發揮出最大的生產力。
![]()
組織的重心,在某些領域中,會從管控到定義問題、融合超級個體之間的協作。在生產關系的變化之上,將是認知的變化,超級個體不是少數天才的特權,而是普通人的標配。
我們正站在范式轉化的臨界點。不管是在AI時代從零誕生的公司,還是目前已經成熟運作AI升級的公司,未來都會發生非常大的變化。IDEA的CTO工作室就是是我們研究院對接外部創新需求,在產業中運用頂尖技術的容器。
AI Agent在公司的應用場景是非常豐富的,換個角度,也可以將AI Agent想象成AI員工。其中有很多機會,比如政府、機構。其中政府統計局是一個非常重要的角色,要做很多數據分析,以前幾乎都是人工肩挑手扛、找數據、整材料、寫報告。去年我們發布了經濟超腦1.0,可以看懂數據,AI Agent加入以后,還可以對問題進行規劃、亮點提煉和分析。
我們今天也非常高興和南山區政府達成合作,特別是和南山區統計局合作發布的經濟超腦2.0,已經在南山落地,可以做很重要的中間工作,包括提出問題、目標拆解、關聯搜索、匯總、結論等。未來我們也希望有更多落地機會。
未來,創新AI Agent將帶來巨大機會,而且是影響人類發展的。AI for Science非常重要,科學的發展就是工具的發展。去年我們分享了IDEA研究院的化學大模型,發布了分子、抗體、反應、藥物、文獻。
今年有更大的突破,可以用作新藥的發現。我們的論文已經發布在《CELL》上,也很高興發布新的藥物平臺:Mozi平臺。它不僅是AI智能體和工具箱,還可以真正解決傳統做藥物早期計算里面的痛點,比如工具誤導、研發黑箱、工作瓶頸。
![]()
舉個例子,用Mozi平臺為帕金森病設置藥物,AI Agent可以把這件事情串起來。一是選靶點,通過后臺的研究可以鎖定靶點;二是做AI的設計和篩選,很快鎖定高清合理的分子,同時系統可以幫你做很多AI智能的安全過濾。這個過程中我們又做了一步,輸出時可以交付藥物分子候選物,甚至可以寫一個綜合的研究報告。通過簡單的輸入可以達到現在臨床一期分子的質量。
我們還做了渲染器和MoonBit兩個項目,5年來獲得了IDEA研究院、福田、深圳市政府、耐心資本的支持,希望可以真正轉化為生產力。
MoonBit是AI時代的編程語言。在計算機發展歷程中,每隔十幾、二十年就會出現非常主流、非常重要的語言,比如50年代的科學計算語言,60、70年代的C語言、unix,90年代的JAVA以及90年代后期的python語言。過去十幾年,最重要的語言就是NVIDIA推出的CUDA語言對GPU進行編程。今天大模型蓬勃發展實際上是呼喚新語言的誕生。不僅新語言未來會出現,AI編程這件事情也是非常明確的。
2025年大模型落地能賺到錢,市場愿意付錢的就是AI Coding,從OpenAI到谷歌、Gemini對此都推動得非常強。目前國內也已經有很多Coding系統,阿里、字節都有推出來。今天AI編程已經等同于超過1500萬程序員。
IDEA做的MoonBit語言由張宏波帶領團隊,非常期待明年波MoonBit的語言超過100萬,真正步入世界主流的編程語言之列。
接下來,我想花點時間講一講具身智能和機器人。在福田、在深圳,這是我們巨大的機會。
我經常用Gartner的AI技術成熟度曲線,把現在所有人工智能的技術進行分類,從一開始的量子走到具身智能,再到2025年AI Agent元年,還能活到現在的就是有道理的。
大家都相信一件事情,肯定有商業價值,就是AI云服務。黃仁勛老賣芯片、微軟賣云服務都賺錢了。
但這條曲線我想講的是具身智能帶來的龐大機會,很重要的原因是長期的支撐、協同進化、工程系統。機器人是很好的例子,但具身智能不一定是機器人,我覺得大灣區有非凡的機遇,這句話是去年11月份在香港科技大學我跟黃仁勛對談時講的。他說粵港澳大灣區是機電一體化技術和人工智能技術同時蓬勃發展的例子,人工智能在這里有非常了不起的機會。因此,我們也一定要抓住這個機會做一些了不起的工作。
![]()
具身智能最難的問題就是“靈巧手”,靈巧手是具身智能以后復雜度最高的,堪稱珠峰級。馬斯克的特斯拉縮減了人形機器人Optimus的生產計劃,因為機器人的手和前臂技術占了機器人工程難度的絕大部分。IDEA研究院張磊帶領的團隊很長一段時間的工作就做一件事情,抓取。
這個動作很困難,機械手現在還不行。人類的一只手,五只手指有27個自由度,一只手上的觸覺傳感器2.7萬個,不僅可以抓還可以感,反應是毫秒級的。
所以在AI面前人類還有最后的尊嚴,就是靈巧手。不知道什么時候這個技術會被AI攻破,我想攻破的話也是在深圳被攻破。
![]()
具身智能方面,過去一年IDEA研究院成立了三個新的中心,第一個新的中心就是福田實驗室,聚焦機器人,由我們和騰訊公司合作。今天我們也推出了國內首個以模塊化的方式提供大模型、開發工具和數據服務的具身智能軟件平臺。
這幾年,IDEA大會最后一個環節的演講都是低空經濟。
低空的發展是技術管理經濟的螺旋式上升,事實上真正的低空經濟要能落地還是需要場景、系統投入、因地制宜。其中有很多制約,可以分成萌芽期、驗證期、成長期、成熟期、進化期五個進化的階段。
一個簡單的標準,你的城市能有多少架飛機和無人機飛起來?大多數城市目前可能只有數百架。低空經濟發展最好的深圳,每天飛到天上真正產生經濟效益的無人機數量大約在1000架,還處于成長期。
推動低空的進化要從可通達做到可計算、可運營,最后做到可進化,幫助大家真正理解進化的過程。過去這些年我們有了一套自己的方法論,把低空這件事穩步的向前推進,也走了一條自己的實踐路徑,探索、驗證、推廣。
![]()
很多人都在問低空經濟是什么?給我們帶來什么樣的機會?如何改變未來的生活、產業?我們今天也發布了研究院出品的《低空時代》這本書,希望通過這種方式和大家分享過去一年團隊技術、產業、經濟跨學科的深度思考。
特別感謝過去五年,深圳給了我們包容和耐心投入,這座城市正在率先打開人類通向低空時代的新篇章。
謝謝大家!明年再見。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.