馬年春晚,最大的贏家無疑于是機器人。一套行云流水的武術(shù)表演下來,把全球電視屏幕前的觀眾全部整高潮了。
電商數(shù)據(jù)也同步反饋,春晚開播兩小時,京東機器人搜索量環(huán)比增長超300%,客服問詢量增長460%,訂單量增長150%。新增訂單覆蓋全國100多座城市。包括除夕當(dāng)晚京東上架的春晚同款機器人被瞬間秒空。更讓人意想不到的是,兩臺價值近63萬元的GALBOT通用機器人G1,同樣被搶購。只能說土豪真多。
很多網(wǎng)友在調(diào)侃,春晚導(dǎo)演組重倉了機器人股,還有觀點認(rèn)為節(jié)后A股機器人板塊勢必大漲等等。
那么,是否就應(yīng)該認(rèn)為,我們的機器人產(chǎn)業(yè)已經(jīng)馬上要進入千家萬戶了呢?還有機器人產(chǎn)業(yè)鏈,明天能不能沖?
![]()
本期內(nèi)容我們就聊聊這個話題,當(dāng)然以下內(nèi)容并不是投資建議,因為情緒和資金因素是無法左右的,個人僅對了解的內(nèi)容做一個分享:
先澆一盆冷水,春晚舞臺上大家看到的武術(shù)表演機器人,實際上距離我們想象的,可以陪伴的、替你干活的機器人,還隔著九九八十一難。
之所以它們能夠流暢的進行武術(shù)表演,其核心就是靠動作捕捉加預(yù)訓(xùn)練這兩件法寶:
先由真人武術(shù)演員穿著專業(yè)的動作捕捉設(shè)備打幾遍,把每一招每一式都轉(zhuǎn)化成精確到毫厘的運動數(shù)據(jù)。然后工程師上場,拿著這批“標(biāo)準(zhǔn)答案”數(shù)據(jù),對機器人進行瘋狂的“預(yù)訓(xùn)練”,讓它能一絲不茍地復(fù)現(xiàn)這套固定的動作序列。
通俗理解就是,你在屏幕上看到的行云流水和穩(wěn)如泰山,是在一個高度受控的環(huán)境下,經(jīng)過成千上萬次重復(fù)排練的成果。它不是機器人在臺上自己琢磨這招白鶴亮翅該怎么發(fā)力,而是在刻板地執(zhí)行一個早就寫死在身體里的動作腳本而已。
所以當(dāng)表演完后,會看到這些機器人是跟踉蹌蹌的完成下場,需要每臺配人拿著遙控器像遛狗一樣牽下去。
以上就是春晚機器人的核心技術(shù)邏輯,是不是距離大家的期望還很遠。
接下來談另外一個話題,如果機器人要走進我們的生活,比如幫我們洗碗,幫我們遛狗、幫我們做飯等這類通用目標(biāo),且具備能聽懂、能判斷、能行動,還能應(yīng)對各種突發(fā)狀況的能力,還需要攻克哪些技術(shù)難題?
首先,是感知難題:
實際上,當(dāng)下的機器人根本不知道它看到的是什么。
比如我們?nèi)祟愖哌M一個從未去過的房間,掃一眼就能瞬間判斷理解場景的應(yīng)用情況,比如沙發(fā)可以坐,電視機遙控板怎么按等等。不要小看這些習(xí)以為常的感知能力,因為在機器人的世界里,本質(zhì)上這些都是數(shù)字信號。它需要理解這些場景并做出正確判斷,需要極其強大的視覺感知模型,以及海量、高質(zhì)量且與真實世界高度匹配的訓(xùn)練數(shù)據(jù)。
但這又會陷入一個先有雞,還是先有蛋的循環(huán):
沒有足夠強的感知能力,就無法大規(guī)模部署機器人去收集數(shù)據(jù),而沒有海量的真實數(shù)據(jù),又無法訓(xùn)練出更強的感知能力。
其次,是操作難題:
比如,手比腿就難上一百倍。讓雙足機器人穩(wěn)健走路、跳舞已經(jīng)是地獄級難度了,如果再用手去靈活操作物體,你知道嗎?難度直接飆升幾個量級。
我們的人手有27個自由度,皮膚下密布著觸覺傳感器,能精確感知物體的重量、質(zhì)地、溫度,還能實時微調(diào)抓握的力道。這對人類是呼吸般的本能,對機器人卻是終極噩夢。
目前最先進的機器人“靈巧手”,無論是自由度還是感知精度,都遠遜于三歲孩童。抓個雞蛋可能捏碎,拿個玻璃杯可能打滑。所以,靈巧手是通用機器人落地最關(guān)鍵的卡點之一,不突破這一關(guān),機器人就永遠只是一個能移動的“觀察者”,而不是能干活的“執(zhí)行者”
第三,是決策難題:
這是最核心的,也就是所謂的智能思維。比如你讓機器人準(zhǔn)備午飯,它需要先分解任務(wù),你自己心里詳細思考一下要做盤菜出來涉及哪些細微步驟,不能有缺項,想想就知道背后是極其復(fù)雜的規(guī)劃、推理和即時決策過程。
雖然現(xiàn)在頂尖的大語言模型在純文字領(lǐng)域的推理已經(jīng)很強了,但把這種“語言智能”遷移到機器人身上,讓它能在物理世界里進行實時的推理、規(guī)劃、執(zhí)行閉環(huán),這個融合過程才是最難的部分。學(xué)術(shù)界給這個方向起了個名字,叫具身智能,就是讓智能真正住進一個能行動的物理身體里。目前,全世界都還在這個領(lǐng)域的早期摸索階段,離真正的“機器人靈魂”還非常遙遠。
說到這里,大家是不是認(rèn)為我們又在搞形式主義的自嗨?或者說在貶低我們蒸蒸日上的中國機器人產(chǎn)業(yè)呢?
其實并不是。
其一,機器人產(chǎn)業(yè)是未來產(chǎn)業(yè)科技高地,我們還是要保持謙虛的姿態(tài),不能盲目驕傲,要知道產(chǎn)業(yè)的痛點、難點是什么,接下來究竟該怎么搞。要知道中國進入機器人時代目前才只是開始,還有很遠的路要走。
其二,春晚這個舞臺,本身就是一場頂尖的技術(shù)秀,能做到這個程度,已經(jīng)足夠證明我們在機器人產(chǎn)業(yè)方面的卓越實力,甚至形成了碾壓級優(yōu)勢。
因為通過春晚舞臺,我們至少能看到機器人產(chǎn)業(yè),在2個方面已經(jīng)站到了全球最頂尖的梯隊。
第一是硬件制造能力:
中國的成本控制和供應(yīng)鏈優(yōu)勢,是降維打擊。機器人最核心的硬件三件套-關(guān)節(jié)、電機、減速器,決定了它能不能動、動得好不好、以及能不能便宜量產(chǎn)走向市場。
波士頓動力的機器人,一臺成本估計超過200萬美元,幾十年燒錢都燒不出商業(yè)化,這也是它最終無奈“賣身”現(xiàn)代汽車的根本原因。而像宇樹的人形機器人,對外報價大約9萬美元,折合人民幣65萬左右,在同等運動性能下,價格只有前者的二十分之一。宇樹還在持續(xù)壓低成本,其機器狗產(chǎn)品價格已經(jīng)壓到了兩萬多人民幣,進入了中小企業(yè)買得起的范圍。這背后,是中國制造業(yè)幾十年沉淀下來的、實實在在的護城河,全球任何國家短期內(nèi)都無法復(fù)制。一旦機器人行業(yè)邁入規(guī)模化爆發(fā)的奇點,中國的制造優(yōu)勢將被無限放大。
第二是運動控制技術(shù)。以宇樹為代表的中國公司,已經(jīng)在和波士頓動力這樣的傳統(tǒng)王者正面叫板。讓一臺雙足機器人保持動態(tài)平衡,每走一步,系統(tǒng)都要實時計算身體重心、地面反作用力、每個關(guān)節(jié)所需的精確力矩,容錯率極低,計算量極大。
所以,真正值得咱們驕傲的,根本不是“機器人會上春晚打武術(shù)”這個表象,而是在實現(xiàn)同等甚至更優(yōu)運動性能的前提下,中國能用別人二十分之一的成本把它造出來,還能實現(xiàn)穩(wěn)定量產(chǎn)。這才是硬核的、扎實的、讓人服氣的實力。
最后進行一個總結(jié):
我們機器人的“軀體”和“小腦”(運動控制)已經(jīng)是世界一流,但缺的是“大腦”和“靈魂”。而面對感知、操作、決策這三大難關(guān),當(dāng)前全球最主流的破題方向,叫做“世界模型”。在這方面,我們必須清醒地看到,中國的積累還很薄弱。
世界模型的核心思路,是創(chuàng)造一個極度逼真的虛擬世界,讓機器人在里面無限試錯、加速學(xué)習(xí),再把學(xué)到的經(jīng)驗遷移到現(xiàn)實世界中。這條路一旦走通,就能直接打破前面提到的“數(shù)據(jù)死循環(huán)”。
這方面美國巨頭已經(jīng)形成了密集的布局和強大領(lǐng)先優(yōu)勢,而中國目前基本沒有能夠與之全面抗衡的玩家。這不是悲觀,而是清醒。
只有清醒地知道差距在哪里,才知道該把力氣往哪里使。所以,機器人競賽的下半場,主戰(zhàn)場是“大腦”,是軟件,是人工智能與物理身體的融合。這場真正決定未來的硬仗,其實才剛剛開始。我們必須給予春晚機器人掌聲,但更要把目光投向那掌聲之后,更遼闊、也更艱難的戰(zhàn)場。
更多內(nèi)容,歡迎加入知識星球《譚談財經(jīng)》
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.