![]()
跨物種交流的愿景
2005年,在谷歌尚未退出中國大陸時(shí),百度曾喊出:百度更懂中文”。再后來,在2017年的百度世界大會(huì)上,李彥宏說百度要從“更懂中文,變成“百度更懂你”。八年后,百度可能要說“更懂動(dòng)物了”。
五一長假之后,媒體通過天眼查App了解到,百度剛剛申請了一項(xiàng)專利,內(nèi)容是“動(dòng)物語言轉(zhuǎn)換方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)”。
把這項(xiàng)專利內(nèi)容翻譯成大白話大概是這樣的:百度通過記錄貓狗等動(dòng)物的聲音、行為和體征,將其生成一套多模態(tài)數(shù)據(jù)系統(tǒng),據(jù)此再對(duì)動(dòng)物情緒進(jìn)行識(shí)別,同時(shí)翻譯成人類語言輸出。
百度專利稱,該技術(shù)能夠?qū)崿F(xiàn)動(dòng)物與人類之間更深層次的情感交流和理解,提高了跨物種溝通的準(zhǔn)確性和效率。
刷到這則新聞時(shí),我正好和一位養(yǎng)貓的朋友在一起,我問他家里貓叫的時(shí)候,能知道它想干什么,他說貓基本上只有有事的時(shí)候才會(huì)叫,但他無法把某種具體的貓叫聲和貓的意圖進(jìn)行準(zhǔn)確對(duì)應(yīng)。
貓狗情緒研究原理
在百度公布這項(xiàng)專利前的一個(gè)月,印度普拉迪卡蘭拉姆克里希納·莫爾學(xué)院的兩位學(xué)者維賈伊·蘇尼爾·賈達(dá)夫和桑托什·賈格特,發(fā)表了一篇論文,內(nèi)容和百度專利非常相似:“利用人工智能進(jìn)行動(dòng)物面部檢測以理解其情緒和行為”。
![]()
![]()
![]()
這篇論文回顧了過往AI學(xué)者對(duì)動(dòng)物表情的代表性研究:
一項(xiàng)涉及狗面部表情的案例研究中,數(shù)據(jù)集訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)(CNN)在一萬張圖像的數(shù)據(jù)集上進(jìn)行訓(xùn)練。該模型在區(qū)分快樂、恐懼和中性表情方面達(dá)到了88%的準(zhǔn)確率,核心貢獻(xiàn)是發(fā)現(xiàn)狗狗獨(dú)特的特征,如耳朵的位置、口型和眼睛睜開程度,是情緒狀態(tài)的關(guān)鍵指標(biāo)。
另一項(xiàng)研究則把類似的方法被應(yīng)用于貓,在5000張貓咪面部表情圖像上進(jìn)行訓(xùn)練,但確率比狗要略低,為80%,表明貓科動(dòng)物的表達(dá)面臨特殊挑戰(zhàn)。貓的情緒狀態(tài)受到外界刺激的影響比狗要大,使數(shù)據(jù)收集變得復(fù)雜。此外,貓?jiān)诿娌勘砬樯媳憩F(xiàn)出微妙的變化,使得檢測更具挑戰(zhàn)性。
這兩項(xiàng)研究證實(shí)了許多人的猜測:無論貓還是狗,它們的表情中都能反應(yīng)情緒。狗可以表現(xiàn)出快樂,恐懼,焦慮,甚至嫉妒的跡象。認(rèn)識(shí)到這些情緒可以提高訓(xùn)練和行為矯正技術(shù)。貓的表情比狗要復(fù)雜,但結(jié)合肢體語言,你也能窺探到它們的快樂、沮喪和壓力這些內(nèi)心戲。
從人臉識(shí)別到讀心術(shù)
當(dāng)前的AI技術(shù)對(duì)人臉和情緒識(shí)別準(zhǔn)確率已經(jīng)趨于成熟,通過分析語音的音調(diào)、語速、音量、停頓等特征,AI可以較為準(zhǔn)確地判斷說話者的情緒(如憤怒、快樂、悲傷、驚訝等)。在標(biāo)準(zhǔn)數(shù)據(jù)集上,準(zhǔn)確率可達(dá)70%以上;利用計(jì)算機(jī)視覺技術(shù),分析面部肌肉運(yùn)動(dòng),如微笑、皺眉、瞪眼等,情緒判斷的準(zhǔn)確率在理想條件下可達(dá)90%以上。
最前沿的情緒識(shí)別系統(tǒng)往往融合語音、圖像、文本和生理信號(hào)等多種數(shù)據(jù)源,并且已進(jìn)入實(shí)用化階段,廣泛應(yīng)用于智能客服、健康醫(yī)療、車載安全、教育娛樂等領(lǐng)域。
人類情緒識(shí)別技術(shù)已經(jīng)開始進(jìn)入商用,智能手表、健康手環(huán)等可監(jiān)測用戶生理信號(hào),分析壓力、焦慮、愉悅等情緒狀態(tài),提供健康建議;微軟通過Microsoft Azure Emotion API提供基于云的面部表情識(shí)別服務(wù);初創(chuàng)公司Affectiva(已被Smart Eye收購)則專注于車載和廣告領(lǐng)域的情緒識(shí)別。Amazon Alexa阿里小蜜、百度度秘等語音助手均集成了情緒識(shí)別模塊。
但考慮到用戶隱私和倫理的問題,基于人類面部特征的商業(yè)化短期不太可能走得太遠(yuǎn)。
2020年,有中小學(xué)引入AI攝像頭監(jiān)測學(xué)生上課表情、情緒,家長和社會(huì)質(zhì)疑侵犯學(xué)生隱私、加劇心理壓力,最終被叫停,教育部等部門明確要求規(guī)范AI在校園的應(yīng)用,保護(hù)未成年人權(quán)益。2022年,部分企業(yè)、法院試點(diǎn)用AI分析面試者、被告情緒,媒體和專家質(zhì)疑科學(xué)性和倫理風(fēng)險(xiǎn)。
海外大廠早已布局動(dòng)物情緒研究
把對(duì)人情緒識(shí)別能力復(fù)用到動(dòng)物身上,只是時(shí)間問題。百度并非先行者。亞馬遜、谷歌、PetPace、Petronics等公司早在好幾年前,就曾申請過與動(dòng)物聲音識(shí)別、情感分析相關(guān)的專利。
谷歌在2017年就申請了一項(xiàng)與動(dòng)物情緒識(shí)別相關(guān)的專利,該專利提出了一種利用傳感器和機(jī)器學(xué)習(xí)技術(shù),對(duì)動(dòng)物的情緒和健康狀態(tài)進(jìn)行分析的方法和系統(tǒng)。谷歌的專利推動(dòng)了動(dòng)物情緒識(shí)別領(lǐng)域的技術(shù)發(fā)展,相關(guān)思路和方法被PetPace、Whistle等寵物科技公司借鑒和應(yīng)用。
亞馬遜在2020年提交的專利,通過通過攝像頭、麥克風(fēng)、可穿戴設(shè)備收集動(dòng)物的聲音、面部表情、身體姿態(tài)等多模態(tài)數(shù)據(jù),結(jié)合AI算法識(shí)別動(dòng)物的快樂、焦慮、疼痛等情緒,并通過語音助手或顯示屏向人類用戶傳達(dá)的系統(tǒng)。通過語音合成或文本方式將動(dòng)物的“情感”翻譯成人類語言。
但這對(duì)動(dòng)物的情緒研究還處于非常初級(jí)的階段。
最大挑戰(zhàn)在于,人類和動(dòng)物的情緒表達(dá)方式差異巨大。動(dòng)物的情緒表達(dá)方式高度依賴物種、品種、個(gè)體,缺乏統(tǒng)一的“表情語言”,如狗的搖尾巴、貓的呼嚕、馬的耳朵動(dòng)作等,難以直接類比人類。而在不同動(dòng)物之間,生理結(jié)構(gòu)、行為習(xí)慣、情緒表達(dá)方式差異極大,模型泛化能力有限。
另一個(gè)直接原因則是缺乏高質(zhì)量標(biāo)注數(shù)據(jù),人類情緒有大量公開數(shù)據(jù)集(如FER、IEMOCAP等),而動(dòng)物情緒數(shù)據(jù)集稀缺,且標(biāo)注主觀性強(qiáng),依賴專家經(jīng)驗(yàn)。人類情緒有“快樂、憤怒、悲傷”等標(biāo)準(zhǔn)標(biāo)簽,動(dòng)物的“情緒”更多是行為狀態(tài)(如警覺、放松、攻擊、求偶等),難以一一對(duì)應(yīng)。
寵物經(jīng)濟(jì),想象的藍(lán)海
過去,研究動(dòng)物表情的主要是獸醫(yī),主要為了方便給動(dòng)物看病和行為矯正。那么,現(xiàn)在當(dāng)谷歌、亞馬遜、微軟、百度等科技公司來關(guān)心動(dòng)物表情,他們的用意何在?
最大的推動(dòng)因素還是商業(yè)利益驅(qū)動(dòng)。據(jù)Global Market Insight發(fā)布的報(bào)告,早在2022年全球?qū)櫸锸袌鲆?guī)模已達(dá)到2610億美元。
在中國,寵物增長的曲線卻是昂揚(yáng)向上。據(jù)《2025年中國寵物行業(yè)白皮書》顯示,2024年中國寵物數(shù)量超1.2億只,已經(jīng)超過4歲以下的嬰兒數(shù)量,城鎮(zhèn)(犬貓)消費(fèi)市場規(guī)模突破3000億元。
無論對(duì)于歐美的存量市場,還是中國的增量市場,人類情緒識(shí)別、健康監(jiān)測等AI技術(shù)日趨成熟,向動(dòng)物領(lǐng)域遷移成為必然。
物主對(duì)寵物健康、情感、陪伴的關(guān)注度大幅提升,寵物主希望更好地“理解”寵物,減少誤解和焦慮,提升陪伴體驗(yàn)。科技公司通過情緒識(shí)別技術(shù),幫助用戶與寵物建立更深層次的情感紐帶,情緒識(shí)別也能成為差異化賣點(diǎn)。
就像推進(jìn)生成式AI一樣,在寵物情緒識(shí)別上,百度在國內(nèi)再一次起了大早。但是不是能趕上大集?從當(dāng)前的情況看,包括情緒識(shí)別在內(nèi)的寵物市場可能并沒有想象的那樣大。
在口罩期間,隨著經(jīng)濟(jì)下滑,美國、英國等國也出現(xiàn)了寵物數(shù)量下滑。所以,以“用戶數(shù)”來計(jì)算,全球的家養(yǎng)寵物數(shù)量可能已經(jīng)處于頂峰,跟當(dāng)前互聯(lián)網(wǎng)用戶數(shù)增長見頂類似。
從市場規(guī)模看,寵物經(jīng)濟(jì)只是諸多垂直賽道之一,當(dāng)前全球2600億美元的規(guī)模,只是汽車、醫(yī)療、食品這樣的大行業(yè)的十分之一甚至更小的零頭,但與又與全球白色家電、網(wǎng)絡(luò)游戲規(guī)模相當(dāng),整體上看屬于規(guī)模中等偏上的行業(yè)。
寵物經(jīng)濟(jì)也是典型的順周期行業(yè),其基礎(chǔ)是養(yǎng)寵家庭數(shù)量和人均寵物消費(fèi),當(dāng)經(jīng)濟(jì)下行、收入減少時(shí),寵物消費(fèi)易被削減。歐美等成熟市場養(yǎng)寵滲透率已達(dá)60-70%,中國等新興市場雖有提升空間,但最終也會(huì)趨于穩(wěn)定。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.