當(dāng)聲網(wǎng)創(chuàng)始人趙斌在Convo AI & RTE 2025大會(huì)上宣布年度服務(wù)分鐘數(shù)突破萬(wàn)億,實(shí)時(shí)互動(dòng)(RTE)技術(shù)正式確立關(guān)鍵基礎(chǔ)設(shè)施地位。這場(chǎng)以“AI有聲”為主題的盛會(huì),揭開(kāi)了RTE與對(duì)話式AI深度融合的產(chǎn)業(yè)新篇,標(biāo)志著行業(yè)從“連接”向“對(duì)話”的決定性躍遷。
![]()
RTE的成熟已形成堅(jiān)實(shí)底座。過(guò)去兩年,視頻高清化比例增長(zhǎng)超10倍,海外市場(chǎng)720p以上分辨率流量占比超80%,WebRTC搜索熱度爆發(fā)式增長(zhǎng),萬(wàn)億分鐘服務(wù)量背后是技術(shù)基建的全面完善。但基礎(chǔ)設(shè)施的完備并未終結(jié)行業(yè)挑戰(zhàn),當(dāng)交互從“人與人”延伸至“人與AI”,僅21%的用戶滿意度暴露出體驗(yàn)短板——人類對(duì)話中90%的信息來(lái)自語(yǔ)調(diào)、表情等非語(yǔ)言要素,現(xiàn)有技術(shù)在情感傳遞與自然交互上仍存鴻溝。
![]()
對(duì)話式AI正成為破局關(guān)鍵。多模態(tài)大語(yǔ)言模型的突破,讓RTE實(shí)現(xiàn)從“正常對(duì)話”到“聲情并茂”的跨越。市場(chǎng)需求已率先爆發(fā):67%的企業(yè)將語(yǔ)音AI智能體置于戰(zhàn)略核心,84%計(jì)劃增加投入,聲網(wǎng)對(duì)話式AI用量單季度環(huán)比增長(zhǎng)151%,ARK Invest更是預(yù)測(cè)AI陪伴賽道規(guī)模將達(dá)700-1500億美元。情感陪伴、智能硬件、在線教育三大場(chǎng)景已顯現(xiàn)規(guī)模化落地潛力,AI客服的現(xiàn)場(chǎng)演示印證了技術(shù)在實(shí)時(shí)交互上的突破。
![]()
技術(shù)融合催生全球化新機(jī)遇。正如Agora聯(lián)合創(chuàng)始人Tony Wang所言,AI出海已從“可選項(xiàng)”變?yōu)椤氨剡x項(xiàng)”,而“信任”是超越技術(shù)的核心壁壘。成功的全球化需實(shí)現(xiàn)“技術(shù)價(jià)值的全球化敘事”與“情感價(jià)值的本地化表達(dá)”結(jié)合,WaveSpeedAI“聲西擊東”的布局策略便是典型實(shí)踐。在賽道選擇上,Agent、AI硬件與底層基礎(chǔ)設(shè)施構(gòu)成三大機(jī)遇,巨頭主導(dǎo)通用場(chǎng)景、原生企業(yè)深耕細(xì)分領(lǐng)域的兩極格局正在形成。
![]()
微軟韋青的觀點(diǎn)為行業(yè)錨定方向:偉大技術(shù)應(yīng)“融于無(wú)形”。聲網(wǎng)發(fā)布的白皮書與AI引擎2.0等工具套件,正踐行這一理念——通過(guò)降低開(kāi)發(fā)門檻,推動(dòng)技術(shù)落地于實(shí)際場(chǎng)景。而RAG等技術(shù)的應(yīng)用,更讓AI回答具備真實(shí)性與可追溯性,為醫(yī)療等專業(yè)領(lǐng)域的RTE+AI融合提供可能。
![]()
從“人人連接”到“人機(jī)共生”,RTE與對(duì)話式AI的融合正重塑交互邊界。萬(wàn)億分鐘的基建積淀,疊加千億級(jí)的AI藍(lán)海市場(chǎng),一個(gè)更智能、更自然的實(shí)時(shí)互動(dòng)新時(shí)代已然到來(lái)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.