![]()
“在智能語音的世界"聲"級(jí)打怪!
近日,在南京VoiceAgent實(shí)時(shí)語音大會(huì)上,云蝠智能帶著VoiceAgent 2.0驚艷亮相!雖在眾聲喧嘩的智能語音賽道中音量不算最大,但這家公司的資歷與積淀,絕不容小覷。
云蝠智能成立于2018年,其名取自自然界的聲音大師——蝙蝠,命名之中,已可見其在語音領(lǐng)域的雄心。七年深耕,迎來此次重大產(chǎn)品升級(jí)。我們清晰看到,兩次AI革命能量正疊加于語音領(lǐng)域:第一次讓機(jī)器“能聽會(huì)說”,第二次則讓其“能理解、會(huì)決策”。
選擇:初次創(chuàng)業(yè)折戟沉沙
盤錦,一座因石油而興的東北小城。如果不出意外,年輕的魏佳星將會(huì)繼續(xù)延續(xù)父輩的軌跡——成為一名石油工人。然而,命運(yùn)的齒輪在某個(gè)時(shí)刻開始轉(zhuǎn)動(dòng),“像是基因突變”,這個(gè)普通高中的普通學(xué)生突然意識(shí)到,自己的人生不該只有石油工人這一個(gè)選項(xiàng)。
![]()
通過全力拼搏,魏佳星考入一所211大學(xué),然而還來不及高興,他就聽到了一個(gè)頗具黑色幽默的消息:他所學(xué)的印刷工程專業(yè)即將被取消,他們將成為該專業(yè)的“末代畢業(yè)生”。學(xué)還上著,專業(yè)沒了,沒有比這更明顯的就業(yè)前景說明了。魏同學(xué)轉(zhuǎn)身就給自己換了劇本——一頭扎進(jìn)代碼和設(shè)計(jì)的世界,憑借一股狠勁,竟自學(xué)成才。后來云蝠智能第一代Logo,便出自這位“印刷末代專業(yè)”學(xué)子之手。
2015年,在阿里巴巴工作的魏佳星,做出了一個(gè)讓人意外的決定——從阿里離職創(chuàng)業(yè)。這個(gè)只有22歲的“毛頭小子”,一頭扎進(jìn)了當(dāng)時(shí)熱火朝天的“雙創(chuàng)”浪潮,準(zhǔn)備在創(chuàng)業(yè)大潮中搏擊風(fēng)浪。
可惜理想很豐滿,現(xiàn)實(shí)很骨感。第一次創(chuàng)業(yè)折戟沉沙,魏佳星第一次嘗到了現(xiàn)實(shí)的苦澀。2018年,站在人生的十字路口,他沒有選擇退回職場(chǎng)的老路,而是決定“在哪里跌倒,就在哪里躺一會(huì)兒想想”。這一想,竟和當(dāng)年雷軍的頓悟如出一轍:不是拼得不夠狠,而是賽道完全選錯(cuò)了。
轉(zhuǎn)身:闖入AI語音賽道
找回溝通的“出廠設(shè)置”
可新的賽道究竟在哪里?就在他四下張望之時(shí),時(shí)代的聚光燈,正巧打在了“人工智能”的舞臺(tái)上。
那一年,AI世界熱鬧非凡:
技術(shù)上,最后一屆ImageNet挑戰(zhàn)賽剛落下帷幕,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)大放異彩,AI的技術(shù)路徑已然清晰,就像一場(chǎng)“畢業(yè)典禮”,標(biāo)志著AI正式出師。
產(chǎn)業(yè)上,AI不再只是實(shí)驗(yàn)室里的炫技,而是大步走進(jìn)了尋常百姓家。尤其是智能語音,它化身為智能音箱,像亞馬遜的Echo、谷歌Home,以及國(guó)內(nèi)小米、天貓精靈等產(chǎn)品,紛紛叩開了千家萬戶的門。
“人工智能+語音”這道時(shí)代的光,不偏不倚,正好照進(jìn)了魏佳星迷茫的世界里。
“語音是人類最自然的交互手段,它剝離了所有額外的交互層,直達(dá)溝通的本質(zhì)。在傳統(tǒng)的人機(jī)交互中,無論是命令行、圖形界面還是觸摸屏,人類都需要學(xué)習(xí)和適應(yīng)機(jī)器的規(guī)則。唯獨(dú)語音不需要。”魏佳星如是說。
想想看,無論是面對(duì)命令行、圖形界面還是觸摸屏,人類總得“遷就”機(jī)器的規(guī)則,得學(xué)習(xí)、得適應(yīng)。但語音不一樣,它甩開了所有中間環(huán)節(jié),不需要額外設(shè)備,也不用記任何操作邏輯。
只有語音,能夠讓人類能夠以最自然、最直接的相處方式,與機(jī)器相處。
于是,在身無分文、只剩三個(gè)人的情況下,他決定背水一戰(zhàn)——做智能語音交互。
有了第一次的失敗,“東山再起”的魏佳星多了一份從容和堅(jiān)定。2019年,他拿到了鼎鼎大名的陸奇博士的投資。當(dāng)時(shí)陸奇向他拋出了一個(gè)開放式的問題:“通用人工智能什么時(shí)候會(huì)來?”答案是“2030年”。魏佳星想,就算等到2030年,自己也才38歲,等得起。但幸運(yùn)的是,這項(xiàng)技術(shù)提前8年到來——2022年,大模型時(shí)代開啟了。
事實(shí)上,再次出發(fā)的魏佳星冥冥之中,精準(zhǔn)地踩在了智能語音技術(shù)與產(chǎn)業(yè)“雙爆發(fā)”的節(jié)奏上。一方面,人工智能技術(shù)正在經(jīng)歷從機(jī)器學(xué)習(xí)到大模型的時(shí)代交替,另一方面,智能語音的消費(fèi)級(jí)市場(chǎng)發(fā)展得風(fēng)生水起,從蘋果Siri啟蒙市場(chǎng),到小米、百度等智能音箱,再到汽車、手表、電視、冰箱紛紛嵌入語音助手,智能語音已經(jīng)深度滲透人類社會(huì)。
從此,魏佳星帶領(lǐng)著云蝠智能的團(tuán)隊(duì),在智能語音的賽道猛扎下去,一走就是七年。
突破:VoiceAgent 2.0
從“聽見”到“聽懂”
近日,在南京VoiceAgent實(shí)時(shí)語音大會(huì)現(xiàn)場(chǎng),云蝠智能迎來了發(fā)展歷史上一次重大升級(jí),VoiceAgent 2.0版本重磅發(fā)布!
![]()
據(jù)介紹,本次版本更新主要在技術(shù)底層(延遲、擬人、識(shí)別)、智能體(幻覺控制、注意力、工具調(diào)用)、操作性(CUI界面、AI FDE、Voice IDE)和渠道(C端個(gè)人助手及網(wǎng)頁客服)進(jìn)行了全棧升級(jí)。
云蝠智能2.0版本在以下維度實(shí)現(xiàn)全面升級(jí):
語音識(shí)別與合成
?支持四川話、粵語等多種方言
?聲音延時(shí)接近一檔標(biāo)準(zhǔn),情感表達(dá)涵蓋高興、悲傷、害怕等多情緒
?實(shí)現(xiàn)邊輸入邊思考的并行計(jì)算模式
對(duì)話理解與記憶系統(tǒng)
?構(gòu)建基于上下文和用戶記憶的復(fù)雜業(yè)務(wù)處理能力
?AI具備“職業(yè)記憶”、“關(guān)系記憶”,形成個(gè)性化知識(shí)庫
?可處理醫(yī)療、客服、催收等高復(fù)雜度場(chǎng)景
自動(dòng)化構(gòu)建與測(cè)評(píng)體系
?用戶只需上傳PPT或資料,即可自動(dòng)生成AI客服
?系統(tǒng)自動(dòng)抽取業(yè)務(wù)實(shí)體、構(gòu)建知識(shí)庫、生成提示詞邏輯
?引入多AI平行測(cè)試機(jī)制(通義千問、豆包、DeepSeek等),對(duì)對(duì)話體驗(yàn)進(jìn)行客觀打分與優(yōu)化
全渠道部署能力
?不僅限于電話端,還可集成至網(wǎng)頁、企業(yè)微信、釘釘、飛書等平臺(tái)
?支持C端個(gè)人手機(jī)部署,實(shí)現(xiàn)全天候電話接聽與信息處理
重構(gòu):AI重塑業(yè)務(wù)與商業(yè)模式
☆業(yè)務(wù)模式:讓“不劃算”的生意成為可能
如果說技術(shù)革新是這場(chǎng)變革的表象,那么業(yè)務(wù)模式的創(chuàng)新和商業(yè)模式的顛覆才是其真正的內(nèi)核。
在業(yè)務(wù)模式上,最直觀的變化在于:AI正在讓原本“不劃算”的生意,成為一門好生意。
魏佳星一語道破天機(jī):“所有單次溝通利潤(rùn)低于100元的事情,在過去根本無法通過人工完成。”那些曾被判“商業(yè)死刑”的場(chǎng)景——催繳30元停車費(fèi)、接聽利潤(rùn)僅二三十元的收廢品電話,如今在AI這里重獲新生。
這背后是AI獨(dú)特的盈利邏輯——“單筆收益雖低,但海量規(guī)模就可實(shí)現(xiàn)薄利多銷”。這個(gè)不知疲倦的數(shù)字員工可以7×24小時(shí)持續(xù)工作,用規(guī)模化覆蓋彌補(bǔ)單次收益的微薄。
在我們尚未察覺時(shí),這種模式已悄然滲透進(jìn)生活的各個(gè)角落:
比如政務(wù)熱線領(lǐng)域,AI輕松實(shí)現(xiàn)了人工座席難以企及的“全天候待機(jī)”;醫(yī)療系統(tǒng)中,AI外呼更是大顯身手——某醫(yī)療系統(tǒng)的實(shí)戰(zhàn)數(shù)據(jù)顯示,人工月通話146通,AI上崗后直接飆到360+通,效率翻倍不說,還從不抱怨。
VoiceAgent 2.0展現(xiàn)出了“情緒穩(wěn)定”的絕對(duì)優(yōu)勢(shì)——直接將回款率從人工的36%-48%拉升到72%。魏佳星分析說:“人類接線員面對(duì)日復(fù)一日的壓力和難纏的對(duì)話,難免會(huì)有情緒波動(dòng),容易掛斷電話;而AI能始終保持耐心,不管對(duì)方言詞多么激烈和難聽,AI都能心平氣和地說,‘您慢慢想,您慢點(diǎn)說’,顯著提升留存率。”
☆商業(yè)模式:從軟件銷售到效果付費(fèi)
軟件行業(yè)的收費(fèi)模式經(jīng)歷了兩次進(jìn)化:從傳統(tǒng)本地部署的“買斷制”,到SaaS時(shí)代的“訂閱制”。但無論哪種模式,軟件商都無需為使用效果負(fù)責(zé)。
而今,AI正在催生第三次變革——“結(jié)果即服務(wù)”(Results as a Service, RaaS)。這種模式下,服務(wù)提供方需要承擔(dān)系統(tǒng)建設(shè)與技術(shù)更新的全部責(zé)任,客戶只需為最終效果付費(fèi)。這不僅是收費(fèi)方式的變化,更是風(fēng)險(xiǎn)共擔(dān)、收益共享的全新合作范式。
云蝠智能毅然摒棄傳統(tǒng)軟件銷售模式,全面轉(zhuǎn)向按效果付費(fèi)。在金融場(chǎng)景中,他們承擔(dān)所有軟件成本、運(yùn)營(yíng)商費(fèi)用和人力交付成本,客戶只需為成功收回的款項(xiàng)支付傭金。
“這本質(zhì)上是‘勞動(dòng)力’的報(bào)價(jià)邏輯,而非‘軟件’的報(bào)價(jià)邏輯。”魏佳星強(qiáng)調(diào)。這種模式徹底重構(gòu)了客戶與供應(yīng)商的價(jià)值分配機(jī)制,將雙方利益緊密捆綁。
進(jìn)化:從“數(shù)字員工”到“數(shù)字組織”
這種“合伙人”模式,對(duì)科技公司提出了前所未有的能力要求。它們不再僅僅是工具提供者,而是要化身為一支可按需調(diào)用、按效果付費(fèi)的“虛擬團(tuán)隊(duì)”。這倒逼企業(yè)必須完成三大蛻變:
?重構(gòu)研發(fā)體系,從固定工作流向Agent驅(qū)動(dòng)的智能架構(gòu)演進(jìn)
?重塑人才能力,工程師必須懂業(yè)務(wù)、近用戶,否則將被AI替代
?轉(zhuǎn)變服務(wù)視角,交付的不再是冰冷工具,而是“即插即用、高度專業(yè)的虛擬員工”
云蝠智能的愿景,正是推動(dòng)AI從單個(gè)的“數(shù)字員工”向一個(gè)完整的“數(shù)字員工組織”進(jìn)化。未來的AI呼叫中心,將不再是一個(gè)簡(jiǎn)單的工具集合,而是一個(gè)高度智能的有機(jī)體——前臺(tái)的客服AI、銷售的AI、甚至老板的AI決策官,基于工作流深度協(xié)同,形成一套高效運(yùn)轉(zhuǎn)的數(shù)字公司。
“我們預(yù)見,三年內(nèi),純粹的‘打電話’類職業(yè)將不再需要人類擔(dān)任。”魏佳星預(yù)測(cè),當(dāng)溝通僅依賴聲音通道,且工作內(nèi)容高度流程化時(shí),AI沒有理由做不到。
魏佳星始終將自己定位為產(chǎn)品經(jīng)理而非CEO,強(qiáng)調(diào)“如果你從劣幣開始,就應(yīng)該把這件事情做成一個(gè)你自己想要做好的事情”。
夢(mèng)想:夢(mèng)想不辜負(fù)熱血
從七年前寫下“計(jì)算,為了無法計(jì)算的情感;聲音,終將無處不在”,到如今VoiceAgent 2.0正式發(fā)布,魏佳星帶領(lǐng)云蝠智能走過了從“被托舉”到“自驅(qū)動(dòng)”的歷程。2022年,ChatGPT讓知識(shí)獲取成本趨近于零;2025年,新模型讓“能動(dòng)性”成本趨近于零。在這個(gè)知識(shí)價(jià)值遞減的時(shí)代,云蝠智能正致力于讓AI從“會(huì)說話的工具”進(jìn)化為“有思想的生命體”。
正如魏佳星所說:“兒時(shí)的熱血夢(mèng)想,總不愿被時(shí)光辜負(fù)。”在AI浪潮中,這位從東北小城走出的創(chuàng)業(yè)者,正用自己的方式,讓世界聽到中國(guó)語音智能的聲音。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.