前不久,世界數(shù)據(jù)組織在北京成立,這是全球首個(gè)旨在推動(dòng)數(shù)據(jù)發(fā)展與治理實(shí)踐的專業(yè)性國際組織。數(shù)據(jù)作為人工智能發(fā)展的關(guān)鍵要素,如同燃料之于發(fā)動(dòng)機(jī),其供給能力的高低直接決定人工智能的發(fā)展速度與質(zhì)量。隨著人工智能產(chǎn)業(yè)范式從“模型為王”轉(zhuǎn)向“數(shù)據(jù)為王”,數(shù)據(jù)的供給能力,不僅關(guān)乎人工智能產(chǎn)業(yè)發(fā)展,更決定著國家在未來競(jìng)爭(zhēng)格局中的地位。如何充分釋放數(shù)據(jù)潛能、驅(qū)動(dòng)數(shù)字經(jīng)濟(jì)更快發(fā)展,值得關(guān)注。
近年來,我國在培育數(shù)據(jù)要素市場(chǎng)方面取得顯著成效,數(shù)據(jù)資源規(guī)模優(yōu)勢(shì)持續(xù)擴(kuò)大,不斷轉(zhuǎn)化為產(chǎn)業(yè)優(yōu)勢(shì)。但中文語料數(shù)據(jù)供給不足,正成為我國人工智能應(yīng)用創(chuàng)新的重要問題。中文語料供給不足,不僅會(huì)導(dǎo)致語義偏差風(fēng)險(xiǎn)制約AI發(fā)展效能,還可能導(dǎo)致潛在的文化誤讀與意識(shí)形態(tài)風(fēng)險(xiǎn)。隨著單邊主義、保護(hù)主義抬頭,我國人工智能創(chuàng)新發(fā)展可能面臨更加嚴(yán)峻的數(shù)據(jù)“瘸腿”困境。“十五五”時(shí)期,強(qiáng)化面向人工智能的數(shù)據(jù)高效供給,有助于充分發(fā)揮數(shù)據(jù)資源規(guī)模優(yōu)勢(shì),搶占未來科技發(fā)展制高點(diǎn)。
擴(kuò)容數(shù)據(jù)供給“蓄水池”。構(gòu)建數(shù)據(jù)高效供給體系的核心在于持續(xù)擴(kuò)大數(shù)據(jù)規(guī)模、豐富數(shù)據(jù)類型。當(dāng)前,我國數(shù)據(jù)供給存在明顯的結(jié)構(gòu)性失衡,互聯(lián)網(wǎng)娛樂數(shù)據(jù)相對(duì)過剩,產(chǎn)業(yè)應(yīng)用、科技創(chuàng)新所需的高價(jià)值數(shù)據(jù)嚴(yán)重不足。需進(jìn)一步推動(dòng)公共數(shù)據(jù)開放與授權(quán)運(yùn)營,加強(qiáng)物聯(lián)網(wǎng)等數(shù)據(jù)接口開放,激發(fā)行業(yè)數(shù)據(jù)共享匯聚,促進(jìn)社會(huì)數(shù)據(jù)收集,拓展數(shù)據(jù)供給的廣度與深度。
筑牢數(shù)據(jù)質(zhì)量“壓艙石”。數(shù)據(jù)質(zhì)量是價(jià)值實(shí)現(xiàn)的前提,高質(zhì)量的數(shù)據(jù)不僅要求準(zhǔn)確性、完整性與合規(guī)性,更強(qiáng)調(diào)場(chǎng)景適配性和知識(shí)密度。數(shù)據(jù)加工能力不足導(dǎo)致大量數(shù)據(jù)時(shí)效性較差、價(jià)值被低估、難以挖掘復(fù)用,海量數(shù)據(jù)“出生”即“死亡”。提升數(shù)據(jù)加工能力,保障數(shù)據(jù)供給質(zhì)量與適用性,仍需進(jìn)行數(shù)據(jù)資源規(guī)劃管理,建立數(shù)據(jù)標(biāo)注規(guī)范、數(shù)據(jù)集質(zhì)量評(píng)估標(biāo)準(zhǔn)。
打通數(shù)據(jù)流通“快車道”。當(dāng)前,大量數(shù)據(jù)長期被“鎖”在政府、高校、科研機(jī)構(gòu)和企業(yè)各自的數(shù)據(jù)壁壘里。有報(bào)告顯示,2023年數(shù)據(jù)交易中需求方是供給方的1.75倍,數(shù)據(jù)產(chǎn)品成交率僅為17.9%。提升數(shù)據(jù)流通效率,消除“數(shù)據(jù)孤島”與流通堵點(diǎn),要著眼于技術(shù)創(chuàng)新和制度創(chuàng)新“雙輪驅(qū)動(dòng)”。一方面,隱私計(jì)算技術(shù)為消解數(shù)據(jù)安全與流通矛盾提供了全新思路,可信數(shù)據(jù)空間成為數(shù)據(jù)資源規(guī)模化流通利用的新模式新路徑,區(qū)塊鏈技術(shù)為數(shù)據(jù)確權(quán)和流通提供可信保障。另一方面,制度創(chuàng)新則為數(shù)據(jù)流通“松綁提速”。
培育數(shù)據(jù)供給“新生態(tài)”。充分發(fā)揮人工智能威力,要對(duì)接應(yīng)用場(chǎng)景中大模型的實(shí)際需求,綜合利用政府和社會(huì)各方資源,打通數(shù)據(jù)采集、開發(fā)、流通和利用鏈條,構(gòu)建共享共創(chuàng)共贏的合作生態(tài)。推動(dòng)數(shù)據(jù)標(biāo)注提質(zhì)增效。數(shù)據(jù)集開發(fā)周期長、成本高,可通過創(chuàng)新技術(shù)手段,優(yōu)化資源配置,實(shí)現(xiàn)數(shù)據(jù)供給的集約高效。建立行業(yè)數(shù)據(jù)聯(lián)盟,實(shí)現(xiàn)數(shù)據(jù)共建復(fù)用。發(fā)揮市場(chǎng)導(dǎo)向作用,制定完善數(shù)據(jù)集定價(jià)和收益分配機(jī)制,創(chuàng)新數(shù)據(jù)開發(fā)利用方式,優(yōu)化數(shù)據(jù)集運(yùn)營模式,提升數(shù)據(jù)投入產(chǎn)出比,凝聚社會(huì)各方數(shù)據(jù)供給合力,共同培育數(shù)據(jù)高效供給生態(tài)。(本文來源:經(jīng)濟(jì)日?qǐng)?bào) 作者:劉彬芳)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.