“西藏在藏語大模型研發(fā)領(lǐng)域取得了重要進(jìn)展,標(biāo)志著西藏AI發(fā)展將從場景應(yīng)用走向系統(tǒng)性研發(fā)階段。”就日前千億級參數(shù)藏語基座大模型“陽光清言”V1.0成果發(fā)布,中國工程院院士、西藏大學(xué)教授尼瑪扎西30日接受中新社采訪時(shí)表示。
![]()
據(jù)中新社記者觀察了解,無論在政務(wù)領(lǐng)域、社區(qū)治理,抑或公共服務(wù)、生態(tài)科考,人工智能在西藏已有普遍應(yīng)用。在拉薩,像社區(qū)、機(jī)場已經(jīng)接入AI技術(shù),為人們生活帶來便捷。前不久在拉薩舉行的第二次青藏科考成果綜合集成應(yīng)用發(fā)布會(huì)上,“e科考”App受到關(guān)注,它能對考察對象進(jìn)行快速全息解讀,數(shù)據(jù)能夠通過衛(wèi)星網(wǎng)絡(luò)實(shí)時(shí)上傳至云端數(shù)據(jù)庫。
今年8月,中國國務(wù)院印發(fā)《關(guān)于深入實(shí)施“人工智能+”行動(dòng)的意見》,為西藏人工智能發(fā)展提供了更清晰的方向。
作為西藏人工智能自主研發(fā)的成果,“陽光清言”V1.0模型訓(xùn)練依托約288億Token的高質(zhì)量藏語數(shù)據(jù),涵蓋新聞、法律、醫(yī)學(xué)、教育、科技等多個(gè)領(lǐng)域,包括藏語單語數(shù)據(jù)、多語種平行語料、雙語辭典條目等豐富內(nèi)容。
西藏青年創(chuàng)業(yè)者旦增羅布團(tuán)隊(duì)自2018年致力于藏語語料數(shù)字化,他告訴中新社記者,團(tuán)隊(duì)已研發(fā)出多語種智能翻譯系統(tǒng)、多語種語音識(shí)別系統(tǒng)以及多語種OCR識(shí)別系統(tǒng),目前已構(gòu)建起近7000萬條藏漢平行語料,以及覆蓋140多個(gè)國家的多語種語音數(shù)據(jù)庫。
據(jù)悉,旦增羅布團(tuán)隊(duì)研發(fā)的藏語大模型DeepZang,已實(shí)現(xiàn)多語種的高質(zhì)量語義理解、生成與交互,App目前已接入DeepSeek技術(shù)生態(tài),在內(nèi)部測試中,將于今年年底面向公眾上線。(來源:中國新聞網(wǎng) 記者 趙朗 圖片來源于網(wǎng)絡(luò))
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.