24日,國家數據局相關負責人介紹,到今年3月,我國日均詞元(Token)的調用量已經超過140萬億。
詞元消耗量為何是AI產業發展的“晴雨表”?詞元催生了哪些新機遇?
詞元消耗量
是人工智能產業發展“晴雨表”
“詞元”是人工智能大模型為了高效處理數據,把數據進行拆分后的最小信息單元,可以理解為一個字,或是一個詞,或是一個符號。在人工智能時代,用戶輸入的每一個字,大模型生成的每一段話、識別的每一幅圖像,都在消耗詞元。
國家數據局專家咨詢委員會委員張向宏介紹,日均超140萬億的詞元調用量,相當于1000萬億個中文詞匯,也相當于250個中國國家圖書館的資源量。
國家發展改革委國家信息中心人工智能處工程師蔡馳宇介紹,詞元日均調用量大幅增長,充分表明人工智能正加速從實驗室走向千行百業和千家萬戶,變成了實實在在的生產力工具,像水、電、網絡一樣,成為智能社會運轉的基礎資源。詞元的消耗量是人工智能產業發展的重要指標和“晴雨表”。
以詞元計費為基礎的
新型商業邏輯加速演進
圍繞詞元的調用、分發與結算,一套新的價值體系正在加速演進形成,并成為人工智能產業可能變現的重要路徑。
蔡馳宇介紹,過去,一家企業使用信息服務,需要購買信息軟件;現在一家企業使用信息服務,可能直接調用大模型接口,用多少詞元,就付多少費用,以詞元消耗量的多少作為計費依據。
與此同時,專家表示,詞元消耗量增長也對電力資源提出了更高需求。今年的《政府工作報告》提出,實施算電協同等新基建工程。專家介紹,算電協同的本質含義,就是要使用我國具有超前優勢的綠電來發展算力產業和人工智能產業。
我國正加快推動
數據領域新名詞新術語解釋工作
詞元(Token)這類人工智能領域專業名詞如何翻譯,引發廣泛熱議。全國數據標準化技術委員會介紹,正加快推動一系列數據領域新名詞新術語的解釋及國家標準研制工作,更好賦能人工智能產業高質量發展。
來源:新聞聯播微信公眾號
新媒體編輯:程可心
如需交流可聯系我們
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.