來源:高校人工智能與大數據創新聯盟
![]()
2025年8月14日,國務院新聞辦公室舉行“高質量完成‘十四五’規劃”系列主題新聞發布會。國家發展改革委黨組成員、國家數據局局長劉烈宏在回答媒體記者提出的關于國家層面在圍繞人工智能高質量數據提質擴量方面開展了哪些工作的問題時表示,算力是骨骼、算法是神經、數據是血液。作為人工智能發展的三大核心要素之一,數據在推動“人工智能+”過程中發揮著關鍵作用,特別是高質量數據集的建設至關重要,比如在醫療健康領域,通過標注的醫學影像高質量數據集,模型的疾病診斷準確率可以提升15%以上。在人工智能時代,Token,也就是大家通常所說的詞元,作為處理文本的最小數據單元,如同互聯網時代大家所說的“流量”。2024年初,我國日均Token的消耗量為1千億,截至今年6月底,日均Token消耗量已經突破30萬億,1年半時間增長了300多倍,這反映了我國人工智能應用規模的快速增長。
我國人工智能的快速發展,與我國高度重視數據工作是密不可分的。我國是第一個把數據作為生產要素的國家,多措并舉促進數據資源的開發利用。我們強調“人工智能+”行動到哪里,高質量數據集的建設和推廣就要到哪里。我們大力推動高質量數據的供給,出臺了高質量數據集建設相關文件,多部門聯合推動相關工作。我們指導全國數據標準化技術委員會研究制定了相關標準和技術文件,組織了高質量數據集建設先行先試工作和典型案例征集活動,分行業、分領域樹立了一批典型的解決方案。
我們持續推進高質量數據集建設工作。截至今年6月底,我國已經建設高質量數據集超過3.5萬個,總體量超過了400PB(1PB可存儲約5億張2MB大小的高清照片,400PB的總量相當于中國國家圖書館數字資源總量的140倍左右)。人工智能模型的訓練也推動了數據交易需求的攀升,截至今年6月底,各地高質量數據集累計交易額近40億元,數據交易機構掛牌的高質量數據集總規模達到了246PB。以北京數交所為例,高質量數據集占交易總量的比例從去年的10%躍升到目前的近80%。上海、天津、安徽等地正在試點“數據語料作價入股”等新模式,引導企業將高質量數據集折算為股權投入到相關企業。高質量數據集的發展需要數據標注產業的支撐,我們已布局了成都、沈陽、合肥等7個數據標注基地,助力高質量數據集的建設。
中文數據在國內大模型的訓練性能提升方面發揮著重要作用。大家都非常關心中文數據在訓練數據中的占比情況,經過一段時間的努力,國內多數模型訓練使用的中文數據占比已經超過了60%,有的模型已達到80%。中文高質量數據的開發和供給能力持續增強,推動我國人工智能模型性能的快速提升。
下一步,我們將通過體系化布局持續推進高質量數據集建設,加快打造具身智能、低空經濟、生物制造等重點領域數據高地。我們也將推動全社會強化數據要素價值認同,加快推進數據要素價值共創,培育“為優質數據買單”的市場共識。(來源:國新網)
全國高校人工智能與大數據創新聯盟
全國高校人工智能與大數據創新聯盟(簡稱:高校聯盟)是由清華大學、浙江大學、中南大學、東北大學、上海工程技術大學、重慶郵電大學、東北林業大學、佛山科學技術學院、曲阜師范大學、黑龍江大學、海豚大數據科技等全國54家高校、企業共同發起,于2018年5月26日在北京中國科技會堂正式成立。迄今為止,聯盟發展會員300多家, 覆蓋全國20多個省市。聯盟由一批積極投身于“人工智能、大數據、區塊鏈”教育事業的高校、科研機構、企事業單位和個人自愿組成的公益性、全國性學術交流服務平臺。中國工程院原常務副院長、中國工程院院士潘云鶴、中國科學院院士陳國良、中國工程院院士李伯虎擔任聯盟名譽理事長,中國工程院院士譚建榮擔任聯盟理事長。聯盟工作接受工信部、國家網信辦等政府部門行政管理和業務指導。聯盟主要工作是推進產教融合、校企合作、協同育人。(加盟微信13651193492)
華算人工智能研究院
華算人工智能研究院全稱是“山西省華算人工智能研究院有限公司”,是經山西轉型綜合改革示范區管理委員會批準,于2023年10月在太原成立的第一批專業研究人工智能、賦能數字經濟產業發展的獨立法人組織。華算人工智能研究院依托全國高校人工智能與大數據創新聯盟專家委員會及理事會資源,按照山西省委省政府、山西轉型綜合改革示范區管理委員會發展人工智能、數字經濟的系列文件精神和工作計劃,將研究院打造成為山西省發展人工智能、數字經濟的示范應用推廣平臺,同時面向全國開展人工智能業務。華算人工智能研究院名譽院長由中國工程院院士李伯虎擔任。研究院內設AI產業學院共建中心、實訓實習就業中心、實驗室建設中心、專家智庫等6個職能部門。歡迎加入華算人工智能研究院專家智庫,共同賦能高校AI人才培養及產教融合事業發展。
高校區塊鏈專委會
全國高校人工智能與大數據創新聯盟區塊鏈專委會(簡稱:高校區塊鏈專委會),是由北京大學、浙江大學、武漢大學、西南財經大學、北京交通大學、鄭州大學、貴州大學、桂林電子科技大學、山西農業大學、佛山科學技術學院、陜西師范大學、中國網安、海豚大數據科技等全國40多家高校、企業和機構共同發起,于2019年12月7日在廣東省佛山市正式成立。目前發展高校及企業會員70多家。中國工程院院士、浙江大學教授陳純擔任高校區塊鏈專委會名譽顧問;福州大學教授蔡維德、中國計算機學會區塊鏈專委會主任斯雪明教授、中國人民銀行數字貨幣研究所副所長狄剛擔任高校區塊鏈專委會名譽主任;北京大學信息科學技術學院區塊鏈中心主任陳鐘教授擔任高校區塊鏈專委會主任。高校區塊鏈專委會主要工作是促進高校區塊鏈教育,為高校區塊鏈專業建設及學科發展提供專家咨詢服務。
高校元宇宙專委會
全國高校人工智能與大數據創新聯盟元宇宙專業委員會(簡稱:高校元宇宙專委會),是由清華大學、湖南大學、浙江大學、四川大學、汕頭大學、河北金融學院、保定市元宇宙協會、英偉達中國、海爾衣聯網研究院、海豚大數據科技(天津)有限公司等全國20多所高校、企業和機構共同發起,于2022年11月5日在北京正式成立。中國工程院院士、計算機軟件與虛擬現實領域專家趙沁平擔任高校元宇宙專委會名譽顧問;中國工程院院士、北京航空航天大學電氣與自動化學院名譽院長、中國航天科工集團有限公司科技委高級顧問李伯虎擔任高校元宇宙專委會名譽主任;清華大學信息國研中心可信軟件和大數據部常務副主任邢春曉擔任高校元宇宙專委會主任委員。目前已發展高校及企業會員30多家。高校元宇宙專委會主要工作是促進高校元宇宙教育、加強校企合作、推動元宇宙專業建設及學科發展,為元宇宙教育教學提供專家咨詢服務。
高校數字經濟專委會
全國高校人工智能與大數據創新聯盟數字經濟專業委員會(簡稱:高校數字經濟專委會),是由華算人工智能研究院、清華大學、北京大學、中國人民大學、中國社會科學院信息化研究中心、四川大學、北京外國語大學、北京科技大學、北京工業大學、北京語言大學、北京化工大學、北京聯合大學、北京物資學院、北京印刷學院、西藏民族大學、河北金融學院、重慶財經學院、蘇州城市學院、北京中關村軟件園、百度、海豚大數據科技等全國60多家高校、企業和機構共同發起,于2024年1月12日在北京正式成立。清華大學經濟管理學院教授姜旭平、北京大學信息管理系教授賴茂生、中國社會科學院信息化研究中心主任姜奇平、中國科學院大學經濟與管理學院教授呂本富擔任高校數字經濟專委會主任委員。高校數字經濟專委會主要工作是促進高校數字經濟專業建設及學科發展,推動產學研合作,為高校數字經濟專業教育教學提供專家咨詢服務。
聯盟“資料圖書館”
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
微信咨詢

說明:轉載文章和圖片均來自公開網絡,推送文章除非無法確認,都會注明作者和來源,如有侵權請聯系刪除。
往期精彩文章(單擊就可查看):
. 辦
. 》
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.