![]()
標(biāo)貝科技產(chǎn)品
該大數(shù)據(jù)類產(chǎn)品由標(biāo)貝科技投遞并參與金猿組委會×數(shù)據(jù)猿×上海大數(shù)據(jù)聯(lián)盟共同推出的《2025中國大數(shù)據(jù)產(chǎn)業(yè)年度創(chuàng)新服務(wù)產(chǎn)品——十年標(biāo)桿產(chǎn)品》榜單/獎項評選。
標(biāo)貝科技AI數(shù)據(jù)平臺的發(fā)展,始終與AI數(shù)據(jù)產(chǎn)業(yè)演進同頻共振,深刻反映了技術(shù)、市場與戰(zhàn)略的協(xié)同進化,以持續(xù)創(chuàng)新引領(lǐng)行業(yè)變革。
2016年前后,我國大數(shù)據(jù)產(chǎn)業(yè)正處于從“概念培育”向“技術(shù)落地”的過渡階段,政策層面《促進大數(shù)據(jù)發(fā)展行動綱要》剛落地,AI技術(shù)迎來首輪商業(yè)化探索。一方面,互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)的迅速普及,數(shù)據(jù)量呈爆炸式增長,各行業(yè)都積累了海量的原始數(shù)據(jù),為大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展提供了豐富的素材。然而,另一方面,大數(shù)據(jù)產(chǎn)業(yè)也面臨著諸多核心的技術(shù)瓶頸和市場空白。
從技術(shù)層面來看,數(shù)據(jù)標(biāo)注作為人工智能數(shù)據(jù)訓(xùn)練的關(guān)鍵環(huán)節(jié),主要依賴人工密集型的外包模式,存在效率低下、標(biāo)準(zhǔn)不一、質(zhì)量波動大的痛點,嚴(yán)重制約算法模型的研發(fā)與迭代速度。
從市場層面來看,標(biāo)注工具碎片化,語音、圖像等不同模態(tài)數(shù)據(jù)需依賴多套系統(tǒng)處理,兼容性差,導(dǎo)致高質(zhì)量、標(biāo)準(zhǔn)化的訓(xùn)練數(shù)據(jù)極度稀缺。此外,數(shù)據(jù)安全和隱私保護問題也逐漸受到關(guān)注,企業(yè)對于數(shù)據(jù)標(biāo)注過程中的安全性和可靠性提出了更高的要求。
標(biāo)貝科技核心團隊來自微軟、百度等企業(yè),深耕數(shù)據(jù)服務(wù)領(lǐng)域十余年,敏銳的意識到:“高質(zhì)量、規(guī)模化、標(biāo)準(zhǔn)化的數(shù)據(jù)供給能力”將是AI產(chǎn)業(yè)化落地的關(guān)鍵瓶頸與核心基礎(chǔ)設(shè)施。
基于這一錨點,2017年標(biāo)貝科技以語音標(biāo)注工具切入,首次實現(xiàn)語音數(shù)據(jù)標(biāo)注標(biāo)準(zhǔn)化;2019年拓展至圖像領(lǐng)域,邁出多模態(tài)布局第一步;2022年集成3D 點云、視頻等全類型標(biāo)注,推出AI數(shù)據(jù)平臺1.0,打通多模態(tài)數(shù)據(jù)處理鏈路;2024年發(fā)布4.0版,集成了先進的智能預(yù)標(biāo)注模型與算法,升級為“智能數(shù)據(jù)生產(chǎn)流水線”,通過預(yù)標(biāo)注模型與項目管理功能融合,解決“效率與質(zhì)量不可兼得”的行業(yè)痛點。
多年的持續(xù)投入,標(biāo)貝科技AI數(shù)據(jù)平臺從單一功能工具進化為滿足大模型全階段訓(xùn)練數(shù)據(jù)需求的解決方案級產(chǎn)品平臺,在智能駕駛、金融、消費電子、智慧家居等領(lǐng)域?qū)崿F(xiàn)規(guī)模化應(yīng)用,服務(wù)于眾多領(lǐng)域的頭部企業(yè),如騰訊、京東、小米、中國聯(lián)通等。依托高可用、高安全的平臺特性,核心客戶續(xù)費率長期穩(wěn)定在80%以上,形成“合作-復(fù)購-共創(chuàng)”的良性循環(huán)。
十年重大更新升級
標(biāo)貝科技AI數(shù)據(jù)平臺歷經(jīng)多次迭代,完成從單一工具到一體化解決方案的進階,核心更新升級脈絡(luò)清晰:
1.2017年,以語音數(shù)據(jù)標(biāo)注工具為起點,精準(zhǔn)切入AI數(shù)據(jù)服務(wù)賽道,填補國內(nèi)專業(yè)語音標(biāo)注工具空白,為語音交互技術(shù)研發(fā)提供基礎(chǔ)支撐。
2.2019-2020年,拓展至圖像標(biāo)注領(lǐng)域,響應(yīng)計算機視覺技術(shù)發(fā)展需求,實現(xiàn)從單一模態(tài)向多模態(tài)工具布局的初步跨越,適配更多元化數(shù)據(jù)處理場景。
3.2022年,推出AI數(shù)據(jù)平臺1.0,基于既有標(biāo)注工具完成多類型數(shù)據(jù)標(biāo)注能力整合,集成3D點云、語音、圖像、視頻等全類型標(biāo)注,實現(xiàn)從單一類型到全類型標(biāo)注的跨越,構(gòu)建起多模態(tài)標(biāo)注基礎(chǔ)架構(gòu)。
4.2024年,發(fā)布AI數(shù)據(jù)平臺4.0,精進自研標(biāo)注工具鏈,打造“智能數(shù)據(jù)生產(chǎn)流水線”,集成智能預(yù)標(biāo)注模型與項目管理功能,以高可用、高可靠、高安全特性,滿足大規(guī)模、多行業(yè)、多租戶等企業(yè)級核心需求,完成從工具集到基礎(chǔ)設(shè)施級平臺的蛻變。
5.2024年至今:為匹配大模型訓(xùn)練對海量、多階段數(shù)據(jù)的需求,平臺前瞻性研發(fā)了高質(zhì)量數(shù)據(jù)智能生產(chǎn)管線、合成數(shù)據(jù)管線等,形成了覆蓋預(yù)訓(xùn)練、微調(diào)、對齊、評估全流程的大模型數(shù)據(jù)解決方案,成為大模型落地的重要支撐。
應(yīng)用場景/人群
作為標(biāo)貝科技自研的解決方案級產(chǎn)品平臺,AI數(shù)據(jù)平臺憑借“全場景覆蓋、多行業(yè)適配、全周期支撐”的核心優(yōu)勢,已深度應(yīng)用于AI技術(shù)研發(fā)與產(chǎn)業(yè)落地的關(guān)鍵環(huán)節(jié)。
1.自動駕駛領(lǐng)域
自動駕駛系統(tǒng)需要處理大量的傳感器數(shù)據(jù),包括攝像頭圖像、激光雷達點云、毫米波雷達數(shù)據(jù)等。AI數(shù)據(jù)平臺能夠?qū)@些多源異構(gòu)數(shù)據(jù)進行高效標(biāo)注,包括道路、交通標(biāo)志、行人、車輛等目標(biāo)信息,支撐大規(guī)模路測數(shù)據(jù)的4D-BEV標(biāo)注與點云語義分割,為自動駕駛算法的訓(xùn)練和優(yōu)化提供高質(zhì)量的數(shù)據(jù)支持,提高自動駕駛的安全性和可靠性。
2.智能安防領(lǐng)域
在安防監(jiān)控場景中,需要對視頻數(shù)據(jù)進行實時分析和標(biāo)注,檢測異常行為、識別目標(biāo)人物和物體等。平臺支持大規(guī)模視頻數(shù)據(jù)的標(biāo)注,結(jié)合智能預(yù)標(biāo)注模型,提高標(biāo)注效率和準(zhǔn)確性,為智能安防系統(tǒng)提供強大的數(shù)據(jù)支撐,實現(xiàn)更精準(zhǔn)的監(jiān)控和預(yù)警。
3.醫(yī)療健康領(lǐng)域
醫(yī)療影像標(biāo)注是醫(yī)療人工智能發(fā)展的重要基礎(chǔ)。平臺可以對醫(yī)學(xué)相關(guān)數(shù)據(jù)進行標(biāo)注,標(biāo)注病變區(qū)域、器官結(jié)構(gòu)等信息,輔助醫(yī)生進行疾病診斷和治療方案制定。同時,在醫(yī)療文本處理方面,標(biāo)注電子病歷、醫(yī)學(xué)文獻等文本數(shù)據(jù),挖掘有價值的信息,為醫(yī)療研究和臨床決策提供支持。
4.金融科技領(lǐng)域
在金融風(fēng)控、客戶服務(wù)、投資分析等方面有廣泛應(yīng)用。例如,標(biāo)注金融新聞、社交媒體文本等數(shù)據(jù),進行情感分析和輿情監(jiān)測;標(biāo)注客戶咨詢文本,實現(xiàn)智能客服的自動回復(fù)和問題解決;標(biāo)注財務(wù)報表數(shù)據(jù),輔助投資分析和決策,為智能風(fēng)控、智能投顧提供高質(zhì)量數(shù)據(jù)。
5.智能交互領(lǐng)域
包括智能語音助手、智能客服、智能機器人等應(yīng)用。平臺為這些應(yīng)用提供高質(zhì)量的語音、文本標(biāo)注數(shù)據(jù),訓(xùn)練更智能、更自然的交互模型,提高用戶與智能系統(tǒng)的交互體驗和滿意度。
產(chǎn)品功能
標(biāo)貝科技AI數(shù)據(jù)平臺支持圖像、點云、語音識別、語音合成、多模態(tài)等全模態(tài)類型的標(biāo)注任務(wù),全面覆蓋圖像、3D/4D點云、大模型、視頻、語音、文本、等數(shù)據(jù)形式,用豐富智能的標(biāo)注工具為用戶提供強大的數(shù)據(jù)支撐,包含不限于以下類別:
1.4D標(biāo)注
支持上億級點云數(shù)據(jù)量的高效處理,支持2萬幀以上時序數(shù)據(jù)的快速加載,提供多機位視角展示與操作,通過拼接+切片達到百億點云性能量級。提供線段拼接、線段延長、共點吸附、線段裁剪等細(xì)節(jié)優(yōu)化功能,助力更高效、精準(zhǔn)的標(biāo)注操作,還可以根據(jù)不同屬性的作業(yè),配置RGB、強度、高度、純色等方案,支持固定和自動點云大小配置。
![]()
2.3D標(biāo)注
提供3D立體框、3D多邊形、3D線段、3D關(guān)鍵點、3D分割、映射偽3D、映射矩形、映射多邊形、映射線段、映射點等工具,支持2D3D融合、多源雷達、點云追蹤、建筑結(jié)構(gòu)、點云分割、3Dmax等標(biāo)注場景。
3.圖片標(biāo)注
支持目前檢測、全景分割、物體追蹤、實例分割、骨骼點、分類判斷等標(biāo)注場景。提供矩形、旋轉(zhuǎn)矩形、正方形、多邊形、立體框、中線框、日形框、橢圓、線段、關(guān)鍵點、點組、骨骼點、分割等形狀,精準(zhǔn)標(biāo)注圖像中的多種目標(biāo)物體,支持精確分割與特征提取,助力更高精度的數(shù)據(jù)構(gòu)建。
4.ASR(語音識別)標(biāo)注
支持一句話識別、情緒校對、指令識別、音頻分類、語音轉(zhuǎn)寫、對話轉(zhuǎn)錄、指令識別等,支持多通道音頻,支持平均RMS振幅計算。性能方面支持上百條音頻同時加載,單個音頻可達數(shù)小時,支持多軌音頻顯示,支持上百段結(jié)果顯示。
![]()
5.TTS(語音合成)標(biāo)注
支持中文、英文、中英混合以及小語種標(biāo)注,支持上百種語音的轉(zhuǎn)錄,自有模型支持音字轉(zhuǎn)換為韻律、拼音、音標(biāo)、詞性等文本內(nèi)容。同時內(nèi)置標(biāo)注通用規(guī)則校驗系統(tǒng),自動檢查標(biāo)注內(nèi)容的規(guī)范性與準(zhǔn)確性,確保標(biāo)注質(zhì)量。
6.文檔結(jié)構(gòu)化
支持OCR識別、Latex識別、多語種文檔識別。引入光學(xué)OCR識別技術(shù),高效、準(zhǔn)確地識別手寫體和印刷體,使得文本內(nèi)容能夠快速轉(zhuǎn)化為可編輯格式。通過大模型處理,將截取的圖片和提取的原文一并傳輸給大模型進行格式整理,重構(gòu)文檔格式。
![]()
7.文本標(biāo)注
支持快判標(biāo)注、實體詞標(biāo)注、關(guān)系標(biāo)注、摘要提取、文本泛化等標(biāo)注需求。
8.視頻標(biāo)注
支持多種視頻處理需求,包括審核、抽幀、追蹤標(biāo)注、視頻打點,覆蓋多種流程應(yīng)用場景。可以同時上傳多段視頻在一個作業(yè)中,執(zhí)行第一段視頻標(biāo)注時,工具自動加載后續(xù)視頻,大幅節(jié)約視頻加載時間。標(biāo)注作業(yè)支持多工序并行執(zhí)行,多流程配置實現(xiàn)實時數(shù)據(jù)流轉(zhuǎn),顯著縮短標(biāo)注周期。
9.模型對話標(biāo)注
支持精準(zhǔn)評估、多維評價、多輪對話保住需求,靈活適應(yīng)多種問答場景,包括FAQ系統(tǒng)、客服問答、復(fù)雜情境對話等。
![]()
10.多模態(tài)標(biāo)注
平臺支持圖像、音頻、視頻、文本、文檔、對話、網(wǎng)頁多種媒體文件的標(biāo)注,滿足不同領(lǐng)域和任務(wù)的標(biāo)注需求。用戶可以根據(jù)項目需求調(diào)整標(biāo)注任務(wù)的布局,無需編碼即可自由構(gòu)建不同標(biāo)注任務(wù)界面。多個模態(tài)的數(shù)據(jù)可以同時加載和處理,支持實時協(xié)同標(biāo)注,有效降低了人工干預(yù)和標(biāo)注等待時間。此外,平臺設(shè)計上支持新的模態(tài)擴展,可以靈活接入未來的新型數(shù)據(jù),可實現(xiàn)新模態(tài)的支持和數(shù)據(jù)標(biāo)注。
產(chǎn)品優(yōu)勢
1.全模態(tài)數(shù)據(jù)標(biāo)注能力
標(biāo)貝科技AI數(shù)據(jù)平臺搭載了豐富的標(biāo)注工具功能,覆蓋語音、圖像、視頻、點云、4D-BEV、文本、文檔、多模態(tài)、大模型等主流模態(tài),兼容市面絕大多數(shù)標(biāo)注場景,一站式滿足多類型AI數(shù)據(jù)需求。
![]()
2.靈活的架構(gòu)設(shè)計
全新升級的模塊化架構(gòu),兼具靈活性、高可擴展性與易用性,支持快速適配復(fù)雜業(yè)務(wù)場景,降低用戶學(xué)習(xí)與運營成本。
3.工業(yè)級性能表現(xiàn)
平臺性能優(yōu)化方面,突破了超大規(guī)模數(shù)據(jù)處理瓶頸,如百億級點云標(biāo)注、上億像素級圖像處理、小時級千小時音頻標(biāo)注。
4.智能輔助標(biāo)注閉環(huán)
平臺內(nèi)嵌模型訓(xùn)練流程:標(biāo)注數(shù)據(jù)→觸發(fā)模型訓(xùn)練→智能預(yù)標(biāo)注→人工修正→模型迭代→再次觸發(fā)模型訓(xùn)練。用戶可自主訓(xùn)練,模型不斷學(xué)習(xí),適配特定需求,適合需要高準(zhǔn)確率的業(yè)務(wù)場景。還可以通過模型微調(diào)、自定義模型上傳、Agent代理為預(yù)標(biāo)注、標(biāo)注和質(zhì)檢等環(huán)節(jié)提供多樣化的算法輔助。
![]()
5.完善的后臺管理流程
平臺提供包括多樣的工具配置、靈活的工序配置、實時進度監(jiān)控、多維度指標(biāo)分析、有效人員管理、直觀的可視化界面等,每個環(huán)節(jié)由相應(yīng)專業(yè)人員來把控數(shù)據(jù)標(biāo)注的質(zhì)量和時間節(jié)點,確保數(shù)據(jù)交付的效率和質(zhì)量。
![]()
6.適配企業(yè)級需求
完全自研,以高可用、高可靠、高安全為核心,滿足大規(guī)模、多行業(yè)、多場景、多模態(tài)、多租戶的企業(yè)級應(yīng)用需求。
7.開放合作模式
在商業(yè)化方面,目前標(biāo)貝科技AI數(shù)據(jù)平臺面向客戶提供私有化部署、公有云部署、訂閱版以及定制版合作的開放模式,靈活滿足客戶對不同數(shù)據(jù)安全級別和平臺功能的需求,用戶可以按需選擇。
服務(wù)客戶/使用人數(shù)
標(biāo)貝科技AI數(shù)據(jù)平臺的重要代表性客戶包括騰訊、京東、小米、中國聯(lián)通等知名企業(yè)。涵蓋了金融、通信、互聯(lián)網(wǎng)、科技等多個領(lǐng)域。
在客戶量方面,標(biāo)貝科技已服務(wù)全球600余家企業(yè)客戶,項目累計超過1000項,涉及智能駕駛、教育、客服、零售、閱讀、智能硬件等場景,展示了平臺在多樣化應(yīng)用場景中的強大適應(yīng)性和市場覆蓋能力。
市場價值
1.重塑數(shù)據(jù)生產(chǎn)效率,降低企業(yè)AI研發(fā)成本
針對行業(yè)普遍存在的人工標(biāo)注效率低、成本高問題,平臺構(gòu)建的“智能數(shù)據(jù)生產(chǎn)流水線”集成先進標(biāo)注工具、智能預(yù)標(biāo)注模型及高效項目管理功能。能提升標(biāo)注質(zhì)量,降低研發(fā)成本30%以上。企業(yè)無需自行搭建復(fù)雜的數(shù)據(jù)處理體系,按需使用平臺服務(wù),節(jié)省了硬件購置、人員招聘培訓(xùn)等費用,將資源聚焦核心業(yè)務(wù),加速AI研發(fā)進程。
2.打破數(shù)據(jù)孤島與模態(tài)壁壘,適配規(guī)模化商業(yè)需求
面對企業(yè)多源數(shù)據(jù)碎片化難題,平臺實現(xiàn)語音、點云、多模態(tài)等全類型數(shù)據(jù)采標(biāo)統(tǒng)一管理,無需多系統(tǒng)切換即可滿足大模型預(yù)訓(xùn)練至評估全階段需求。其高可用、多租戶架構(gòu)適配金融、制造等不同行業(yè)的大規(guī)模數(shù)據(jù)處理訴求,幫助企業(yè)快速將數(shù)據(jù)資產(chǎn)轉(zhuǎn)化為AI落地能力,加速試點項目向生產(chǎn)階段轉(zhuǎn)化。
3.構(gòu)建標(biāo)準(zhǔn)化數(shù)據(jù)底座,保障數(shù)據(jù)安全與合規(guī)
平臺以高可用、高可靠、高安全為核心,嚴(yán)格遵循法規(guī)標(biāo)準(zhǔn),保障數(shù)據(jù)在各環(huán)節(jié)的安全性與保密性。為企業(yè)使用數(shù)據(jù)提供可靠保障,降低因數(shù)據(jù)問題引發(fā)的法律和聲譽風(fēng)險。
4.促進產(chǎn)業(yè)生態(tài)協(xié)同發(fā)展,創(chuàng)造新的商業(yè)機會
平臺促進產(chǎn)業(yè)生態(tài)協(xié)同,連接數(shù)據(jù)供需雙方與AI技術(shù)企業(yè),形成良性互動。還可能衍生出數(shù)據(jù)交易、增值、咨詢等新興業(yè)務(wù),拓展市場空間,為產(chǎn)業(yè)發(fā)展注入新活力,創(chuàng)造更多商業(yè)機會。
相關(guān)評價
區(qū)里對標(biāo)貝科技AI數(shù)據(jù)平臺的服務(wù)水平與可持續(xù)發(fā)展能力給予充分肯定。平臺提供全方位、一站式服務(wù),從前期咨詢規(guī)劃、中期部署實施到后期運維支持,都有專業(yè)團隊及時響應(yīng)企業(yè)需求,確保平臺穩(wěn)定運行。同時,平臺注重可持續(xù)發(fā)展,不斷引入前沿技術(shù),創(chuàng)新標(biāo)注方法與模型訓(xùn)練,為企業(yè)提供更具前瞻性的數(shù)據(jù)解決方案,助力企業(yè)搶占技術(shù)高地。這種創(chuàng)新驅(qū)動與協(xié)同共進模式,為區(qū)域數(shù)字經(jīng)濟發(fā)展注入新的活力。
——青島市嶗山區(qū)大數(shù)據(jù)中心
數(shù)字政務(wù)科副主任 馬喆
多音軌音頻數(shù)據(jù)分軌道標(biāo)注是一項復(fù)雜且對精度要求極高的任務(wù),標(biāo)貝科技的平臺擁有先進的標(biāo)注工具和智能算法,能夠精準(zhǔn)地識別并分離不同音軌,實現(xiàn)高質(zhì)量的分軌道標(biāo)注。同時,平臺提供的私有化部署方案完全滿足了我們對數(shù)據(jù)安全的高度要求。期待未來能繼續(xù)深化合作,共同推動業(yè)務(wù)發(fā)展。
——某智能家電公司產(chǎn)品總監(jiān)
產(chǎn)品所屬企業(yè):標(biāo)貝科技
標(biāo)貝科技成立于2016年,是一家基于技術(shù)驅(qū)動的專業(yè)AI數(shù)據(jù)服務(wù)提供商。致力于提供多語言、跨領(lǐng)域、跨模態(tài)的數(shù)據(jù)采集標(biāo)注服務(wù)以及擁有豐富的多模態(tài)數(shù)據(jù)資源,包括語音、視覺、點云、文本、大模型、多模態(tài)等多個領(lǐng)域。
基于自研的一站式AI數(shù)據(jù)平臺,我們構(gòu)建了一套完備的大模型數(shù)據(jù)處理方案,覆蓋從數(shù)據(jù)采集、標(biāo)注、管理、模型訓(xùn)練與優(yōu)化、部署與應(yīng)用全流程,滿足不同場景下數(shù)據(jù)的處理和分析需求。服務(wù)自動駕駛、智慧醫(yī)療、數(shù)字虛擬人、媒體娛樂等垂直行業(yè)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.