![]()
視聽科技前沿

AIGC
谷歌發布新一代圖像生成模型 Nano Banana Pro
該模型處理復雜信息表現出色、文本渲染能力突出、具備強大的多元素合成能力和更高級的創意控制選項,可生成4K分辨率的高清圖像。由其生成或編輯的圖像都將嵌入 C2PA 元數據,幫助用戶識別AI生成內容與深度偽造。
(IT 之家 www.ithome.com)
Meta 發布能識別 1600 種語言的 ASR 系統
這是首次實現對1600種語言高精度語音識別的系統。Meta完全開源此模型與工具鏈,用戶只需提供少量帶標注的音頻-文本對,系統即可快速適配新語種,讓“可用語音技術”覆蓋到少數族裔等長期被忽視的群體,標志著AI從“技術中心主義”走向“文化包容主義”。
(通信網 www.c114.com.cn)
AI本地化部署
MDT 發布無需聯網開箱即用 AI 智能體一體機
近日,中國人工智能計算設備提供商MDT在第二十七屆高交會上發布AIImmerse智能體一體機,該設備主打本地化、高隱私與強算力,預裝多種大模型、支持2D實時轉3D、3A游戲VR化及私有知識庫構建等,解決云端AI高成本與隱私風險。
( CAMB.AI 官網 www.camb.ai )
博通探索端側AI翻譯芯片,提升家庭終端體驗
近日,美國博通公司將CAMB.AI研發的多語言語音及翻譯模型集成至博通的片上系統,為智能電視、機頂盒等家庭終端賦予了本地化多語言交互能力。該方案支持超150種語言輸出,保障了弱網環境下功能穩定,兼顧隱私安全與響應效率,奠定了端側
AI 翻譯芯片在家電設備中進一步應用的基礎。
(AIbase 網 news.aibase.com)
騰訊發布最新視頻生成模型,大幅降低部署門檻
該模型基于 Diffusion Transformer 架構,參數量8.3B,能生成 5 至 10 秒高清視頻,支持多種生成方式。其采用創新機制提升推理效率,在關鍵維度達商用水平,且僅需 14G 顯存顯卡即可運行,大幅降低了部署門檻。目前模型已開源,有望推動創作行業變革。
(AIbase 網 news.aibase.com)
數字人與超高清
我國發布虛擬數字人領域首項國家標準
近日,商湯科技牽頭完成了《信息技術客服型虛擬數字人通用技術要求》(GB/T 46483-2025)的起草制定。該標準明確規定了客服型數字人的功能與性能要求。其頒布實施為影視領域相關標準制定提供了參考,標志著我國虛擬數字人產業邁入規范化、高質量發展階段。
(商湯科技官網 www.sensetime.com)
HDR Vivid 獲 DVB 會議通過,將提交為 ETSI 標準
UWA 聯盟制定的 HDR Vivid 視頻標準獲國際產業組織認可,為成為全球通用標準奠定了基礎。該標準采用智能計算技術,能動態優化畫面亮度和色彩,其生態已具規模。此次獲 DVB 會議通過印證了其技術先進性與產業可行性,下一步將進入 ETSI 標準制定流程,預計 2026 年 5 月正式發布。
(新浪財經網 finance.sina.com.cn)
(網易新聞 m.163.com)
傳輸
江蘇臺聯合紫金山實驗室完成蘇超6G直播試驗
該試驗采用 6G 無蜂窩網絡傳輸視頻,團隊優化了圖傳設備的傳輸協議,并建立專屬通信鏈路,實現信號直連回傳。在比賽現場,該技術方案用于記者采訪視頻的實時無線傳輸,并作為主傳輸鏈路的應急備份,提升了直播的可靠性。
(江蘇省廣播電視局 jsgd.jiangsu.gov.cn)
西班牙國家廣播電臺將停播AM廣播
近日,西班牙廣播電視公司RTVE宣布,西班牙國家廣播電臺(RNE)及Radio 5網絡的AM廣播將于12月31日前停播,以推動向數字廣播DAB+轉型。數據顯示,近十年來RNE的AM廣播聽眾銳減,聽眾流失與能源成本上升或是停播主因。
( RadioWorld www.radioworld.com )
資訊全文及更多科技動態請點擊訪問“廣電獵酷”微信小程序:
廣電視聽科技動態
好文共賞請轉發 有話要說請留言
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.