現在,企業每天都會產生海量視頻,然而它們真的有價值嗎?如何將服務器中 PB 級“暗數據”變成更有價值的數字資產,正成為視頻 AI 賽道的新挑戰。
近期,AI 視頻公司 InfiniMind 宣布,已完成 580 萬美元種子輪融資。這家位于日本東京的初創公司由兩位前谷歌員工創辦,旨在通過構建基礎設施,讓用戶在無需編寫任何代碼的條件下,即可將 PB 級閑置視頻和音頻資產轉化為結構化數據,支持監控、安全及內容深度分析的快速查詢(注:PB 在數據存儲領域代表拍字節,1PB 等于 1024TB)。
本輪融資由亞洲最大的深度科技風險投資公司之一 UTEC 領投,CX2(Cox Exponential)、Headline Asia Ventures、Chiba Dojo,以及一位來自 a16z Scout 的人工智能研究員也參與了跟投。
![]()
圖丨InfiniMind 團隊主要成員(來源:InfiniMind)
在互聯網數據中視頻數據占據八成以上,但現有工具無法分析和捕捉絕大部分視頻數據。對企業來說,視頻數據仍然是一種不可用的“暗數據”(注:指組織收集但未處理、整理或使用的大量信息)。其中,既包括跨越數十年的廣播節目存檔、全天候運行的工廠監控錄像,也包括零售監控視頻、無人機和衛星圖像等。
云服務廠商提供的服務能檢測到人或車輛等,但需要了解的是,這并非理解上下文,只是一種簡單的標記。盡管新一代視頻 AI 模型可處理視頻內容,但處理視頻的時長有限,即便是開源方案也僅能處理數小時的視頻內容,這些對于企業長達數天、數周甚至數年的視頻素材需求來說遠遠不夠。
“我們在谷歌也看到了同樣的模式,客戶擁有 PB 級的視頻數據,他們提出的關于自身內容的問題看似簡單,但卻找不到合適的答案。盡管有大量視頻數據,但缺乏有效的分析。”InfiniMind 的聯合創始人兼 CEO Aza Kai 說,“我們不僅整合了視覺信息,還整合了音頻、聲音和語音理解功能。”
InfiniMind 提出的解決方案是,通過構建視頻理解的基礎設施將視頻轉化為結構化的企業數據。通過將不同的事件聯系起來,能理解垂直行業中,長達數小時視頻內容中的事件因果關系,從而將目標視頻素材轉化為結構化、可搜索、可操作的數據。這相當于一種可查詢的知識庫,讓現實世界中的事件也能像數據庫一樣被檢索和分析,并能夠直接集成到企業的商業智能工具中。
2025 年 4 月,該公司發布首款 AI 引擎產品 TVPulse。公開資料顯示,TVPulse 利用 AI 分析,能夠“對海量的電視廣播數據內容進行精確的逐秒搜索”,幫助媒體和零售公司追蹤產品曝光度、品牌影響力、市場分析、競品活動監測和風險管理等。目前,TVPulse 已為包括批發商和媒體行業在內的付費企業客戶提供服務,截至目前分析內容已超過 10 萬小時。
InfiniMind 的旗艦產品,是一款能夠深入理解長視頻的視頻基礎設施 DeepFrame。它能夠處理 200 小時的視頻和音頻素材,從而精確定位特定場景、演講者或事件。該產品計劃于今年 3 月進行測試,預計在 4 月正式發布。
與現有方法孤立地分析片段不同,DeepFrame 的核心亮點是,以統一的數據流方式處理視頻、語音和環境音頻,并追蹤長視頻片段中的因果關系。以安全事件場景為例,不僅需要檢測到人員或車輛,而是檢測完整的敘事:誰進入了現場,接觸了什么,去了哪里以及最終發生了什么。
與 TwelveLabs 等公司面向廣大用戶,通過提供通用的視頻分析 API 不同,InfiniMind 專為企業部署而構建:其通過提供虛擬私有云(VPC,Virtual Private Cloud)和本地部署,能夠幫助滿足數據主權要求,而這正是許多組織在采用云端 AI 時面臨的一大障礙。
此外,DeepFrame 還包含一個微調工廠,可生產多種規格的行業專用模型,從而讓客戶能夠在成本、精度和速度之間實現最優平衡。
兩位公司的聯合創始人 Aza Kai 與 Hiraku Yanagita 此前在谷歌密切合作了近 10 年。其中,Aza Kai 在谷歌擁有 9 年以上的工程經驗,曾從事數據科學、機器學習和云基礎設施方面的工作,設計大規模機器學習解決方案,并曾領導了亞太地區的數據科學團隊。Hiraku Yanagita 則在谷歌日本擁有 10 年以上數字營銷經驗,曾專注于品牌和數據解決方案,為企業客戶提供深入的分析和服務。
實際上,他們在谷歌工作時就看到了技術發展的可能性。2021 年至 2023 年期間,隨著視覺語言模型的持續進步,視頻 AI 開始超越簡單的物體標記。“過去 10 年,GPU 成本的下降和每年約 15% 至 20% 的性能提升固然有所幫助,但更重要的還是模型能力的提升。”Aza Kai 對媒體表示。
直到 2024 年,這項技術發展成熟且市場需求也變得足夠明確,Aza Kai 與 Hiraku Yanagita 決定共同創立 InfiniMind(公司曾用名 SDio),并分別擔任公司 CEO 和 COO。目前,InfiniMind 在東京的員工有 10 余名,此外還有來自東京大學的研究合作者,他們為模型評估和視頻理解基準測試做出了貢獻。
憑借技術方面的創新,該公司入選了多個項目,包括 AWS 生成式人工智能加速器(GAIA 2025)、日本經濟產業省的生成式人工智能挑戰計劃 (GENIAC)、NVIDIA Inception 計劃以及 Google for Startups 云計劃。
據公開信息,該公司計劃將總部遷至美國,同時繼續保留日本辦公室。本輪融資的資金將用于幫助 InfiniMind 團隊繼續開發 DeepFrame 模型、擴展 PB 級視頻處理的工程基礎設施、招聘工程師以及拓展在日本和美國的客戶群。
參考資料:
https://infinimind.io/en
https://techcrunch.com/2026/02/09/ex-googlers-are-building-infrastructure-to-help-companies-understand-their-video-data/
https://prtimes.jp/main/html/rd/p/000000007.000166252.html
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.