![]()
物理AI——控制機器人和工業機械在現實世界中運作的人工智能分支——存在明顯的層級問題。在最頂層,OpenAI和谷歌正在擴展多模態基礎模型。在中間層,英偉達正在構建物理AI開發的平臺和工具。
而第三個陣營則是日立和德國西門子這樣的工業制造商,它們提出了一個更為務實但可能更加扎實的論點:如果不首先理解物理世界,就無法訓練機器在其中導航。
這一論點現在正從董事會策略轉向工廠車間部署,正如日立在最近接受《日經亞洲》采訪時所透露的那樣。
差異化的專業知識
日立技術創新中心人工智能部副主任柳井公介直截了當地說明了可行的物理AI與理論型物理AI的區別。"物理AI如果沒有從物理學基礎知識和工業設備的系統性理解開始,就無法在社會中實施,"他對《日經》表示。
日立的優勢在于它已經掌握了大部分基礎知識——這些知識是在數十年建設鐵路、電力基礎設施和工業控制系統過程中積累的。該公司擁有模擬氣體和液體行為的熱流體仿真技術,以及用于監控設備狀態的信號處理工具——柳井將其描述為支撐日立"產品設計和控制邏輯構建廣泛知識"的工程基礎。
實際應用案例
雖然日立的總體物理AI架構——集成世界基礎設施模型(IWIM),該公司將其描述為整合多個專業模型和數據集的專家混合系統——仍處于概念驗證階段,但兩個現實世界的部署表明,底層方法已經產生了結果。
在與大金工業的合作中,日立部署了一個AI系統,用于診斷商用空調制造設備的故障。該系統基于設備維護記錄、程序手冊和設計圖紙進行訓練,現在可以在檢測到異常時識別哪個組件可能發生故障——這種操作直覺以前只存在于經驗豐富的工程師頭腦中。
與東日本鐵路公司(JR East)合作,日立構建了一個AI系統,用于識別運行東京都市區鐵路交通管理系統控制設備故障的根本原因,然后協助操作員制定應對計劃。在一個延誤會影響數百萬日常出行的網絡中,加速故障診斷的能力具有真正的操作價值。
研究突破
日立的物理AI推進也體現在其研究成果中。2025年12月,該公司在ASE 2025——一個頂級軟件工程會議上發表了兩個項目的研究成果,這些項目解決了工業AI中的一個持續瓶頸:編寫和調整控制軟件所需的時間和精力。
在汽車領域,日立及其子公司Astemo開發了一個系統,使用檢索增強生成技術自動為車輛電子控制單元(ECU)生成集成測試腳本——從硬件特定的API信息和一線工程知識中提取信息。在涉及多核ECU測試的試點項目中,該技術與手動執行相比,減少了43%的集成測試工時。
在物流領域,該公司開發了可變性管理技術,將機器人控制軟件模塊化為圍繞機器人操作系統(ROS)構建的可重用組件。通過提前映射不同倉庫設置的環境變量和操作要求,該系統讓操作員可以在不從頭重寫軟件的情況下,將機器人揀選和放置工作流程適應新產品或布局。
安全保障
貫穿日立所有物理AI工作的一個線索是其對安全保障的重視——不是作為合規檢查項目,而是作為系統設計中的工程約束。柳井告訴《日經》,該公司正在整合其來自社會基礎設施開發的控制和可靠性技術,以防止AI輸出偏離人類批準的操作參數。
這包括輸入驗證以篩選出模型不應訓練的數據,輸出驗證以確保機器行動不會危及人員或財產,以及對AI模型本身進行實時監控以檢測操作異常。
這是一個重要區別。物理AI系統在現實世界中失敗,而不是在沙盒中。控制鐵路信號或工廠機器人的AI所面臨的風險與管理聊天機器人的風險完全不同。
基礎設施建設
在基礎設施方面,日立萬達——集團的數據和數字基礎設施部門——正在定位自己為英偉達RTX PRO服務器的早期采用者,該服務器基于RTX PRO 6000 Blackwell服務器版GPU構建,專為加速智能體和物理AI工作負載而設計。該硬件正在與日立的iQ平臺配對使用,用于構建數字孿生——物理系統的虛擬副本——可以大規模模擬從電網波動到機器人運動的一切。
與此同時,IWIM概念設計用于通過模型上下文協議(MCP)將英偉達的開源Cosmos物理AI開發平臺與專門的日語大語言模型和視覺語言模型連接起來——本質上是一個框架,用于將物理AI系統所需的模型、仿真工具和工業數據集拼接在一起。
更廣泛的物理AI競賽遠未結束。但日立的立場——領域專業知識和操作數據與模型架構同樣重要——越來越難以忽視,特別是隨著與大金和JR East等合作伙伴的部署開始證明這種專業知識在實踐中的真正價值。
Q&A
Q1:什么是物理AI?它與普通AI有什么區別?
A:物理AI是控制機器人和工業機械在現實世界中運作的人工智能分支。與在虛擬環境中運行的普通AI不同,物理AI系統在現實世界中失敗會帶來更嚴重的后果,比如控制鐵路信號或工廠機器人的AI所面臨的風險與管理聊天機器人的風險完全不同。
Q2:日立在物理AI領域有哪些實際應用案例?
A:日立已經有兩個重要的實際應用。一是與大金工業合作,部署AI系統診斷商用空調制造設備故障,能識別哪個組件可能發生故障。二是與東日本鐵路公司合作,構建AI系統識別鐵路交通管理系統控制設備故障的根本原因,并協助制定應對計劃。
Q3:IWIM集成世界基礎設施模型是什么?
A:IWIM是日立的物理AI總體架構,被描述為整合多個專業模型和數據集的專家混合系統。它設計用于通過模型上下文協議將英偉達的開源Cosmos物理AI開發平臺與專門的日語大語言模型和視覺語言模型連接起來,目前仍處于概念驗證階段。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.