![]()
(來源:MIT News)
隨著生成式人工智能與機器人技術的快速融合,按需制造正從科幻情節邁向現實應用。
過去兩年,Midjourney、Luma AI 等工具讓公眾逐漸習慣“文生圖”、“文生 3D 模型”的創作方式。然而,這些模型通常停留在屏幕中。真正將其做成實體物品,往往需要復雜的 3D 打印流程:不僅耗時數小時至數天,還存在失敗率高、材料不可逆損耗嚴重等問題。
如今,一項來自麻省理工學院(MIT)的新研究為這一難題帶來突破。研究團隊開發出一套“語音到現實”(speech-to-reality)系統,將語音識別、大語言模型(LLM)、3D 生成模型與機器人自動裝配深度整合,使用戶只需說出一句指令,機械臂便能在幾分鐘內自動組裝出實體物品,從凳子、置物架、椅子、小桌子,到包括狗形雕像在內的裝飾品,都可輕松實現。
該研究來自 MIT 比特與原子中心(Center for Bits and Atoms),核心成員包括研究生 Alexander Htet Kyaw、機械工程系研究生 Se Hwan Jeon 及 CBA 研究生 Miana Smith,并在 ACM 計算制造研討會(SCF ’25)上正式發布。
Kyaw 的靈感來自《星際迷航》中的“復制器”與電影《超能陸戰隊》中的機器人。復制器是一個標志性的科幻技術,它能將能量轉化為物質,按需打印出食物、飲料、工具、零件甚至復雜的生命體,只需輸入指令,就能瞬間制造出所需物品。
在 Neil Gershenfeld 教授的“How to Make Almost Anything”課程中,Kyaw 構建了最初版本的“語音到現實”系統,并在 CBA 實驗室不斷迭代完善。
研究團隊提出的“語音到現實”系統,工作流包括四個步驟:用戶說出諸如“我想要一個簡單的凳子”的指令,LLM 將其轉化為結構化描述;3D 生成式 AI 快速生成物體的數字三維模型;接著,3D 模型被體素化為由標準模塊組成的“離散結構”,類似樂高積木;最后,系統根據現實世界的制造約束(如組件數量、懸垂角度、穩定性等)調整設計,隨后為機械臂生成可執行的裝配順序與路徑規劃。
最終,機械臂可在約五分鐘內完成建造,大幅快于傳統 3D 打印
![]()
圖 | 語音到現實系統的數據流程與軟件組件
不同于傳統增材制造(3D 打印)的不可逆性,MIT 團隊采用的“離散裝配”是一種可逆制造方式。物體不用時,機器人可將其拆解,體素組件可以全部回收,用于構建下一件物品。
這篇論文的第一作者 Alexander Htet Kyaw 表示:“這種方法的意義不僅在于快,更在于可持續。我們希望推動循環制造,使物體的生命周期可逆、可重組、可重復利用。”
例如當你不需要這把椅子時,機器人可以將它拆解,所有的組件都可以回收,用于下一張桌子的建造。這種循環制造的理念,為減少工業浪費提供了全新的思路。
目前,團隊正在進一步優化,包括提升結構強度。目前組件間采用磁力連接,未來將改用更牢固的結構,以提升家具承重能力;擴展至移動機器人與更大規模制造。研究者已構建適用于小型移動機器人的體素裝配流水線,使該方法能夠被推廣至不同尺寸和類型的結構制造;引入手勢與 AR 控制。Kyaw 正探索將手勢識別與增強現實(AR)融入系統,使用戶能夠用語音加動作共同控制制造過程。
1.https://dl.acm.org/doi/10.1145/3745778.3766670
2.https://news.mit.edu/2025/mit-researchers-speak-objects-existence-using-ai-robotics-1205
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.