美國軍方正積極推進(jìn)大語言模型(Large Language Model,LLM)的軍事化應(yīng)用,核心戰(zhàn)略目標(biāo)是獲取“決策優(yōu)勢”。在現(xiàn)代沖突中,美軍期望比對手更快、更準(zhǔn)確地處理海量信息、生成預(yù)測模型并輔助決策。這種對“機(jī)器速度”決策的追求,預(yù)示著未來作戰(zhàn)將從以人為中心向人工智能輔助甚至人工智能驅(qū)動的節(jié)奏轉(zhuǎn)變,其中速度成為關(guān)鍵因素。美國國防部(Department of Defense,DoD)將人工智能(Artificial Intelligence,AI)視為在數(shù)字化競爭世界中保持軍事優(yōu)勢的關(guān)鍵要素,尤其在應(yīng)對大力投資人工智能的對手時。國防部的人工智能戰(zhàn)略強(qiáng)調(diào)以合法、負(fù)責(zé)任和可問責(zé)的方式利用人工智能,使其符合國家價值觀和戰(zhàn)爭法。
![]()
1.ScaleAI:軍事大語言模型發(fā)展的基石伙伴
Scale AI自2016年成立以來,一直致力于構(gòu)建數(shù)據(jù)驅(qū)動的人工智能基礎(chǔ)設(shè)施,并迅速將技術(shù)優(yōu)勢擴(kuò)展到美國國防與情報領(lǐng)域。該公司與美國國防數(shù)字和人工智能辦公室(Chief Digital and Artificial Intelligence Office,CDAO)簽署了其他交易協(xié)議(Other Transaction Agreement,OTA),為聯(lián)合部隊提供數(shù)據(jù)策劃和標(biāo)注服務(wù),助力AI原型從實驗室邁向前線部署。在安全與可控性方面,Scale AI組建了“安全、評估與對齊實驗室”(SEAL),匯聚紅隊攻防和強(qiáng)化學(xué)習(xí)人類反饋(Reinforcement Learning from Human Feedback,RLHF)專家,對大型語言模型進(jìn)行系統(tǒng)級測試和威脅評估,確保模型在極端環(huán)境下的穩(wěn)定性和可控性。
![]()
圖 Donovan運(yùn)作機(jī)制
在此背景下,多諾萬平臺(Donovan)應(yīng)運(yùn)而生,成為Scale AI面向政府與軍工客戶推出的端到端AI代理管理與部署解決方案。Donovan具備大規(guī)模文檔攝取和實時情報分析能力,可在數(shù)分鐘內(nèi)處理超過10萬頁的命令、態(tài)勢報告和開源數(shù)據(jù),并通過RLHF流水線持續(xù)微調(diào)模型以滿足作戰(zhàn)需求。平臺內(nèi)置紅隊工具和定制化評估基準(zhǔn),確保所部署的代理在復(fù)雜戰(zhàn)術(shù)場景中既能提供準(zhǔn)確見解,又能遵循國際人道法和國家情報總監(jiān)辦公室(Office of the Director of National Intelligence,ODNI)的寫作規(guī)范。Donovan已成為首批能夠在分類網(wǎng)絡(luò)上運(yùn)行的大型語言模型基礎(chǔ)設(shè)施之一,支持聯(lián)合作戰(zhàn)計劃、后勤保障和兵棋推演等關(guān)鍵用例,大幅縮短了“從數(shù)據(jù)到行動”的反饋周期。
![]()
圖 Donovan運(yùn)作邏輯
在Donovan生態(tài)內(nèi),Defense Llama大語言模型代表了Scale AI與Meta(前Facebook)開源Llama 3模型合作的最新成果。該模型通過Scale的Data Engine進(jìn)行精細(xì)微調(diào),訓(xùn)練數(shù)據(jù)囊括軍事條令、國際人道法和國防部AI倫理原則,使其能夠在戰(zhàn)術(shù)規(guī)劃、目標(biāo)分析和態(tài)勢感知等場景中給出符合專業(yè)規(guī)范的響應(yīng)。Defense Llama僅限于在政府專用的、安全受控的系統(tǒng)內(nèi)部署,且始終保持“人類監(jiān)督”機(jī)制,并可與Donovan平臺無縫銜接,能夠作為智能代理為指揮官提供多域作戰(zhàn)建議和替代行動方案評估。
![]()
圖 Donovan演示界面
2.“雷神之錘”項目:整合人工智能以支持作戰(zhàn)規(guī)劃
“雷神之錘”(Thunderforge)是美國國防創(chuàng)新小組(Defense Innovation Unit,DIU)的一項旗艦計劃,其目的是將人工智能深度整合到軍事作戰(zhàn)和戰(zhàn)區(qū)級規(guī)劃中,并與先進(jìn)的建模和仿真工具相結(jié)合。該系統(tǒng)的目標(biāo)是加速決策,使規(guī)劃人員能夠快速綜合海量信息,生成多種行動方案,并進(jìn)行人工智能驅(qū)動的兵棋推演,以預(yù)測和應(yīng)對不斷演變的威脅。DIU領(lǐng)導(dǎo)層指出,當(dāng)前的規(guī)劃方法已過時,無法適應(yīng)現(xiàn)代戰(zhàn)爭的激烈敏捷性和現(xiàn)代化設(shè)備。“雷神之錘”標(biāo)志著向人工智能驅(qū)動、數(shù)據(jù)驅(qū)動戰(zhàn)爭的決定性轉(zhuǎn)變。
“雷神之錘”技術(shù)解決方案將提供人工智能輔助的規(guī)劃能力、決策支持工具和自動化工作流程。它利用先進(jìn)的大型語言模型、人工智能驅(qū)動的模擬和交互式基于代理的兵棋推演,以增強(qiáng)美國軍方準(zhǔn)備和執(zhí)行作戰(zhàn)的能力。該系統(tǒng)最初將部署到美國印太司令部(United States Indo-Pacific Command,INDOPACOM)和美國歐洲司令部(United States European Command,EUCOM),以支持關(guān)鍵的規(guī)劃活動,包括戰(zhàn)役發(fā)展、全戰(zhàn)區(qū)資源分配和戰(zhàn)略評估。其跨多個安全領(lǐng)域的整合確保了人工智能驅(qū)動的規(guī)劃能力將安全地嵌入到實際軍事行動中。
“雷神之錘”是一項多方合作的努力,涉及Scale AI(提供代理應(yīng)用、生成式人工智能測試和評估專業(yè)知識)、Anduril(提供Lattice建模/仿真軟件平臺)和微軟(提供最先進(jìn)的大型語言模型技術(shù))。該團(tuán)隊的目標(biāo)是提供一個統(tǒng)一的規(guī)劃生態(tài)系統(tǒng),其中人工智能代理可以模擬兵棋推演和規(guī)劃場景,并完善提議的行動方案。
![]()
圖 lattice系統(tǒng)界面
微軟作為“雷神之錘”項目的重要技術(shù)伙伴,其提供的大型語言模型技術(shù)是構(gòu)建這一先進(jìn)規(guī)劃生態(tài)系統(tǒng)的核心組成部分。此外,其他公司如Systematic也在國防人工智能項目中探索利用大語言模型,執(zhí)行文檔摘要、翻譯和軍事文檔解釋等任務(wù),并研究“大語言模型作為評判者”(LLM-as-a-judge)的技術(shù),以自動化評估模型表現(xiàn),確保為國防客戶提供高質(zhì)量的AI產(chǎn)品。
3.戰(zhàn)場環(huán)境下軍事大語言模型的可靠性與安全風(fēng)險考量
軍事大語言模型在決策支持和情報分析中雖展現(xiàn)出明顯優(yōu)勢,但其內(nèi)在缺陷和潛在威脅在實戰(zhàn)環(huán)境中尤為突出。模型的“幻覺”問題會導(dǎo)致其在關(guān)鍵戰(zhàn)術(shù)或后勤規(guī)劃中產(chǎn)生不準(zhǔn)確甚至完全錯誤的輸出,若憑此做出作戰(zhàn)或資源分配決策,將嚴(yán)重影響部隊效能和安全。提示注入攻擊能夠繞過現(xiàn)有的安全檢查,誘使模型暴露機(jī)密信息或執(zhí)行惡意指令,一旦發(fā)生機(jī)密泄露或錯誤指令下發(fā),將對軍事行動造成直接威脅。此外,用于模型微調(diào)的敏感軍用數(shù)據(jù)若管理不當(dāng),既可能侵犯第三方知識產(chǎn)權(quán),也會在訓(xùn)練管道中留下安全漏洞,為對手提供反向工程和情報竊取的機(jī)會。
更為嚴(yán)重的是,大語言模型的決策過程高度依賴“黑箱”算法,缺乏透明度和可解釋性。一旦在行動中出現(xiàn)誤判或失誤,難以迅速追蹤問題根源,也難以界定是算法偏差、數(shù)據(jù)質(zhì)量不佳還是人類監(jiān)督不到位所致,從而使責(zé)任歸屬和問責(zé)機(jī)制形同虛設(shè)。Meta雖對外宣稱禁止將Llama用于軍事活動,卻在內(nèi)部為國防承包商和情報機(jī)構(gòu)開辟例外,使得合規(guī)政策形同擺設(shè),也為其他國家或非國家行為體復(fù)制使用模式提供了便利,進(jìn)一步增加了技術(shù)擴(kuò)散和濫用的風(fēng)險。綜上所述,除非在嚴(yán)格的安全加固、持續(xù)的人機(jī)協(xié)同監(jiān)督以及透明的審計與問責(zé)框架下,否則將大語言模型直接投入戰(zhàn)時決策支持,難以在高度敏感的國防場景中保證可靠性與合規(guī)性。
4.結(jié)論與未來方向
美軍正加速推進(jìn)大語言模型(LLM)的軍事化應(yīng)用,核心目標(biāo)是奪取“決策優(yōu)勢”。LLM憑借其“機(jī)器速度”的信息分析能力,大幅縮短“從數(shù)據(jù)到行動”的反饋周期,使指揮官能迅速掌握戰(zhàn)場態(tài)勢并生成精準(zhǔn)預(yù)測,從而搶占先機(jī)。大語言模型還能與建模仿真技術(shù)的深度融合,為作戰(zhàn)規(guī)劃與兵棋推演提供強(qiáng)大支持,實現(xiàn)高效地方案生成與威脅模擬,從而指揮官提供關(guān)鍵參考,顯著提升決策制定的效率與速度。
在短期研究與應(yīng)用中,為應(yīng)對當(dāng)前軍事AI的固有挑戰(zhàn),美軍將著重提升LLM在魯棒性、安全性與可控性方面的表現(xiàn)。其中包括構(gòu)建嚴(yán)密的測試驗證體系、強(qiáng)化數(shù)據(jù)治理與網(wǎng)絡(luò)防護(hù),以及貫徹“有意義的人類主控(Meaningful Human Control, MHC)”原則。這些舉措將確保LLM能無縫嵌入現(xiàn)有指揮控制系統(tǒng),并在關(guān)鍵時刻由人工暫停或糾偏,從而有效抵御“幻覺”誤導(dǎo)、提示注入攻擊和敏感信息泄露,進(jìn)而構(gòu)建高效的人機(jī)協(xié)同操作流程。
從更長遠(yuǎn)的視角看,LLM將深度融入陸、海、空及盟軍聯(lián)合作戰(zhàn)的全流程。在未來戰(zhàn)爭中,LLM不僅具備強(qiáng)大的信息分析與規(guī)劃輔助能力,還有望通過自主學(xué)習(xí)和推理,實現(xiàn)復(fù)雜環(huán)境下的自適應(yīng)決策與資源優(yōu)化,動態(tài)調(diào)整戰(zhàn)術(shù)部署與優(yōu)化后勤鏈路,甚至在網(wǎng)絡(luò)空間中執(zhí)行高階威脅識別與響應(yīng)。這種深度融合將為指揮官提供前所未有的戰(zhàn)場全局洞察與未來行動預(yù)判能力。然而,這種能力擴(kuò)展亦伴隨深層次挑戰(zhàn),即LLM如何在電磁對抗和網(wǎng)絡(luò)攻防等嚴(yán)苛環(huán)境中持續(xù)保持其可靠可控性,以及實現(xiàn)全生命周期的高度透明與責(zé)任可溯。(來源:北京藍(lán)德信息科技有限公司)
參考文獻(xiàn)
Leadership: Artificial Intelligence in Decision-Making | Article | The United States Army, https://www.army.mil/article/286847/leadership_artificial_intelligence_in_decision_making Innovating Defense: Generative AI's Role in Military Evolution ..., https://www.army.mil/article/286707/innovating_defense_generative_ais_role_in_military_evolution The Pentagon is upping its bet on AI. Here's what it means for the military - QZ.com, https://qz.com/pentagon-scale-ai-us-military-china-1851767958
Research Shows Risk in Using LLMs for Military Decision-Making - Techstrong.ai, https://techstrong.ai/articles/research-shows-risk-in-using-llms-for-military-decision-making/us department of defense responsible artificial intelligence strategy ..., https://www.ai.mil/Portals/137/Documents/Resources%20Page/DoD%20Responsible%20AI%20Strategy%20and%20Implementation%20Pathway.pdf
How to Scale AI in Your Business - Oracle, https://www.oracle.com/artificial-intelligence/scale-ai-in-business/
Scale AI: Accelerate the Development of AI Applications, https://scale.com/
Scale AI - Wikipedia, https://en.wikipedia.org/wiki/Scale_AI
Donovan: Empowering the Public Sector with AI Agents | Scale AI, https://scale.com/donovan Scale AI launches Defense Llama - Intelligence Community News, https://intelligencecommunitynews.com/scale-ai-launches-defense-llama/Ethical Principles for Artificial Intelligence, https://www.edinstudy.law.ed.ac.uk/wpcontent/uploads/sites/38/2021/11/US-Ethical-Principles-for-Artificial-Intelligence.pdf
Large Language Models for System Security Engineering Analysis - Army SBIR, https://armysbir.army.mil/topics/large-language-models-system-security-engineering-analysis/Thunderforge Project: Integrating Commercial AI-Powered Decision ..., https://www.diu.mil/latest/dius-thunderforge-project-to-integrate-commercial-ai-powered-decision-making Scale AI awarded Defense Innovation Unit (DIU) Thunderforge contract - OrangeSlices AI, https://orangeslices.ai/introducing-thunderforge-ai-for-american-defense/Transcending weapon systems: the ethical challenges of AI in military decision support systems - Blogs | International Committee of the Red Cross, https://blogs.icrc.org/law-and-policy/2024/09/24/transcending-weapon-systems-the-ethical-challenges-of-ai-in-military-decision-support-systems/Meet Thunderforge—DOD's Latest AI Play - GovCon Wire, https://www.govconwire.com/article/thunderforge-dod-scale-ai-prime-prototype-contract On Large Language Models in National Security Applications (2407.03453v1) - Emergent Mind, https://www.emergentmind.com/articles/2407.03453 CDAO Sponsors Crowdsourced AI Assurance Pilot in the Context of Military Medicine, https://www.defense.gov/News/Releases/Release/Article/4020407/cdao-sponsors-crowdsourced-ai-assurance-pilot-in-the-context-of-military-medici/Rules of Engagement as a Regulatory Framework for Military Artificial Intelligence, https://lieber.westpoint.edu/rules-engagement-regulatory-framework-military-artificial-intelligence/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.