網易首頁 > 網易號 > 正文申請入駐

AI生成操作系統新突破！上海交大提出文件系統開發新范式

2025-12-21 22:37:54　來源: 量子位

北京舉報

分享至

非羊整理自凹非寺
量子位 | 公眾號 QbitAI

還記得《流浪地球2》里的那臺550W量子計算機嗎？

電影里，MOSS最讓人印象深刻的點，除了其強大算力，還有它可以根據需求，實時生成底層操作系統的能力。

如果現在告訴你，我們已經在從“人類需求”生成“底層系統”這件事上邁出了關鍵一步呢？

來自上海交大IPADS實驗室的研究團隊，面對自動生成操作系統核心組件的難題，做出了全新的嘗試。這項研究成果也即將亮相文件系統與存儲領域頂級學術會議USENIX FAST’26。

操作系統：與時俱進的沉重負擔

操作系統（OS），是整個數字世界的基石。

向下，它要管理和調度硬件資源（CPU、內存、硬盤等）；向上，它要為應用軟件提供穩定可靠的運行環境。無論是你手機上的App，還是云端強大的AI模型，都構建在這塊基石之上。

然而，OS必須與時俱進，來滿足硬件和應用的雙重需求：

一方面，硬件的發展日新月異，例如存儲設備，在短短數年內，就從機械硬盤演進到閃存甚至非易失性內存，OS必須快速迭代，才能榨干這些新硬件的性能；

另一方面，新應用也層出不窮，例如大數據分析、AI訓練等，每一個新型應用的出現，都可能對OS的各種功能和性能提出新的要求，例如優先級調度、I/O性能等等。

這些與時俱進的需求，為操作系統帶來了極其高昂的人力成本。開發者們往往需要付出巨大的精力來維護一個已經開發好的操作系統關鍵組件。

研究團隊深扒了Linux操作系統的一個核心組件，Ext4文件系統，分析了其長達20年演進歷史中的3000多個commit記錄，并揭示了一個事實：
82.4%的代碼提交，都投入到了Bug修復和代碼維護中。真正的實現新功能的代碼提交僅占5.1%左右。

開發一時爽，維護火葬場。高人力成本和低產出效率，正成為限制操作系統高效演進的重要原因。

“生成式操作系統”：夢想是否遙不可及？

既然人類維護不動了，讓大模型上行不行？

現在的大模型寫代碼確實越來越強了，寫個網頁前端，小游戲，甚至打Codeforces比賽都不在話下。那么很自然的想法來了：我們能否打造一個“生成式操作系統”，讓大模型來接手這項苦差事？

想象一下，你只需要告訴大模型：“我需要一個為新型網卡優化的、支持超低延遲網絡的操作系統”，然后大模型就能自動生成一個完整的操作系統，不需要人力干預。如果這一美好幻想能實現，將給軟件行業提供一種顛覆性的新范式。

然而，現實往往事與愿違。

用大模型寫過代碼的朋友們都知道，如果你真對大模型說：“請幫我生成一個支持高并發、崩潰一致性的操作系統”，它生成的代碼大概率看起來很合理，但一運行即崩潰。

這是因為，操作系統往往高度復雜，而現有的大模型還難以應對這樣的復雜性。

研究團隊觀察到，想用大模型生成操作系統，必須解決下面的三個關鍵挑戰：

自然語言語義的局限性：自然語言提示詞天生是模糊的。如果只說“要線程安全”，大模型理解和生成的鎖機制可能漏洞百出。作為整個計算機系統的基座，操作系統難以容忍這樣的不準確性。

系統架構模塊的深度耦合性：操作系統模塊繁多，模塊間交互邏輯復雜，耦合極深。大模型受限于上下文窗口，只能管中窺豹，難以進行全局一致的設計，容易出現模塊間的邏輯或接口對不上等問題。

并發控制邏輯的復雜性：實現細粒度的并發控制是操作系統面臨的重要挑戰，也是大部分操作系統開發者的噩夢。讓大模型一邊寫功能邏輯，一邊處理復雜的“避免死鎖”的并發要求，這直接超出了現有大模型的能力上限。

用樸素的自然語言指導大模型生成操作系統，就像是純靠工頭用嘴巴指揮建筑工人造摩天大樓，倒塌是必然的。

SysSpec：給大模型的操作系統設計說明書

如何破局？

IPADS團隊給出的答案是：如果自然語言的描述對大模型來說太過模糊，那就給它提供更加精確的設計說明書。

而這份說明書，正是基于計算機科學中的基礎技術，形式化方法，來實現的。

形式化方法通常是一套用純數學語言給程序定義嚴格語義約束的方法。在傳統用法中，開發者需要寫一份Specification（規約），用嚴謹的公式描述程序“必須做什么”以及“絕對不能做什么”，然后通過數學推導證明程序代碼和規約是等價的。

只要證明通過，程序就在數學層面上被判定為Bug-free。這也是保障航空航天、核能、芯片等領域可靠性的關鍵技術。

基于此，研究團隊有了一個逆向思維的洞察：既然規約如此精確，我們是否可以直接用它來指導生成，而不是事后驗證呢？

沒錯，SysSpec就是這樣的一種全新范式。開發者不需要再手搓容易出錯的C語言代碼，而是直接編寫高維度的Specification。這套過程實際上是形式化方法的“逆過程”：不再由規約驗證實現，而是由規約生成實現。

△SysSpec規約設計示意圖

SysSpec提出了一整套結構化的規約編寫框架，用數學般的邏輯告訴大模型如何實現一個操作系統模塊：

功能規約（Functional Specification）：

引入霍爾邏輯（Hoare Logic），明確告訴大模型每個模塊的功能是什么，包括執行前系統是什么狀態（Pre-condition），執行后必須變成什么狀態（Post-condition）等。

模塊化規約（Modularity Specification）：

描述模塊之間接口層面的依賴關系。大模型在生成A模塊時，明確告訴它能依賴B模塊提供的哪些保證。

并發規約（Concurrency Specification）：

SysSpec將業務邏輯與并發邏輯進行分離，先讓大模型生成正確的串行代碼，再根據專門的并發規約，把死鎖、競態條件等邏輯完成。讓大模型一次只做一件事，效率反而更高。

SysSpec Toolchain：從規約到代碼的自動化工具鏈

有了規約作為說明書，還需要工具實現從規約到代碼的轉換。研究團隊為SysSpec配套了3個基于Agent的工具鏈：

△SysSpec工具鏈的執行過程

1. SpecCompiler：負責將SysSpec“編譯”成C代碼，通過先寫邏輯、再加鎖的方式大大降低生成難度。

2. SpecValidator：專門對抗大模型“幻覺”。它會反復迭代驗證生成的代碼是否符合SysSpec的規約，直到生成結果符合預期（或失敗次數觸發閾值）為止。

3. SpecAssistant：輔助開發者編寫規約，降低上手門檻。

那么，最讓人頭疼的“系統演進”怎么辦？

研究團隊在SysSpec的基礎上，提出了一項新的系統演進方法：DAG-Structured Spec Patch（基于有向無環圖結構的規約補丁）。

系統演進中，我們需要對代碼進行修改，過去讓大模型改代碼是越改越亂，而現在，改代碼變成了改規約，修改的規約被組織成了一個有向無環圖（DAG），每一個模塊的修改本質上是一個圖中的節點：

葉子節點負責定義局部的新邏輯；
中間節點層層向上，利用下層提供的新保證（Guarantee）來構建更復雜的功能；
根節點負責最終的一鍵集成。

這意味著，開發者只需要提交一個規約補丁，工具鏈就會自動計算依賴關系，把新的規約合并到原有實現里。這樣，我們就只需重構代碼中受影響的模塊，從而確保生成的新功能不會破壞原有的系統實現。

△DAG結構化規約補丁

SpecFS：基于規約，實現系統軟件的自動生成和演進

基于這套框架，研究團隊以操作系統中的重要組成部分文件系統為例，構建了一個基于SysSpec規約的完整的文件系統：SpecFS。

SpecFS能夠在開機時自動通過工具鏈，生成基于C語言的操作系統文件系統（無需人工干預），并且還支持根據用戶特定需求和規約補丁實現自我演進。

生成的SpecFS實現，包含各種優化，總共約四千三百行代碼。在Linux 6.1.10版本內核中的82個文件系統中，能夠排到第42位。

團隊還對SpecFS的能力進行了仔細的驗證和評估。

首先是正確性驗證：在xfstests測試套件下，SpecFS的正確性表現可與人類專家耗時許久手寫的系統相媲美。

更值得一提的是它的演進能力。研究團隊嘗試給SpecFS添加了Ext4文件系統的10個復雜特性（如Extent、延遲分配、文件加密等）。

這些特性的引入只需要在SpecFS的規約層通過規約補丁的方式進行擴展。實驗顯示，新引入的特性能夠有效提升文件系統性能。例如引入“延遲分配”（Delayed Allocation）特性后，SpecFS在完成編譯xv6的任務時，寫操作直接減少了99.9%！

研究團隊還招募了實驗室的碩博同學，對使用這套框架進行開發的效率進行測試：相比手動修改C代碼，使用SysSpec演進能力的開發效率提升了3-5倍。

從“易錯的底層代碼”中解放出來

從Ext4文件系統的20年修補之路，到SpecFS的自動生成和演進，SysSpec展示了一種操作系統開發的未來范式（也是研究論文的標題）：
Sharpen the Spec, Cut the Code.

在生成式AI時代，程序員也許不再需要逐行敲擊那些易錯的底層代碼，而是可以更多地關注在有趣的系統設計上，剩下的，就交給大模型去做吧！

arXiv鏈接：https://arxiv.org/abs/2512.13047

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

從零到千萬：一個中國開源操作系統的全球崛起之路

智東西 2025-11-25 17:27:09
1 跟貼 1
vivo藍河操作系統內核開源：一場國產操作系統的「Rust革命」

36氪 2025-07-30 21:32:45
45 跟貼 45

字節 92% 工程師都在用的 TRAE，這次瞄準了企業級市場

愛范兒 2025-12-19 14:38:16
6 跟貼 6

一場千萬美元的賭注：造一個替你賺錢的“分身”

虎嗅APP 2025-12-20 04:56:07
3 跟貼 3
為什么這篇谷歌論文被稱為「Attention is all you need」V2

量子位 2025-12-21 15:15:36
4 跟貼 4

日耗50萬億Token，火山引擎的AI消費品戰事

36氪 2025-12-19 19:18:42
0 跟貼 0

LeCun離職前的吐槽太猛了

量子位 2025-12-21 15:32:14
5 跟貼 5
摩爾線程的野心，不藏了

量子位 2025-12-21 22:23:24
0 跟貼 0

a16z年度重磅報告：OpenAI艱難守擂，谷歌火力全開，用戶只選一個

華爾街見聞官方 2025-12-21 19:36:02
2 跟貼 2
首篇，系統盤點擴散模型高危漏洞！看懂攻擊方式和防御體系

新智元 2025-12-21 17:17:29
0 跟貼 0
破解L4自動駕駛「不可能三角」，一場關于「經驗主義」的價值賽跑

36氪 2025-12-05 21:02:41
0 跟貼 0
模型不用微調，靠上下文就能自我進化？

機器之心Pro 2025-10-11 20:20:59
0 跟貼 0
把討厭的同事放進游戲里，修改代碼為所欲為

柚子剪輯 2025-12-21 08:32:22
1 跟貼 1
26歲鄭州小伙倫敦鬧市開店賣胡辣湯：一碗售價130元

極目新聞 2025-12-19 21:19:26
6017 跟貼 6017
鴻蒙星光盛典見證鴻蒙操作系統從突破到成熟

雷科技 2025-12-21 15:23:54
0 跟貼 0
兩位有這么強大的內核，是不會被流言蜚語所左右的

娛蜀黍ss 2025-12-19 08:56:21
0 跟貼 0
捐給博物院的名畫“江南春”，一千兩百倍增值背后的邏輯！#仇英

雨果說 2025-12-19 10:22:22
303 跟貼 303
生態適配已超95% 鴻蒙下一關：十萬個應用

每日經濟新聞 2025-12-20 23:55:46
683 跟貼 683
鄉村愛情-王大拿詢問公司狀況，不料劉大腦袋拿出的文件是空白

龍耀影視 2025-12-21 10:20:56
1 跟貼 1
成本0.3美元，耗時26分鐘！CudaForge：顛覆性低成本CUDA優化框架

機器之心Pro 2025-11-17 18:45:03
0 跟貼 0
推理新范式：動態效能算法讓算力資源實現最大化

智東西 2025-11-12 19:58:10
0 跟貼 0
人生落差大！曾為微軟寫代碼的印度牛馬，跑到圣彼得堡當起清潔工

我心縱橫天地間 2025-12-21 17:59:15
0 跟貼 0
我的母親（不）是計算機：凱瑟琳·海爾斯與未完成的代碼本體論

澎湃新聞 2025-12-21 14:20:30
0 跟貼 0
“比以往任何時候渴求優秀人才，有條件成就人才！”上海交大校長喊話求賢

上觀新聞 2025-12-21 13:56:31
6 跟貼 6
智能體基礎設施是AI時代操作系統，真正的智能體要能思考、能分析，能行動

量子位 2025-12-11 03:38:22
0 跟貼 0
iPhone互聯、防窺保護、人像精修！華為鴻蒙6一定要會的5個功能！

熱點科技 2025-12-18 13:32:02
0 跟貼 0
天才程序員，賺錢太多，終成心靈雞湯大師

碼農翻身 2025-12-17 08:57:33
1 跟貼 1
業主侵占公共區域，業委會該怎么處理？

免費法律咨詢 2025-12-19 14:21:40
1 跟貼 1
最新發布！南安這2所學校注銷

南安融媒 2025-12-21 17:47:51
0 跟貼 0
從網線到人生攻擊？項立剛批羅永浩 “干啥啥不成”，網友吵翻了

雷科技 2025-12-21 20:25:38
0 跟貼 0
男子的車凌晨狂奔到外地 "好心人"收800元稱愿幫送回

環球網 2025-12-21 18:15:48
866 跟貼 866
Claude Code 被任意代碼執行攻擊的視頻演示

機器之心Pro 2025-09-23 10:44:09
0 跟貼 0
上海科技館攜手上海交大打通青少年科創教育“最后一公里”

上觀新聞 2025-12-21 18:52:06
0 跟貼 0
嚴肅版AI編程助手 GitHub星標3k+

量子位 2025-12-08 15:29:06
0 跟貼 0
開源AI編程工具CoStrict，GitHub星標3K+

量子位 2025-12-09 01:52:08
0 跟貼 0
從機床到代碼：我在中國機械總院的蛻變之旅

舊窗老街 2025-12-20 05:15:08
0 跟貼 0
SGLang原生支持昇騰，新模型一鍵拉起無需改代碼

量子位 2025-12-21 22:22:13
0 跟貼 0
一位被“限高”創始人的自救

虎嗅APP 2025-12-21 17:00:20
30 跟貼 30
英媒曝俄絕密文件：若與北約開戰，普京首選目標竟是中國兩鄰國

戰場科技館 2025-12-21 17:08:19
0 跟貼 0
28歲女同事從不帶飯我分她吃了兩年她辭職那天，人事遞我一份文件

秋Tian動漫 2025-12-21 02:38:57
0 跟貼 0

量子位

追蹤人工智能動態

11894文章數 176340關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

家居

手機

旅游

健康

手機 / 數碼

房產 / 家居

AI生成操作系統新突破！上海交大提出文件系統開發新范式

操作系統：與時俱進的沉重負擔

“生成式操作系統”：夢想是否遙不可及？

SysSpec：給大模型的操作系統設計說明書

SysSpec Toolchain：從規約到代碼的自動化工具鏈

SpecFS：基于規約，實現系統軟件的自動生成和演進

生態適配已超95% 鴻蒙下一關：十萬個應用

必勝客牛排口感奇怪遭質疑"到底用的什么肉" 官方介入

必勝客牛排口感奇怪遭質疑"到底用的什么肉" 官方介入

勇士火箭贏球：王牌之外的答案？

星光大賞太尷尬！搶話擋鏡頭，場地還小

老房子“強制體檢”，政府出手了

-30℃，標致508L&凡爾賽C5 X冰雪"大考"

態度原創

云游安徽｜訪黃山云海古村，讀一城山水風骨

高端私宅 理想隱居圣地

曝折疊屏iPhone嘗試 UFG 玻璃，明年九月發

冰雪升級 體驗煥新 長春哈王國冰雪樂園開園！

這些新療法，讓化療不再那么痛苦

高端私宅理想隱居圣地

冰雪升級體驗煥新長春哈王國冰雪樂園開園！