(本文編譯自Semiconductor Engineering)
AI正滲透整個半導體生態系統,迫使AI芯片、用于制造它們的設計工具以及確保其可靠工作的方法發生根本性變化。
這是一場全球性的競賽,未來十年幾乎每個領域都將被重新定義。一些EDA高層管理人員近期總結了三大趨勢,這些趨勢將成為可預見的未來的焦點:
AI本身正從嚴格控制的機器學習擴展到AI助手、生成式AI和代理式AI。
這種轉變需要處理海量數據,才能創建大語言模型和算法。由于規模擴展的限制,它正推動向多芯片組件的轉變,最佳選擇是3D IC。
芯片和系統需要在整個生命周期內進行監控,以確保可靠性。AI容易產生‘幻覺’,而充滿芯粒的復雜系統可能會隨著時間的推移以意想不到的方式出現性能下降,導致靜默數據損壞、軟件更新帶來的不兼容,以及工作負載變化導致的加速老化。
人工智能
在EDA中,AI的應用場景已從簡單的模式識別發展到輔助設計和廣泛的知識共享,使初級工程師能夠更快地上手,資深工程師則能擴展到新的領域并提高工作效率。
新思科技總裁兼首席執行官Sassine Ghazi表示:“我們對AI的定位包括‘副駕駛’、‘輔助工具’和‘創意引擎’。輔助工具涵蓋工作流助手、知識助手和調試助手,既能讓初級工程師快速上手,也能幫助資深工程師以更現代、高效的方式與我們的產品交互。而創意引擎則體現在多個場景中,例如我們已與早期客戶合作,通過AI輔助完成RTL代碼生成、測試平臺搭建和測試斷言編寫——就像副駕駛一樣,幫助工程師創建部分RTL代碼、測試平臺文檔和測試斷言。”
Ghazi指出,借助創新工具,各種任務的執行時間可以從幾天縮短到幾分鐘,但這一切都需要嚴格控制。“我們不能讓模型產生‘幻覺’,”他強調,“我們在與客戶合作的時機和方式上非常謹慎,確保所提供技術的成熟度符合要求,不會危及他們的工作流。隨著AI的不斷發展,工作流程也將隨之演變。投資者常問我們,何時能通過AI推動EDA市場變革?我認為,除非工作流本身發生改變——即通過截然不同的方式更快、更高效地實現產品規劃——否則變革不會真正發生。現在,隨著代理式AI時代的到來,代理工程師將與人類工程師合作,以應對這種復雜性并改變工作流程。”
如果AI能夠兌現承諾,這場變革的規模將不可估量。但當前技術演進速度極快,也引發了許多目前尚無明確答案的問題:AI究竟擅長哪些領域?哪些環節需要密切監控?風險又存在于何處?自20世紀50年代末以來,關于AI變革能力的預測往往過于樂觀,但從ChatGPT推出至今的短短幾年間,AI似乎終于開始兌現承諾,而代理式AI將成為下一個重要目標。
西門子數字工業軟件首席執行官Mike Ellow表示:“如果我們有足夠信心賦予AI一定程度的自主權,使其能夠自主做出主動決策,那么代理式AI將是一個有趣的概念。在設計領域,當我們開始討論代理AI與代理式AI時,這其定義取決于溝通對象及他們對術語的細分方式。從我們的角度來看,代理AI是指我們定義帶有一組邊界條件的任務,然后讓AI在該框架內運行以得出解決方案。而代理式AI則基本上是指‘這是問題所在,你自行思考執行的最佳方式,提出解決方案,并從EDA的角度朝著預期結果推進’。這就是我們看待AI在工具中演進的方式。”
AI的采用率之高前所未有。在芯片設計領域,很難找到一個AI不發揮作用的領域,無論這種作用是直接的還是間接的。
是德科技EDA軟件副總裁兼總經理Niels Faché表示:“這對我們行業來說是一場深刻的變革。當你在仿真領域和物理領域中推進工作時,所有這些環節都會生成數據,也會有可收集的洞察。這正是AI能夠大顯身手的地方。從仿真的角度思考,AI可以幫助我們進行建模,加快仿真速度,為產品增添更多專業知識,以協助設計團隊,還能幫助設計師生成設計方案。AI非常強大,且具有變革性。幾年前,一位客戶告訴我,‘我有一個設計團隊,但他們花費大量時間使用你們的產品進行仿真。我真的希望他們成為設計師,而不是仿真員。’產品設計團隊不想學習仿真器的工作原理,也不想花費大量時間設置仿真環境。他們只想思考需求,以及如何根據這些需求創建設計。這就是AI的力量,它能真正幫助客戶從產品設計思路轉向他們真正想要做的事情。AI可以幫助你在PCB上布線,或者設計新的拓撲結構。”
Cadence總裁兼首席執行官Anirudh Devgan將AI在EDA中的角色比作三層蛋糕中的一層。“要讓應用成功,三層都不可或缺,”他表示,“包括是AI代理和編排層,核心仿真層(有時人們會忽視其重要性,它涵蓋真實晶體管行為、分子運動、流體動力學和熱學等,無可替代),以及運行計算的硬件層。”
從計算角度看,AI更像是演進而非革命。“AI初期需要密集計算,但物理世界并非密集型,AI本身也不是——所有神經網絡都非完全密集。由于設計和需求的復雜性,我們在算法層面不斷創新,涉及延遲處理、分區策略和層級架構。這既體現在抽象層的頂層設計,也反映在純算法的底層邏輯。這些算法中,一半是布爾型(如邏輯仿真、形式驗證等‘0/1’運算),另一半是數值型(如邏輯仿真、形式驗證等‘0/1’運算),兩者都需要加速技術……而如今借助AI,我們可以從自然語言和優化的角度,在軟件領域實現更高層次的創新。AI非常擅長優化,這就是我們多年來持續投入的原因。我們已構建了五大AI平臺——數字設計、驗證、定制電路、封裝和系統分析,取得的實際效果相當顯著……AI完全能重塑芯片設計,這就是我們在這五大平臺大舉投入的原因。”
EDA廠商如何利用AI在一定程度上因起點不同而有所差異。但LLM的優勢之一在于能夠跨越不同數據類型,從而提升整個流程的抽象水平。因此,起點的重要性并不像乍看起來那么重要。關鍵在于廠商如何獲取和利用數據,以及他們能在多大程度上將數據擴展到設計階段之外——這在很大程度上取決于未來數據的共享和保護方式,以及企業如何發掘機遇。
正如西門子的Ellow所解釋的那樣:“我們以生成式AI領域為基礎,因為這是第一個能從我們和客戶數據源中獲取大量驗證數據的層級。這些數據會進入數據湖,用于訓練LLM。我們可以使用各種LLM,客戶也可以使用他們自己的LLM。然后可將其嵌入到基礎設施中,并在其基礎上運行我們的所有工具。”
鑒于綠地機遇的廣闊性,選擇合適的切入點極具挑戰性。這就是為什么初始起點需要具備實際相關性。“成為一名射頻工程師需要多長時間?這幾乎是一門藝術,”是德科技的Faché表示,“這不是六個月就能掌握的,通常需要數年時間。但借助AI,我們能讓設計師更容易地獲取信息,真正縮小經驗豐富的射頻設計人員與新手工程師之間的生產力差距。聊天機器人就是一個例子,它能以更好的形式在合適的時間為客戶提供信息。”
3D IC
AI需要大量數據,尤其是用于訓練模型的數據。問題在于,由于光罩限制,平面芯片無法快速高效地處理所有數據,因此許多數據中心采用某種多芯片組裝技術(例如扇出式或2.5D技術),以提升性能并降低功耗(相比平面SoC)。
![]()
圖1:3D IC概念模型。
(圖源:英特爾代工廠)
但上述方案大多屬于漸進式改進。要實現性能和功耗的大幅提升,需要真正的3D IC、混合鍵合技術和芯粒陣列。
Ellow表示:“2.5D封裝技術讓芯片結構更加靈活,使其更適應所運行的軟件。當完全采用3D IC時,可在不同的芯片之間進行更離散的分區,并利用不同的工藝針對不同的功能進行優化,這為匹配軟件工作負載提供了更具吸引力的可能。盡管這仍是一種理想目標,但優化方向已然明確。”
兩個關鍵挑戰在于:如何管理散熱,以及如何確保不同芯片層正確鍵合,從而使密集互連完美對齊。此外,3D IC中的一些芯粒將采用最先進的工藝開發,而其他芯片則可能采用成熟的工藝開發,這使得問題更加復雜。
“客戶已在談論將數萬億個晶體管集成到單一封裝中,同時將流片周期從18個月壓縮至16個月、12個月甚至更短,以快速交付智能系統的定制化芯片,”Ghazi表示,“如何應對這一趨勢?單芯片技術的復雜性——我們說的是GAA等埃級設計工藝——再加上先進封裝的集成挑戰,構成了雙重考驗。”
這是擴展到數千億甚至數萬億個晶體管的唯一方法,但將它們組合在一起將是一項工程壯舉。“一旦你開始擴展到這種復雜程度,你就只能通過提高互連層的效率來實現所需的性能或功耗,”Ghazi表示,“而且芯片可能來自不同的工藝技術和代工廠。如何驗證和確認架構才能交付先進封裝?”
這也為以芯粒形式出現的軟IP和硬IP打開了大門。“伴隨3D IC與AI技術的崛起,新機遇不斷涌現,因此我們正在加倍投資IP,”Devgan表示。
數字孿生
EDA廠商敏銳地意識到AI系統的風險以及3D IC架構中的未知因素。
“需要將設計和測試連接起來,并在從設計到測試的驗證過程中引入‘數字威脅’,”Faché表示,“現有工具可以管理質量和可靠性。當然,數據管理和分析的需求也日益增長。所有這些工具都需要有,客戶需要從自主研發的工具轉向商業工具。但這些工具也相互依存,因此需要一個中心輻射模型,使不同工具能對數據進行處理。數據會隨時間演變,它們可能會消耗數據,也可能會生成數據。IP是在產品生命周期內開發的。因此,如果我們想要實現真正的數字化轉型,就需要一個基礎架構,讓客戶能夠做到這一點。數據管理過程至關重要。”
這個概念仍在演進,相關術語也是如此。一些廠商稱之為數字孿生,而另一些則稱之為虛擬孿生。但基本概念是對系統進行實時監控,以確保其運行符合預期,根據工作負載盡可能地對其進行優化,并在出現問題之前采取措施進行修復。
Devgan表示:“業界對精確數字孿生有著巨大需求,尤其是在物理領域及推動這一需求的相應硅芯片設計中。這就是我們投資數據中心數字孿生技術的原因——用于模擬整個數據中心。雖然這是一款非傳統產品,但它變得至關重要:應用計算流體力學(CFD)、仿真和AI來優化數據中心。我們甚至將其應用于內部的數據中心。關于數據中心,需要記住的是,不僅僅那些大型云計算公司擁有,企業中也有很多數據中心。當我們將它應用于我們自己的數據中心時,電力效率提高了10%,這意義重大,因為數據中心的設計缺乏科學方法論支撐。芯片、機架和所有網絡設計都應用了大量的科學原理。但數據中心的選址、冷卻池規模、散熱過度或不足,以及定期維護等環節,卻不像芯片設計那樣有嚴謹的科學依據。因此,一旦建立數據中心的數字孿生模型,就能進行更深入的優化。”
這個概念很容易理解,但除了早期的一些成功案例外,離散數字孿生技術仍處于發展階段。“數字孿生尚未形成商業化系統,”Ellow表示,“它是一系列組件集合,包含了軟件、半導體、封裝和電路板等電子元件。此外,它還涉及電氣效應、機械部件,以及與之相關的多物理場分析產品組合。同時,它還涉及產品生命周期管理,因為所有這些組件都必須通過物料清單來構建。單一公司若能覆蓋所有這些獨立領域,就能提供獨特的洞察,但當將整個產品組合納入制造流程仿真等環節時,仍存在一些差距。如何為最終產品的實際生產(即所有系統集成)做好準備?這其中有太多問題需要拆解。”
行業正在取得進展,但這并非一勞永逸的萬能解決方案。“作為一個行業,我們討論數字孿生已有一段時間,但鑒于在系統級進行實時仿真、分析和優化的復雜性,這項技術至關重要,”Ghazi表示,他將數據中心和汽車等應用列為該技術的關鍵市場。“隨著我們開始深入研究汽車和自動駕駛的復雜性,數字孿生需要同時對電子設備和周圍環境進行建模。以汽車為例,我們必須與生態系統合作,因為除了芯片虛擬化和電子系統外,還有其他部件需要集成。”
結語
AI革命已經開始。與所有新技術一樣,解決矛盾并識別問題需要整個科技生態系統多年的努力。
“挑戰重重,”Faché表示,“首先,無論是設計師、設計團隊成員,還是工具供應商,都必須精通AI。學習AI是一個全新領域,這意味著我們需要真正理解工程生命周期的變化。這是對工程生命周期的根本性重新設計。人們需要了解在AI世界中如何開發模型,機器學習的運營工作流程是什么樣的。構建模型需要成本,必須具備相應資源、流程和數據管理結構才能實現。最終,還需要確保這些工具可靠運行。這是一場人人都需擁抱AI的競賽。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.