![]()
向東:清華大學軟件學院教授, 博士生導師。
研究領域:數字系統測試與設計:可測試性設計,可測試性分析,低成本測試,自測試,測試碼產生;容錯計算,并行/分布式計算,計算機網絡通訊。
在半導體設計與測試領域,DFT(Design for Testability,可測性設計)長期被視為“幕后英雄”:它直接決定了芯片從設計到量產的可行性,卻往往不為行業外所關注。隨著數字芯片規模持續增長,以及汽車電子和高可靠性應用的興起,這一曾被邊緣化的技術正成為芯片研發的核心剛需。
2月1日,「芯榜」和科技自媒體「小滿書簡」對話清華大學向東教授,帶我們深入解析芯片測試背后的技術挑戰與創新突破,展示如何通過自主研發數字芯片ATPG/DFT工具,實現測試覆蓋率大幅度提升和壓縮比成數量級提升。
向東教授在EDA與DFT領域深耕三十余年,擁有從邏輯掃描自測試(Scan-Based BIST)到現場測試(In-Field Test)的系統實踐經驗。向東教授及其團隊自主研發了完整的DFT/ATPG/LBIST軟件系統,對標Mentor Graphics和Synopsys產品,不僅填補了國內EDA廠商在該技術方向的空白,更在核心技術指標如測試壓縮比成數量級超越國際同類商用軟件Tessent和TestMax。
![]()
![]()
01
DFT為什么現在變得重要?
Q:能否請向教授介紹一下您目前的工作和研究重點?
向東:我主要從事EDA軟件中DFT/ATPG/LBIST相關工作,聚焦數字系統的可行性設計和測試,包括邏輯掃描自測試、片上網絡以及芯粒集成的DFT部分。這塊技術現在已經不可回避,是芯片開發中的核心環節。以前,這一領域在國內基本沒人重視。沒有大項目支持,也沒有哪個地方把它當作重要研究方向。但現在情況不同了,因為該專題技術已經成為每一款數字芯片開發的剛需,繞不開這塊。
Q:長期以來,DFT一直不受重視,為什么現在會突然變得重要?
向東:過去大家普遍認為,國際上EDA廠商有現存的工具就夠用了,不必自己研發。工業界的從業者也認為,這個領域已經研究透了,不需要再投入新的開發。但現實并非如此,實際國際上現有的商用工具仍存在大量缺陷和不足。
另外技術核心上存在嚴重問題。大多數工具的核心技術都是十年前開發的,幾十年來幾乎沒有大的技術突破,僅僅是做一些小修小補。隨著芯片復雜度提升及工藝尺寸降低,這些不足被放大,迫使我們重新審視DFT的重要性。
Q:那DFT環節在整個流程中處于什么位置?
向東:大多數人會覺得DFT僅僅是后端的事,這個說法并不準確。我們開發的工具是橫跨前后端的。簡單說,就是邏輯綜合完成后, 生成電路網表,我們要把DFT邏輯嵌入到這個網表里。在芯片網表里里加上一些DFT模塊SLFSR及相移器和門控邏輯,讓芯片在后續測試執行過程中能夠能夠實現線性解壓縮。
Q:這樣聽起來確實有點像“幕后操作”?
向東:沒錯。舉例來說,有一些IP模塊和硬件架構,我們要把這些結構嵌入到邏輯網表里,然后再走后續的物理設計——包括布局布線(layout及routing)、元件擺放(placement)、光刻等,最后經過流片和封裝,才能夠投入市場。
在投入市場前,芯片必須通過制造測試。這里的DFT就發揮核心作用:我們把生成的測試數據(ATPG數據)導入測試平臺進行驗證,確保芯片在投入市場前沒有問題。
但DFT不僅僅在制造測試階段發揮作用,還有現場測試的需求。舉個例子,車載電子芯片對可靠性要求極高,不僅要在出廠前測試,還要在整個生命周期中持續監控。現場測試可能是在汽車啟動或停機時快速完成,以捕捉新的潛在問題。
Q:DFT的數據也會直接植入芯片,用于實時監控?
向東:是的。在數據中心或計算集群里,閑置節點也需要定期測試,看看是否出現新的問題。常規測試包括固定型故障測試和LOC(launch-on-capture)跳變延遲測試,這是最核心的部分。但現在還會加入一些新的元素,比如老化測試,確保芯片在長期運行下依然可靠。
Q:所以DFT不僅僅是“制造前的測試”,而是貫穿芯片設計、制造到使用的全周期?
向東:DFT從芯片設計到投放市場,再到使用周期中的現場測試,都發揮著至關重要的作用。
02
突破極限的EDA測試技術
Q:EDA測試技術門檻非常高,但長期以來一直被低估,您怎么看這個現象?
向東:核心問題就在于,以前大家普遍覺得“外面有現成工具可用”,不需要我們自己去研發。這是導致長期被低估的主要原因。
問題在于,如果別人卡脖子,不讓用了怎么辦?這就凸顯出自主研發和自主知識產權的重要性。必須有自己的工具體系及技術體系,不能單純照搬別人。照搬別人不僅可能涉及違規,而且效果也未必好。
去模仿的原型往往也不算先進,技術含量有限,模仿也沒多大意義。所以,低估不僅是因為技術看似“可用”,更是因為很多人沒看到它的核心復雜性和戰略價值。
Q:您團隊的系統在測試壓縮方面,最高可以達到單固定型故障近2 萬倍,跳變延遲故障6000 多倍,這些數字意味著什么?
向東: 這其實反映了我們在性能上相對于傳統工具的巨大突破。相比國際上的一些EDA廠家的DFT/ATPG工具,比如西門子Mentor的TESSENT工具,我們在測試壓縮上實現了成數量級的提升,這個成績背后有多個核心因素。
Q:具體有哪些因素?
向東:首先是我們設計了一套軟件定義的線性反饋移位寄存器(SLFSR)解壓器。這和西門子Mentor的固定設計不同,我們的解壓器可以重構多種多項式連接方式,也就是說可以把十多種不同的本源多項式靈活移植進去。
這直接提升了編碼能力。傳統工具使用固定的解壓器,只有一個唯一的本源多項式,這在復雜電路設計中無法充分利用電路結構上的靈活性。
其次是掃描結構的改進。常規EDA工具使用傳統掃描鏈,我們采用的是掃描樹結構,也就是一根內部掃描鏈信號線可以驅動數百條內部掃描鏈段。傳統工具可能只能驅動一條鏈,值是固定的,而我們可以靈活驅動幾百條鏈,充分利用電路的靈活性。這對大規模電路設計和測試壓縮提升非常關鍵。
再加上門控邏輯和我們自己的ATPG工具組合,形成了完整的解決方案。在動態測試精簡(dynamic test compaction)過程中,不需要象傳統工具那樣擔心編碼失敗就停下來。這不僅節省了CPU時間,也大幅優化了測試集合,降低后續測試的測試成本。
Q:這就是為什么壓縮比可以達到2萬倍?
向東:西門子Mentor的工具,壓縮比通常只有一兩百倍到三百倍,跳變延遲測試大約100倍就算不錯了。這是因為他們受物理設計的限制:內部掃描鏈數量有限一般不超過1000條,外部掃描鏈也有限5-10條 ,再加上Pattern Expansion的問題,壓縮比難以提升。而我們克服了這些限制:解壓器編碼能力超強,掃描數結構靈活,Pattern Expansion問題徹底解決,所以整體測試壓縮比才能大幅領先國際競品,甚至達到近2萬倍。
03
LBIST覆蓋率提升30%-60%的創新設計方案
Q:您團隊的方案能讓故障覆蓋率提升30%到60%,這背后應該是有一個核心的質變,這個質變具體體現在哪里?
向東:核心原因主要在于我們多年的技術積累和架構設計。早在2002、2003年,我就開始在這方面做研究,當時我們在做基于BIST的工作,也就是早期的掃描自測試技術。雖然當時的提升只有兩三個百分點,但那已經算很高了。
現在的芯片規模遠遠超出當時,觸發器可以達到百萬級,門數達到千萬級甚至更多。在這樣的規模下,要達到令人滿意的故障覆蓋率,非常困難。傳統工具通常只能達到50%-80%的覆蓋率,而在車載電子或高可靠應用里,這顯然是不夠的。
我們做了幾方面的技術改進:首先是基于我們自主研發的軟件定義線性解壓器,再加上基于加權掃描選通信號的偽隨機測試產生器和多線程并發掃描自測試技術。
Q:多線程并發掃描自測試,能解釋一下它的作用嗎?
向東:簡單來說,傳統的故障模擬要做幾萬甚至上百萬條測試模式,一塊小規模電路可能要跑數天,這在工程上根本不可行。我們的多線程LBIST技術允許幾十個線程同時并發執行不同的偽隨機測試碼產生器的代碼產生,大幅壓縮了測試時間。
Q:也就是說在保證覆蓋率的同時,大幅提升了效率?
向東:正是如此。這也直接導致我們的技術能夠在單工型測試中提升30%以上的覆蓋率,而在跳變延遲測試中,覆蓋率提升可達60%以上。尤其是跳變延遲測試,以前很多國際工具甚至沒有針對的解決方案,我們通過自主研發的多線程并發測試和自定義解壓器,實現了大幅突破。
Q:覆蓋率的質變不僅是算法上的改進,更是架構設計和工程實現上的創新?
向東:只要將這些技術結合起來,再輔以確定性自測試,就可以把故障覆蓋率推向接近100%,滿足工業和車載電子的高可靠性要求。同時支持計算集群和智算集群現場測試需求。
04
跨越‘最后一公里:學術研發如何實現工業化落地
Q:從實驗室到產業端,您覺得學術成果和工程軟件之間,需要哪些條件才能落地?
向東:我們在實驗室里做的工具,本質上是科研性質的原型,而工業落地需要面對很多實際問題。
Q:您覺得最難跨越的鴻溝是什么?
向東:有幾個方面。首先是我們實驗室遇不到企業里實際存在的一些設計特性。例如,有些企業會在芯片設計里故意做一些“組合環”或者部分單元不掃描,這些在我們學校里幾乎從未接觸過。而現有ATPG/DFT工具在這種設計下無法直接處理。
還有企業為了控制關鍵路徑延遲,有些單元不做掃描,造成邏輯上是連續的,但傳統工具設計時假設全掃描,這就成了巨大的挑戰。現有國際工具,像西門子Mentor及Synopsys的TestMax也處理不了這種情況。
Q:那您的團隊是怎么解決的?
向東:我們通過不斷和企業的DFT工程師溝通,了解他們真實的痛點和需求,把這些情況植入到我們的工具開發中。我們設計了可以處理部分掃描單元、組合邏輯和復雜設計約束的算法和架構。通過多輪測試和反饋,工具逐步適應真實的工業芯片測試環境。
Q:這就是說,落地不僅是技術上的問題,更是需要工程實踐和企業場景的深度結合?
向東:如果學術成果只是停留在實驗室,不和工業界對接,就會永遠停留在“自娛自樂”的狀態。我們必須踏出實驗室,把理論、算法和工具不斷打磨,才能實現真正落地。
Q:這也是為什么很多項目從學校到產業端都有很長的路要走?
向東:這個“最后一公里”確實非常關鍵。我們不斷和企業專家交流,把他們的需求和反饋嵌入工具研發中,才能逐步實現工業應用。
Q:在市場上,您覺得企業客戶最關注什么?您推出的工具現在能達到他們的預期嗎?
向東:我們一直在努力對接企業的DFT工程師,讓他們試用工具。總體來說,大部分企業對我們的技術反饋非常樂觀。如果有我們還未覆蓋的場景,我們會繼續迭代。通過不斷交流和打磨,工具最終能夠滿足企業的實際需求。
Q:這是一種“學術—企業—迭代”的閉環模式,通過反復對接和改進,科研成果才能真正落地?
向東:工具落地不僅靠算法和理論,更依賴與企業的持續互動和反饋。只要持續迭代、貼近實際需求,最終一定能夠實現工業化應用。
05
企業有周期,技術有周期:量力而行、持續創新
Q:您認為資本與企業成長之間的矛盾是普遍現象嗎?您怎么看待這個問題?
向東:資本通常希望一開始就能有訂單、有銷售,甚至在投之前就已經開始盈利。但在實際情況中,這種理想狀態很難完全實現。
企業成長確實需要資本扶持。早期你沒有銷售收入,就需要資金去招研發人員、做市場推廣,這時投資是必需的。但如果企業已經開始銷售,有收入可以支撐發展,資本就不再是剛需了,這是一個階段性矛盾。
Q:也就是說,不同階段對資本的依賴是不一樣的?
向東:關鍵是投資方需要有耐心。要理解項目是市場剛需,技術有價值,如果耐心支持,它最終會產生回報。過度焦慮、追求快速回報,反而可能不利于長期成長。長期來看,企業必須專注研發和創新,同時理解產業需求,這樣才能穩健生存。
Q:那您和團隊做的工具技術在半導體測試環節里,具體有哪些優勢或者獨特之處?
向東:從產業從產業角度看,我們關注的是DFT及EDA工具的可控性和可擴展性。市場對測試工具是剛需,任何時候都需要這個。即便外部環境變化,我們也必須保持技術優勢,確保生存和競爭力。
Q:在技術和產業都具有長期周期的背景下,您想對高校的創業者說些什么?
向東:關鍵是做好自己的研究工作,認準市場剛需領域,并確保成果有競爭力。產業化不是每個研究成果的必經之路,因為這條路非常艱辛,需要大量精力和時間。享受自己的研究,不斷提出新想法,同時評估哪些成果有潛力推廣,找到平衡點。對自己的能力、市場和產業需求要有清晰認知。
—— 芯榜 ——
芯榜成立于 2015 年,是半導體垂直領域的產業媒體與數字化服務平臺。全網覆蓋超 100 萬垂直行業用戶,核心提供專業榜單發布、原創訪談、產業報告、峰會活動及研究咨詢等服務。已合作近千家半導體生態企業,聯動多家基金公司與產業媒體,助力硬科技產業發展。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.