核能正在崛起,以滿足美國(guó)對(duì)能源的需求。但建造新的反應(yīng)堆,甚至更新現(xiàn)有反應(yīng)堆的許可證,都需要大量的文書工作。幸好人工智能也在崛起,文書工作是它最擅長(zhǎng)的事情之一。
![]()
一個(gè)創(chuàng)新的新人工智能項(xiàng)目中,科技初創(chuàng)公司Atomic Canyon(原子峽谷)及其合作伙伴Diablo Canyon(加利福尼亞州唯一一家運(yùn)營(yíng)的核電站)使用能源部橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室(ORNL)的Frontier超級(jí)計(jì)算機(jī),根據(jù)核工業(yè)的獨(dú)特需求開(kāi)發(fā)了新的人工智能模型。
人工智能模型旨在減少核工業(yè)在搜索與零件、維護(hù)記錄、工程評(píng)估、法規(guī)和工廠程序相關(guān)的數(shù)百萬(wàn)份復(fù)雜核文件上花費(fèi)的時(shí)間、勞動(dòng)力和資源。人工智能模型是開(kāi)源的,核工業(yè)中的任何人都可以使用。一旦完全開(kāi)發(fā),人工智能模型可以在美國(guó)各地的工廠中使用。
Atomic Canyon的創(chuàng)始人兼首席執(zhí)行官Trey Lauderdale表示:“我們需要能源,核能是實(shí)現(xiàn)我們今天擁有的能源和為未來(lái)建設(shè)能源的絕對(duì)關(guān)鍵組成部分。”
核工業(yè)由核管理委員會(huì)(NRC)監(jiān)督,以確保核設(shè)施安全高效運(yùn)行。美國(guó)核管理委員會(huì)的主要職責(zé)包括監(jiān)督許可和建設(shè)、評(píng)估反應(yīng)堆設(shè)計(jì)、監(jiān)測(cè)環(huán)境影響以及審查關(guān)閉反應(yīng)堆的退役計(jì)劃。
Diablo Canyon由太平洋天然氣和電力公司(PG&E)擁有和運(yùn)營(yíng),為加利福尼亞州400多萬(wàn)人供電。它提供了該州總能源的8%左右。
經(jīng)過(guò)幾十年的運(yùn)營(yíng),Diablo峽谷原定于2025年退役,但在2022年,由于認(rèn)識(shí)到加利福尼亞州對(duì)能源的需求不斷增長(zhǎng),州領(lǐng)導(dǎo)人改變了主意,決定將運(yùn)營(yíng)延長(zhǎng)到2030年。
Diablo Canyon副總裁Maureen Zawalick表示:“這意味著我們必須重新啟動(dòng)很多事情,包括向NRC提交一份約3000頁(yè)的大規(guī)模申請(qǐng)。”“所以,我們以一種非常壓縮的方式做事——瀏覽成千上萬(wàn)的文件、記錄和信息,以滿足所有要求。”
Diablo Canyon負(fù)責(zé)人工智能項(xiàng)目的總監(jiān)Jordan Tyman解釋說(shuō),提交許可證變更是一個(gè)極其復(fù)雜的過(guò)程,在編寫過(guò)程開(kāi)始之前,可能需要幾天或幾周的時(shí)間來(lái)篩選文檔和行業(yè)指南。
Tyman說(shuō):“搜索我們?yōu)镈iablo峽谷授權(quán)50年來(lái)積累的大量記錄非常耗時(shí)。”“有一種方法可以整合從以前提交的文件中吸取的所有經(jīng)驗(yàn)教訓(xùn),并快速找到所有相關(guān)文件來(lái)支持工程師易于理解的許可證修訂,這將為我們的員工消除一個(gè)很大的負(fù)擔(dān)。”
Zawalick說(shuō),估計(jì)員工每年可能要花大約15000個(gè)小時(shí)來(lái)搜索文件。Diablo峽谷的數(shù)據(jù)庫(kù)包含約20億頁(yè)的文檔,需要大量的機(jī)構(gòu)知識(shí)來(lái)導(dǎo)航。她指出了最近的一個(gè)例子,在這個(gè)例子中,一個(gè)閥門的問(wèn)題引發(fā)了為期6個(gè)月的調(diào)查,導(dǎo)致員工無(wú)法履行正常職責(zé)。Diablo峽谷核創(chuàng)新主管Erin Bowe說(shuō):“這是181個(gè)工作日。”
![]()
Bowe說(shuō):“我們需要的是一個(gè)自然語(yǔ)言搜索工具,比如讓谷歌查找一個(gè)特定的組件,但不必知道一個(gè)特殊的數(shù)字或特殊的指標(biāo)。”“我們想要一個(gè)可以用來(lái)說(shuō)‘找到X閥’的工具,它將為我們提供該部件的整個(gè)歷史以及我們?cè)噲D解決的問(wèn)題的所有相關(guān)信息。”
人工智能有可能緩解許多這些必要但勞動(dòng)密集型的要求,同時(shí)確保更準(zhǔn)確的結(jié)果。
Lauderdale說(shuō):“然而,你不能只使用任何消費(fèi)者人工智能模型,因?yàn)樵诤斯I(yè)中,精度和可靠性至關(guān)重要。你必須找到正確的文件和記錄。你必須準(zhǔn)確地做事情,而且必須反復(fù)做。”
該團(tuán)隊(duì)嘗試使用現(xiàn)成的人工智能工具,但每次他們測(cè)試商業(yè)人工智能模型來(lái)搜索特定的核文件并提供上下文時(shí),這些模型都不可避免地難以正確使用核術(shù)語(yǔ)。Lauderdale說(shuō),這是因?yàn)樗麄儾皇煜じ叨染唧w的核術(shù)語(yǔ)。在某些情況下,商業(yè)人工智能模型會(huì)出現(xiàn)幻覺(jué),即人工智能產(chǎn)生虛假或誤導(dǎo)性信息的情況。
為了解決這個(gè)問(wèn)題,Atomic Canyon團(tuán)隊(duì)決定從頭開(kāi)始構(gòu)建自己的AI模型。但是訓(xùn)練人工智能模型需要大量的計(jì)算能力和GPU的使用,而不僅僅是一個(gè)GPU,而是很多GPU。GPU使訓(xùn)練復(fù)雜的AI模型更快,因?yàn)樗鼈兩瞄L(zhǎng)計(jì)算具有數(shù)百萬(wàn)或數(shù)十億個(gè)不同參數(shù)的大量數(shù)據(jù)。
![]()
Lauderdale說(shuō):“為了確保準(zhǔn)確性并減少幻覺(jué),我們需要大量的數(shù)據(jù)以及多次運(yùn)行數(shù)據(jù)的能力來(lái)正確訓(xùn)練人工智能模型。”“為了開(kāi)始構(gòu)建可靠工作的人工智能,我們需要一臺(tái)超級(jí)計(jì)算機(jī)。”
“ORNL是核工程、人工智能和高性能計(jì)算領(lǐng)域的世界領(lǐng)先者,我們與美國(guó)核管理委員會(huì)在驗(yàn)證性分析和許可流程方面合作了50多年。我們還擁有并開(kāi)發(fā)了美國(guó)核管理委使用的建模和仿真工具,”O(jiān)RNL研究員Tom Evans說(shuō),他專門從事使用高性能計(jì)算(HPC)開(kāi)發(fā)核相關(guān)應(yīng)用的方法。
Evans說(shuō):“與原子峽谷的合作使我們能夠應(yīng)對(duì)國(guó)家創(chuàng)造新的人工智能工具的迫切需要,這將大大改善核許可程序。”
通過(guò)橡樹(shù)嶺領(lǐng)導(dǎo)力計(jì)算設(shè)施(OLCF)主任的自由裁量權(quán)分配計(jì)劃,Atomic Canyon在Frontier超級(jí)計(jì)算機(jī)上獲得了20000個(gè)GPU小時(shí)的獎(jiǎng)勵(lì),這是世界上第一臺(tái)百億億次級(jí)計(jì)算機(jī),擁有37000多個(gè)AMD Instinct MI250X GPU。
該團(tuán)隊(duì)使用Frontier幫助開(kāi)發(fā)了Atomic Canyon的Neutron平臺(tái),這是一種先進(jìn)的人工智能解決方案,可以準(zhǔn)確地搜索和理解各種復(fù)雜的核數(shù)據(jù),從掃描文件和手寫筆記到技術(shù)報(bào)告和操作歷史。
![]()
Atomic Canyon還部署了Neutron Enterprise(企業(yè)版),這是Neutron的一個(gè)版本,運(yùn)行在公司防火墻后面,提供最高級(jí)別的網(wǎng)絡(luò)安全和出口管制協(xié)議,以確保業(yè)務(wù)敏感數(shù)據(jù)的安全。
Neutron平臺(tái)基于句子嵌入模型,這是一種為單詞分配數(shù)值的特定類型的AI。這種方法使模型不僅能夠理解核專用術(shù)語(yǔ)和縮寫的含義,而且能夠理解它們?cè)诩夹g(shù)程序和監(jiān)管指南中的上下文。
句子嵌入模型——綽號(hào)FERMI模型——是用NRC的全機(jī)構(gòu)文檔訪問(wèn)和管理系統(tǒng)(ADAMS)訓(xùn)練的,該系統(tǒng)包含300多萬(wàn)份文檔。ADAMS是美國(guó)核管理委員會(huì)的官方記錄數(shù)據(jù)庫(kù),包括大約5300萬(wàn)頁(yè)的數(shù)字信息,詳細(xì)介紹了自1980年以來(lái)美國(guó)每個(gè)核反應(yīng)堆的歷史。Neutron的AI智能搜索功能將幫助用戶在ADAMS數(shù)據(jù)庫(kù)和他們自己的本地文檔和記錄數(shù)據(jù)庫(kù)中快速查找信息。
Frontier的數(shù)字處理能力對(duì)于反復(fù)運(yùn)行數(shù)據(jù)是必要的,這樣FERMI模型就可以根據(jù)用戶的查詢識(shí)別并快速檢索相關(guān)信息。
Atomic Canyon工程負(fù)責(zé)人Richard Klafter表示:“句子嵌入模型主要用于搜索和檢索。它們用于檢索內(nèi)容,而不是生成內(nèi)容,而生成內(nèi)容正是LLM所做的。”“向LLM提供內(nèi)容需要檢索正確的內(nèi)容。錯(cuò)誤的內(nèi)容會(huì)導(dǎo)致LLM產(chǎn)生幻覺(jué)。因此,我們的第一步是建立一個(gè)好的檢索模型,這就是我們?cè)贔rontier上訓(xùn)練的句子嵌入模型。”
除了使他們能夠從頭開(kāi)始訓(xùn)練核詞匯模型外,F(xiàn)rontier的計(jì)算能力還使他們能夠訓(xùn)練更長(zhǎng)的上下文模型。
Klafter說(shuō):“我們希望將輸入加倍,這樣人工智能就可以一次處理更大的信息塊,但這需要數(shù)倍的計(jì)算能力。”“通過(guò)讓人工智能更好地理解較長(zhǎng)的文檔,我們可以將需要索引的數(shù)據(jù)量減少大約一半,這使得系統(tǒng)的運(yùn)行速度提高了一倍。”
即使在項(xiàng)目的早期階段,PG&E和Diablo峽谷的工作人員已經(jīng)看到了令人印象深刻的成果。事實(shí)證明,Atomic Canyon的工具不僅能夠快速搜索核電站自身的故障排除和解決記錄,而且能夠通過(guò)NRC ADAMS數(shù)據(jù)庫(kù)快速搜索美國(guó)核工業(yè)的整個(gè)歷史,這將改變游戲規(guī)則。
Tyman說(shuō):“現(xiàn)在我們有了這個(gè)基礎(chǔ)搜索工具,它是在NRC ADAMS數(shù)據(jù)之后,基于Diablo Canyon文檔構(gòu)建的。”“接下來(lái)是我們?nèi)绾螌⑵湔喜?yīng)用于其他流程,如開(kāi)發(fā)程序、培訓(xùn)、進(jìn)行評(píng)估——這些真正有助于我們的工程師專注于解決技術(shù)問(wèn)題,擺脫行政任務(wù)。”
“我們已經(jīng)看到,使用Frontier開(kāi)發(fā)的新人工智能工具,某些領(lǐng)域的生產(chǎn)力有所提高,”Zawalick說(shuō)。“就我們與Atomic Canyon和ORNL合作的時(shí)間而言,投資回報(bào)率非常高。”
![]()
Atomic Canyon計(jì)劃更新和構(gòu)建更多版本的FERMI模型。在ORNL,Evans和他的同事、高級(jí)研發(fā)研究員Matthew Jessee目前正在探索新的計(jì)算方法,通過(guò)將FERMI模型與生成LLM相結(jié)合,進(jìn)一步推動(dòng)該技術(shù)的發(fā)展。
與Ai時(shí)代前沿合作,將大門向更多普通用戶敞開(kāi)!免費(fèi)課程限時(shí)領(lǐng),還有好禮相送!無(wú)論你是對(duì)新技術(shù)充滿好奇心的愛(ài)好者,還是希望提升自己技能的職場(chǎng)人士,這里都有適合你的課程和資源。文章留言或私信小編拉您入群!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.