
隨著DeepSeek-R1大模型的推出,國產(chǎn)大模型推理能力、自然語言理解能力躍上了新臺階,較低的算力要求和成本使本地部署高性能大模型實現(xiàn)個性化應(yīng)用需求成為可能,也為審計數(shù)據(jù)治理現(xiàn)代化提供了動力。審計數(shù)據(jù)管理是審計數(shù)據(jù)治理中最基礎(chǔ)的部分。以人工智能助力審計數(shù)據(jù)管理,進而推動審計數(shù)據(jù)治理科學(xué)規(guī)范,可以進一步發(fā)揮數(shù)據(jù)要素價值、提升審計質(zhì)量。
審計數(shù)據(jù)管理中應(yīng)用人工智能面臨的三大難點
審計數(shù)據(jù)管理是審計機關(guān)對審計數(shù)據(jù)進行采集、歸集、清洗、入庫、使用的全流程管理、控制和運用的活動。大量高質(zhì)量的審計數(shù)據(jù),安全的審計數(shù)據(jù)存儲方式,標(biāo)準(zhǔn)化的審計數(shù)據(jù)采集、歸集、清洗、入庫方式,以及審計機關(guān)豐富的審計方法、審計模型、審計案例、計算機語句等是高質(zhì)量審計數(shù)據(jù)管理及應(yīng)用的 基礎(chǔ)。當(dāng)前,人工智能各類算法模型層出不窮,同時算力成本極大下降,審計數(shù)據(jù)管理中應(yīng)用人工智能將深刻影響未來審計方式、審計方法,引起審計效能的重大改變。但審計數(shù)據(jù) 管理中應(yīng)用人工智能還存在以下三大難點。
一是數(shù)據(jù)基礎(chǔ)薄弱影響應(yīng)用質(zhì)效。審計數(shù)據(jù)質(zhì)量、數(shù)據(jù)共享、數(shù)據(jù)更新等方面基礎(chǔ)薄弱,會導(dǎo)致人工智能發(fā)揮作用所需的數(shù)據(jù)底座不牢。數(shù)據(jù)質(zhì)量上,高質(zhì)量數(shù)據(jù)欠缺使人工智能對行業(yè)規(guī)范與優(yōu)質(zhì)審計經(jīng)驗的學(xué)習(xí)不足,導(dǎo)致輸出結(jié)果的模糊化、幻覺化,難以適配審計場景的復(fù)雜性、精確性。缺乏高質(zhì)量數(shù)據(jù)的輸出結(jié)果,進一步增加了審計人員復(fù)核壓力,降低了審計效率。數(shù)據(jù)共享上,審計部門之間數(shù)據(jù)報送、共享通道還有待建設(shè),不同部門之間的數(shù)據(jù)平臺存在物理阻隔、報送規(guī)則不一致,數(shù)據(jù)開放性不夠,導(dǎo)致數(shù)據(jù)流通與使用存在阻礙。不同地區(qū)的審計機關(guān)之間尚未建立完善的數(shù)據(jù)共享平臺,缺乏對審計部門間數(shù)據(jù)流轉(zhuǎn)的上級統(tǒng)籌,導(dǎo)致利用優(yōu)質(zhì)審計經(jīng)驗的渠道不暢,難以讓人工智能充分學(xué)習(xí)不同領(lǐng)域、不同特征的審計案例,打造更加全面的審計知識庫。
二是數(shù)據(jù)調(diào)用量大存在安全風(fēng)險。為提高大模型的數(shù)據(jù)治理能力,形成專業(yè)化審計知識圖譜,需開放接入多領(lǐng)域、多部門、可持續(xù)的數(shù)據(jù)接口。在數(shù)據(jù)采集與存儲過程中,對于線上傳輸各類公共或涉密數(shù)據(jù)若無精確的分類及對應(yīng)的安全舉措,將增大泄密風(fēng)險。隨著數(shù)據(jù)量增加以及數(shù)據(jù)接口對應(yīng)部門的增多,對審計數(shù)據(jù)在不同安全層級平臺之間流轉(zhuǎn)的動態(tài)保護提出了較高要求。在數(shù)據(jù)訪問過程中,面對海量可調(diào)用數(shù)據(jù),尤其涉及跨領(lǐng)域的問題時,可能會因大模型對于模糊語義的誤判導(dǎo)致越權(quán)操作行為,不同權(quán)限下人工智能調(diào)用數(shù)據(jù)及其輸出結(jié)果分類管控的不嚴(yán)密,可能導(dǎo)致以模糊需求超越審計權(quán)限輸出數(shù)據(jù)、違規(guī)調(diào)用敏感數(shù)據(jù)、隱私數(shù)據(jù)等情況,同時隨著人工智能對于海量數(shù)據(jù)的學(xué)習(xí),所泄密的數(shù)據(jù)內(nèi)容也將呈現(xiàn)程度多樣、數(shù)據(jù)量大等特點,造成數(shù)據(jù)安全風(fēng)險。
三是專業(yè)人才缺乏影響落地效能。當(dāng)前人工智能處于弱智能向強智能的初期發(fā)展階段,無法做到自主進行大目標(biāo)拆解,形成工作范式,對于模糊的提示詞難以給出精確的答案。為使初期階段的大模型形成審計思維,需要人工進行訓(xùn)練,并根據(jù)審計經(jīng)驗對輸出結(jié)果進行微調(diào)。同時,為減弱大模型的“黑箱”問題,需要既有審計經(jīng)驗又有人工智能技術(shù)知識的專家參與大模型的數(shù)據(jù)治理,對大模型的訓(xùn)練流程、推理輸出結(jié)果進行復(fù)核,把審計經(jīng)驗轉(zhuǎn)化為大模型推理過程中的思維鏈,將審計職業(yè)判斷轉(zhuǎn)化為大模型訓(xùn)練中的損失函數(shù),為大模型的使用提供標(biāo)準(zhǔn)化樣板,提高大模型在審計領(lǐng)域的利用廣度和深度。目前,各級審計機關(guān)中具有人工智能專業(yè)知識的人才較為缺乏,審計人員對通用人工智能的基礎(chǔ)理論與框架,以及所需的集成計算機視覺、自然語言理解、認知推理、機器學(xué)習(xí)、多智能體等核心領(lǐng)域模型與算法知識的了解十分有限,影響人工智能在審計數(shù)據(jù)管理中的效能。
審計數(shù)據(jù)管理中應(yīng)用人工智能需聚力三個突破
圍繞元數(shù)據(jù)管理、數(shù)據(jù)質(zhì)量優(yōu)化、數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)三大方面聚力突破,從而為人工智能在審計數(shù)據(jù)管理中的應(yīng)用打下基礎(chǔ)。
(一)應(yīng)用大模型提高元數(shù)據(jù)采集管理水平
1. 提升智能采集元數(shù)據(jù)水平。利用大模型對非結(jié)構(gòu)化數(shù)據(jù)的處理能力,自動采集各類文件中的圖表結(jié)構(gòu)、字段屬性等特征數(shù)據(jù),將人工經(jīng)驗與人工智能采集進行協(xié)同,建立健全自動標(biāo)注規(guī)則,提高元數(shù)據(jù)的采集效率, 擴充審計的元數(shù)據(jù)庫。
2 . 加強元數(shù)據(jù)關(guān)聯(lián)分析。結(jié)合審計業(yè)務(wù)需求及大模型的語義理解能力,通過聚類算法將元數(shù)據(jù)進行分類,形成知識圖譜的基礎(chǔ)。同時,構(gòu)建標(biāo)準(zhǔn)化的元數(shù)據(jù)模型,明確字段定義、數(shù)據(jù)類型及關(guān)系類型,確保不同來源數(shù)據(jù)可相互操作。人工智能可通過元數(shù)據(jù)建立數(shù)據(jù)對象之間的關(guān)聯(lián)圖譜,并加強智能檢索的效率,降低多源異構(gòu)數(shù)據(jù)庫等環(huán)境下數(shù)據(jù)關(guān)聯(lián)的復(fù)雜性。
3. 以高質(zhì)量元數(shù)據(jù)訓(xùn)練大模型。利用高質(zhì)量標(biāo)注的元數(shù)據(jù)提高大模型訓(xùn)練數(shù)據(jù)的完整性,使大模型在學(xué)習(xí)階段自我進行案例生成與擴展,在一定程度上減少大模型訓(xùn)練所 需的樣本量。同時,專業(yè)領(lǐng)域元數(shù)據(jù)所形成的知識圖譜,可結(jié)合大模型的泛化推理能力,推動大模型的跨領(lǐng)域遷移。
(二)應(yīng)用自然語言處理等技術(shù)提升審計數(shù)據(jù)質(zhì)量
1. 建立質(zhì)量規(guī)則核驗數(shù)據(jù)真實性。利用自然語言處理技術(shù)從現(xiàn)行政策中提煉符合不同業(yè)務(wù)場景的數(shù)據(jù)質(zhì)量評估規(guī)則,結(jié)合審計人員基于專業(yè)領(lǐng)域的職業(yè)判斷,建立數(shù)據(jù)質(zhì)量規(guī)則庫,對大模型的數(shù)據(jù)質(zhì)量評估能力進行訓(xùn)練,形成定制化的數(shù)據(jù)質(zhì)量評估體系。
2. 強化復(fù)核能力提升數(shù)據(jù)質(zhì)量。通過機器學(xué)習(xí)算法,自動識別數(shù)據(jù)格式錯誤、邏輯矛盾及報送缺失等問題,提高數(shù)據(jù)審核效率。同時,在復(fù)核基礎(chǔ)上加強對已有數(shù)據(jù)的特征分析,結(jié)合數(shù)字分析工具推算出缺失值,實現(xiàn)智能填充,提升數(shù)據(jù)質(zhì)量。
3. 結(jié)合職業(yè)判斷提出數(shù)據(jù)質(zhì)量改進措施。審計人員通過對大模型產(chǎn)生的數(shù)據(jù)分析結(jié)果進行復(fù)核,對分析流程進行監(jiān)控,保證數(shù)據(jù)輸出的質(zhì)量。同時,及時反饋分析流程中出現(xiàn)的問題,對后續(xù)數(shù)據(jù)質(zhì)量提升提出改進意見和建議。
(三)構(gòu)建智能管理框架加快審計數(shù)據(jù)標(biāo)準(zhǔn)化建設(shè)
1. 對已有數(shù)據(jù)進行標(biāo)準(zhǔn)化。可構(gòu)建智能治理框架,建立“基礎(chǔ)層(通用大模型)+行業(yè)層(審計知識圖譜)+應(yīng)用層(場景化工具)”的三層技術(shù)架構(gòu),部署數(shù)據(jù)目錄和譜系管理系統(tǒng)對已有數(shù)據(jù)進行標(biāo)準(zhǔn)化。對于審計領(lǐng)域 已有的高質(zhì)量數(shù)據(jù),如標(biāo)志性典型性案例的審計工作底稿、可推廣的審計經(jīng)驗等,進行標(biāo)準(zhǔn)化處理后作為大模型的訓(xùn)練資料。
2. 對后續(xù)數(shù)據(jù)進行標(biāo)準(zhǔn)化。建立持續(xù)學(xué)習(xí)與自適應(yīng)機制,統(tǒng)籌公共平臺、內(nèi)部網(wǎng)絡(luò)的上傳數(shù)據(jù)標(biāo)準(zhǔn),針對內(nèi)外部報送數(shù)據(jù)的標(biāo)準(zhǔn)化搭建跨機構(gòu)數(shù)據(jù)兼容框架,在實現(xiàn)部門間互聯(lián)互通的基礎(chǔ)上,建立自動化、全面化的標(biāo)準(zhǔn)監(jiān)測與反饋機制,將自動化與人工復(fù)核相結(jié)合,確保后續(xù)輸入的審計數(shù)據(jù)能夠被大模型識別學(xué)習(xí)與運用。
3. 對數(shù)據(jù)調(diào)用進行標(biāo)準(zhǔn)化。鑒于審計對數(shù)據(jù)精確性的高要求,在審計人員層面,要對大模型運用的提示詞、參數(shù)調(diào)整等進行規(guī)范,確保提問流程及輸出結(jié)果標(biāo)準(zhǔn)化。在大模型運行層面,建立動態(tài)化的標(biāo)準(zhǔn)差異識別系統(tǒng),構(gòu)建支持多模態(tài)數(shù)據(jù)映射的標(biāo)準(zhǔn)適配器,基于最新相關(guān)法律法規(guī)、審計業(yè)務(wù)要求,針對性調(diào)整數(shù)據(jù)調(diào)用的標(biāo)準(zhǔn)。
審計數(shù)據(jù)管理中應(yīng)用人工智能的場景
在三大聚力突破的基礎(chǔ)上,充分釋放審計數(shù)據(jù)管理效能,進一步促使審計數(shù)據(jù)管理在審前階段、審計實施階段、審計成果階段三大應(yīng)用場景中發(fā)揮作用。
(一)在審前階段輔助數(shù)據(jù)準(zhǔn)備工作
1. 智能化數(shù)據(jù)處理。審計人員可通過人工智能的圖像識別、音頻識別技術(shù),解析被審計單位關(guān)鍵文件中涉及的關(guān)鍵條款,將非結(jié)構(gòu)化數(shù)據(jù)智能轉(zhuǎn)換,自動提取特征字段轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),結(jié)合其他結(jié)構(gòu)化數(shù)據(jù)信息形成 被審計單位知識管理庫。還可通過人工智能技術(shù),預(yù)設(shè)接口自動抓取被審計單位多系統(tǒng)數(shù)據(jù)(如政務(wù)系統(tǒng)、財務(wù)系統(tǒng)等),智能識別冗余字段并剔除無效數(shù)據(jù),直達核心數(shù)據(jù)。
2. 智能化風(fēng)險提示。通過人工智能技術(shù),審計人員可調(diào)用數(shù)據(jù)庫,可視化展現(xiàn)被審計單位的運行模式及決策流程等,生成被審計單位畫像,直觀展示被審計單位的主要業(yè)務(wù)進展情況及可能存在的關(guān)聯(lián)風(fēng)險點,提前作出研判,確定審計范圍。同時,人工智能可基于內(nèi)部數(shù)據(jù)的風(fēng)險提示,分析被審計單位業(yè)務(wù)數(shù)據(jù)的周期性規(guī)律,預(yù)測重點領(lǐng)域風(fēng)險,還可參考以往審計查出的問題,構(gòu)建相似項目審計中發(fā)現(xiàn)的違規(guī)案例圖譜,自動匹配當(dāng)前項目中的相似特征,對審計人員進行風(fēng)險提示。
(二)在審計實施階段輔助數(shù)據(jù)分析工作
1. 人工智能輔助取數(shù)。審計人員可通過相應(yīng)提示詞讓大模型生成可運用于數(shù)據(jù)庫取數(shù)的代碼文本,降低取數(shù)門檻,按照審計人員需求以相應(yīng)的圖表字段進行呈現(xiàn)。可基于權(quán)限調(diào)用,對取數(shù)流程實施精準(zhǔn)的權(quán)限控制,保證數(shù)據(jù)安全。采取不同權(quán)限審計人員對應(yīng)不同的數(shù)據(jù)脫敏策略,保存抓取數(shù)據(jù)過程日志,確保取數(shù)的可追溯性。
2 . 多模態(tài)數(shù)據(jù)分析。大模型可通過對特征數(shù)據(jù)的融合實現(xiàn)多模態(tài)數(shù)據(jù)的協(xié)同分析,并根據(jù)審計人員的提示詞,調(diào)用不同數(shù)據(jù)庫內(nèi)容輸出數(shù)據(jù)分析代碼,針對代碼展示數(shù)據(jù)分析的思維鏈,輔助審計人員進行大數(shù)據(jù)分析。審計人員可將新獲得的數(shù)據(jù)結(jié)合大模型中的已有數(shù)據(jù)進行交叉檢驗,分析數(shù)據(jù)間的關(guān)聯(lián)性與風(fēng)險點。
3. 證據(jù)鏈智能論證。根據(jù)發(fā)現(xiàn)的問題以及挖掘問題中調(diào)用的數(shù)據(jù),人工智能通過結(jié)合審計經(jīng)驗知識庫,自動鏈接合同、審批單、銀行流水等材料,形成完整的違規(guī)證據(jù)鏈與證據(jù)關(guān)聯(lián)圖譜。通過人工智能交叉核驗不同證據(jù)源,基于審計法規(guī)知識庫、審計問題知識庫及邏輯推理,比對證據(jù)之間的數(shù)據(jù)差異并提示問題,自動識別矛盾點。此外,還可進行證據(jù)效力評級。根據(jù)證據(jù)類型,結(jié)合法規(guī)知識庫要求,通過人工智能自動標(biāo)注證明力等級,輔助判斷問題定性依據(jù)是否充分。
4 . 輔助生成審計工作底稿。審計人員可授權(quán)人工智能在本地化部署的審計數(shù)據(jù)庫中調(diào)用審計實施過程中獲取的數(shù)據(jù)資料,基于發(fā)現(xiàn)的問題點、佐證材料及發(fā)現(xiàn)問題的流程日志,將問題描述與相關(guān)數(shù)據(jù)按照上下文的銜接順序,自動填入固定模板,形成邏輯性較強的審計工作底稿,并匹配相應(yīng)附件。還可通過人工智能調(diào)用審計法規(guī)知識庫,對輸入的審計問題自動匹配相關(guān)法規(guī)并具體到對應(yīng)條款,提高法規(guī)自動匹配性。
(三)在審計成果階段輔助數(shù)據(jù)整理工作
1. 挖掘高價值問題。通過人工智能自動提煉報告核心數(shù)據(jù),對發(fā)現(xiàn)的問題、涉及的金額等進行歸類并生成報告摘要。在此基礎(chǔ)上,結(jié)合審計人員的政治研判,引用政策知識庫的政策目標(biāo)、審計項目的知識圖譜、審計對象的資金流向,形成多維度、可視化的審計成果展示,以多維度數(shù)據(jù)分析助力問題挖掘。
2. 生成有益經(jīng)驗。基于審計過程中審計人員與人工智能的互動記錄、數(shù)據(jù)調(diào)用接口 的操作日志等資料,人工智能可實現(xiàn)對審計全流程的實時記錄,并通過自然語言生成邏輯性和可操作性強的審計流程總結(jié),助力生成優(yōu)質(zhì)經(jīng)驗,供審計人員參考、助力審計流 程優(yōu)化,也可作為新訓(xùn)練素材對大模型進行反哺,提高推理能力。
3. 個性化問題洞察。通過人工智能可加強個性行為分析。如在對領(lǐng)導(dǎo)干部開展經(jīng)濟責(zé)任審計中,通過對審計對象的歷史決策等數(shù)據(jù)進行分析,建立管理人員決策特征模型, 檢測審計對象的異常偏好,預(yù)測其在下一任期崗位的行為模式,提示相關(guān)風(fēng)險點。同時,通過調(diào)用被審計單位知識庫,對被審計單位的決策鏈條、資金鏈條、人員責(zé)任劃分等進行可視化展示,在有關(guān)邏輯鏈上進行問題歸因,為審計整改提供參考。
作者:蘭健 張斌 陳科宇
單位:浙江省審計廳 浙江省審計科研所
來源:審計觀察微信公眾號
編輯:孫哲
目前190000+人已關(guān)注我們,您還等什么?

特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.