2025年11月27日,由紫金山實(shí)驗(yàn)室主辦,浙江大學(xué)區(qū)塊鏈與數(shù)據(jù)安全全國重點(diǎn)實(shí)驗(yàn)室、南京信息工程大學(xué)計(jì)算機(jī)學(xué)院及網(wǎng)絡(luò)空間安全學(xué)院承辦的第五屆網(wǎng)絡(luò)空間內(nèi)生安全學(xué)術(shù)大會(huì)-人工智能安全論壇順利舉行。來自高校、科研機(jī)構(gòu)與產(chǎn)業(yè)界的專家學(xué)者齊聚一堂,圍繞人工智能安全的前沿挑戰(zhàn)與關(guān)鍵技術(shù)展開深入交流,旨在凝聚共識(shí)、推動(dòng)合作,為人工智能技術(shù)的安全可信和可持續(xù)發(fā)展提供堅(jiān)實(shí)支撐。
![]()
本次論壇邀請(qǐng)東南大學(xué)凌振教授、復(fù)旦大學(xué)陳智能教授、上海交通大學(xué)王爍教授、上海人工智能實(shí)驗(yàn)室青年科學(xué)家陸超超研究員、浙江大學(xué)鄭天航研究員、安恒信息首席技術(shù)官劉博博士作主題報(bào)告,分享各自在人工智能安全領(lǐng)域的最新研究成果與實(shí)踐經(jīng)驗(yàn)。論壇由浙江大學(xué)王志波教授和南京信息工程大學(xué)付章杰教授主持。
東南大學(xué)凌振教授以“大模型驅(qū)動(dòng)的物聯(lián)網(wǎng)未知威脅識(shí)別”為題,指出隨著無云架構(gòu)物聯(lián)網(wǎng)設(shè)備廣泛部署,設(shè)備擺脫云服務(wù)直接暴露于互聯(lián)網(wǎng)所帶來的安全風(fēng)險(xiǎn)日益突出。他介紹了團(tuán)隊(duì)研發(fā)的TORCHLIGHT系統(tǒng),基于大語言模型的思維鏈推理識(shí)別物聯(lián)網(wǎng)流量,并實(shí)現(xiàn)無云IoT設(shè)備的未知攻擊檢測,該系統(tǒng)在實(shí)際運(yùn)行中展現(xiàn)出強(qiáng)大的漏洞發(fā)現(xiàn)能力。
![]()
復(fù)旦大學(xué)陳智能教授聚焦“高效場景文字識(shí)別技術(shù)及應(yīng)用”,系統(tǒng)梳理了當(dāng)前文字識(shí)別的主要技術(shù)路徑,并分享了其團(tuán)隊(duì)在提升識(shí)別效率與精度方面的研究成果,展現(xiàn)了相關(guān)技術(shù)在互聯(lián)網(wǎng)內(nèi)容監(jiān)管和復(fù)雜文檔解析等高負(fù)載應(yīng)用場景中的落地價(jià)值。
![]()
上海交通大學(xué)王爍教授圍繞“解釋多維度的大模型安全評(píng)測”展開論述。他指出,傳統(tǒng)靜態(tài)、單維的安全評(píng)估方法已難以應(yīng)對(duì)大模型在開放環(huán)境中的復(fù)雜風(fēng)險(xiǎn)。為此,其團(tuán)隊(duì)構(gòu)建了一個(gè)覆蓋安全性、魯棒性、可信性與可解釋性的多維度評(píng)測體系,并融合自動(dòng)化紅隊(duì)測試、多模型協(xié)同攻防、LLM-as-a-Judge機(jī)制等先進(jìn)技術(shù),打造可復(fù)現(xiàn)、可擴(kuò)展的開放評(píng)測平臺(tái),為模型提供閉環(huán)治理能力。
![]()
上海人工智能實(shí)驗(yàn)室青年科學(xué)家陸超超在題為“邁向安全可信通用人工智能-挑戰(zhàn)、探索與未來”的報(bào)告中,系統(tǒng)剖析了當(dāng)前大模型在解釋性、涌現(xiàn)機(jī)理、幻覺生成、自我反思機(jī)制等方面存在的安全短板。他提出應(yīng)在“能力—安全”協(xié)同演進(jìn)的框架下,推動(dòng)人工智能實(shí)現(xiàn)可持續(xù)、可驗(yàn)證、可依賴的安全發(fā)展,并對(duì)未來技術(shù)路徑進(jìn)行了前瞻性展望。
![]()
浙江大學(xué)鄭天航研究員以“大模型黑盒越獄優(yōu)化”為題,表示當(dāng)前越獄攻擊呈現(xiàn)策略動(dòng)態(tài)化、目標(biāo)多元化、效率極致化的新特征,他系統(tǒng)剖析了團(tuán)隊(duì)在黑盒越獄優(yōu)化方向的最新進(jìn)展,包括MAJIC高效黑盒越獄框架和DualBreach雙重越獄優(yōu)化方案,為深入理解大模型安全邊界、推動(dòng)更可靠防護(hù)機(jī)制的構(gòu)建提供了重要技術(shù)參考。
![]()
安恒信息首席技術(shù)官劉博以“讓智能更安全:大模型安全的思考與實(shí)踐”為題,從產(chǎn)業(yè)視角出發(fā),闡述了當(dāng)前大模型在數(shù)據(jù)、內(nèi)容、算法和運(yùn)行層面面臨的安全挑戰(zhàn)。他介紹了安恒信息構(gòu)建的“內(nèi)容安全+運(yùn)行安全+數(shù)據(jù)安全+算法安全”四位一體安全治理體系,為政企客戶構(gòu)建全場景安全防護(hù),助力大模型在安全合規(guī)軌道上穩(wěn)健發(fā)展。
![]()
在論文交流環(huán)節(jié),主辦方從前期征集的百余篇學(xué)生投稿中嚴(yán)格遴選9篇優(yōu)秀成果進(jìn)行現(xiàn)場匯報(bào)。報(bào)告內(nèi)容涵蓋大模型安全、對(duì)抗攻擊、隱私保護(hù)、可信推理等多個(gè)前沿方向,與會(huì)師生積極提問、深入探討,展現(xiàn)了新生代科研力量的蓬勃活力與對(duì)關(guān)鍵安全問題的敏銳洞察。該環(huán)節(jié)由浙江大學(xué)倪王澤與鄭天航研究員共同主持。
本次論壇搭建了一個(gè)跨學(xué)科、跨行業(yè)的深度對(duì)話平臺(tái),通過理論與實(shí)踐的交融、學(xué)術(shù)與產(chǎn)業(yè)的聯(lián)動(dòng),有力促進(jìn)了人工智能安全理念的共識(shí)凝聚與技術(shù)生態(tài)的協(xié)同發(fā)展。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.