數(shù)字化時代,農(nóng)業(yè)數(shù)智化成為關(guān)系國計民生的重要議題。記者今天(1月13日)從南京農(nóng)業(yè)大學(xué)了解到,在中國高等教育學(xué)會高等農(nóng)林教育分會2025年年會的分論壇“數(shù)智技術(shù)重塑農(nóng)林教育全維度變革”上,南京農(nóng)業(yè)大學(xué)正式發(fā)布司農(nóng)大語言模型(Sinong)。該模型是國內(nèi)首個面向通用農(nóng)業(yè)領(lǐng)域的開源垂直大語言模型,同時也是南京農(nóng)業(yè)大學(xué)主導(dǎo)研發(fā)的首個農(nóng)業(yè)領(lǐng)域大語言模型。
![]()
“司農(nóng)”的命名取自中國古代財政與農(nóng)業(yè)管理官職體系,卓越性能源于南京農(nóng)業(yè)大學(xué)深厚的農(nóng)業(yè)學(xué)科底蘊與大規(guī)模、高質(zhì)量的農(nóng)業(yè)領(lǐng)域數(shù)據(jù)基礎(chǔ)。研究團隊依托學(xué)校農(nóng)業(yè)領(lǐng)域頂尖學(xué)科優(yōu)勢,收集了包括動物科學(xué)、農(nóng)業(yè)經(jīng)濟管理、農(nóng)業(yè)資源與環(huán)境、園藝學(xué)、智慧農(nóng)業(yè)、動物醫(yī)學(xué)、植物保護、作物育種等細(xì)分學(xué)科數(shù)據(jù),總量超過40億token的農(nóng)業(yè)領(lǐng)域?qū)I(yè)數(shù)據(jù),涵蓋了近9000冊書籍、24萬余篇學(xué)術(shù)論文和近2萬份政策、標(biāo)準(zhǔn)以及海量網(wǎng)絡(luò)知識,構(gòu)建了體系相對完整、質(zhì)量過硬的農(nóng)業(yè)基礎(chǔ)數(shù)據(jù)集。
![]()
針對大語言模型在專業(yè)領(lǐng)域應(yīng)用中常見的“幻覺問題”和知識滯后性,研究團隊進(jìn)行了全方位的技術(shù)攻堅。在模型訓(xùn)練階段,除傳統(tǒng)指令微調(diào)外,引入了思維鏈和上下文參考等多維訓(xùn)練數(shù)據(jù),顯著提升了模型對于農(nóng)業(yè)專業(yè)知識的理解與生成能力。
此外,針對領(lǐng)域文獻(xiàn)知識利用效率問題,推出多智能體檢索增強框架。該框架通過優(yōu)化知識庫構(gòu)建、智能查詢改寫、混合檢索等策略,使模型能夠精準(zhǔn)調(diào)用專業(yè)知識,有效保障了生成內(nèi)容的準(zhǔn)確性與時效性,為模型在科研、教育、生產(chǎn)等場景的可靠應(yīng)用提供了保障。
![]()
目前,司農(nóng)大語言模型已在魔塔社區(qū)和GitHub社區(qū)全面開源,發(fā)布了8B和32B兩種參數(shù)規(guī)模的版本。這一開源開放策略,旨在降低農(nóng)業(yè)AI應(yīng)用門檻,助力廣大科研機構(gòu)、企業(yè)和開發(fā)者基于司農(nóng)大語言模型進(jìn)行二次開發(fā)與創(chuàng)新應(yīng)用,共同培育智慧農(nóng)業(yè)的應(yīng)用生態(tài)。
未來,南京農(nóng)業(yè)大學(xué)將持續(xù)迭代模型性能,深化應(yīng)用場景探索。(江蘇新聞廣播 記者/劉正則 通訊員/南農(nóng)宣)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.