![]()
介紹
《從零構建大模型》是一本基于PyTorch框架的實戰(zhàn)指南,摒棄了對現(xiàn)成庫的依賴,引導讀者從零開始親手構建功能強大的大語言模型。本書由暢銷書作家塞巴斯蒂安·拉施卡撰寫,從基礎知識講起,由內而外地剖析大模型核心原理,并通過清晰的文字、圖表和實例,系統(tǒng)講解模型各組成部分的規(guī)劃與實現(xiàn)、數(shù)據(jù)集的準備、通用語料預訓練及任務定制微調的全過程。
書中不僅詳細闡述了如何利用人工反饋確保模型遵循指令、加載預訓練權重等關鍵技術,還特別設置了DeepSeek彩蛋章節(jié),深入解析推理模型的構建與優(yōu)化策略。通過理論與實踐的結合,本書旨在幫助讀者在掌握LLM理論知識的同時,獲得從零打造大模型的完整實戰(zhàn)能力。
目錄
第1章:理解大型語言模型
第2章:處理文本數(shù)據(jù)
第3章:編碼注意力機制
第4章:從零開始實現(xiàn) GPT 模型
第5章:在無標注數(shù)據(jù)上進行預訓練
第6章:進行文本分類的微調
第7章:進行遵循指令的微調
掃碼回復“大模型神書”
如果你想寫大模型論文,但卻沒有合適的idea,我收集整理了來自QS前50名校大佬的大模型研究思路!這些idea都是從頂會論文中提煉出來的精華,沖刺CVPR/NIPS也不在話下!
![]()
領取福利
科研資料大放送:
1.《申博咨詢規(guī)劃一次》
2.《1000+熱門idea合集》
3.《往期大牛熱點分析直播課》
4.《全方向頂會頂刊論文合集》
![]()
![]()
![]()
掃碼免費領取科研大禮包
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.