<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Python大模型應用開發實戰:基于ChatGPT微調,附代碼(文末贈書)

      0
      分享至

      OpenA對GPT-3.5 開放微調 API,允許 AI開發人員通過專門的數據在專門的任務上實現更高的性能。OpenAI聲稱,最終的定制模型在某些特定任務上可以匹配或超過GPT-4的能力。也就是說,每個企業或個人將擁有自己的專屬OpenAI。

      OpenAI 的大語言模型 ChatGPT 已經在大量文本上進行了預訓練,而微調可以讓其更適合特定的應用場景。微調的步驟包括:準備和上傳數據;訓練新的微調模型;評估結果,并在需要時繼續迭代;微調結束后使用模型。

      在準備數據階段,OpenAI對數據集以及內容格式有一定的要求。首先要求數據集為JSONL 格式,數據格式如下:


      如果是對話式聊天格式,且預訓練模型為 gpt-3.5-turbo、babbage-002 和 davinci-002也可以按照下面的數據格式進行微調。


      準備好數據集之后,需要將數據集切分成訓練數據集和測試數據集。而每條訓練數據的大小也受到基礎模型的限制。對于 gpt-3.5-turbo-0125,每個訓練樣本限制為 16385 個Token;對于 gpt-3.5-turbo-0613,每個訓練樣本限制為 4096個 Token。超過最大長度限制的部分將被截斷。

      在進行微調之前,可以先使用數據集格式驗證工具對數據集進行檢查,以驗證數據集中的每個對話是否都符合微調接口所要求的格式;還可以通過一些輕量級分析,提前識別數據集中存在的問題,例如缺少系統/用戶消息等,并提供對消息數和Token數的統計分析,用來估算微調成本。

      下面將通過使用 Fine-Tuning UI、CLI命令和 API的方式來介紹 OpenAl的微調。

      1.使用Fine-Tuning Ul 微調

      OpenAl 支持通過 Fine-Tuning UI進行大語言模型的微調。如果要進入 OpenAI 的微調Web 頁面,需要打開相應的頁面(https://platform.openai.com/finetune),在左側的導航欄單擊"Fine-tuning"即可,如以下圖所示。


      在 Fine-tuning 頁面中,左側展示可微調的所有任務,右側展示選中任務的詳細信息單擊“+Create”按鈕就可以創建微調任務,如下圖所示。在創建微調任務的頁面,完成微調任務的創建需要如下幾個步驟:



      • 選擇基礎大模型:OpenAI提供的基礎模型有 babbage-002、davinci-002、gpt-3.5-turbo-0125、gpt-3.5-turbo-0613 和 gpt-3.5-turbo-1106。添加訓練數據集:可以上傳或者選擇一個已經存在的json1文件。添加驗證數據集:可以上傳或者選擇一個已經存在的.jsonl 文件。設置模型后綴:給輸出的模型添加一個自定義的后綴。

      • 設置隨機種子:隨機種子用來控制任務的可重復性。如果未設置種子,則會自動生成一個。

      • 配置超參數:超參數需要設置批大小、學習率和訓練周期,默認值都是 auto。

      • 創建微調任務:完成上面的步驟后,單擊“Create”即可完成訓練任務的創建。

      • 評估微調結果:通過監控微調過程,確定使用模型,還是重新迭代。

      • 使用微調模型:完成微調之后,就可以使用微調模型了。


      2.使用CLI 命令微調

      OpenAI提供了命令行工具,可以幫助我們快速處理數據集、操作文件、創建微調任務和使用模型等,下面介紹一些常用的命令行工具。

      使用命令行工具需要先安裝 openai庫,代碼如下:

      pip3 install --upgrade openai

      在需要運行的環境(Linux、macOs)中,配置 OpenAl 的 api key,代碼如下:

      export OPEN_API_KEY="自己的api key"

      使用幫助工具查看 tools 和 api 分別支持的相關命令,代碼如下:* *

      openai tools-h或openai tools --help  openai api -h或openai api --help

      從幫助工具的查看結果可以發現,命令行工具支持圖像、音頻、文件和模型等,具體使用方法見表:


      使用 prepare data 進行數據的準備,參數 -f用于指定本地的數據,代碼如下:* *

      openai tools fine_tunes.prepare_data -f ./tmp/data.txt

      準備數據的過程,會對本地數據進行分析和處理,最終生成一個新的JSONL格式的文件,如下圖所示。


      使用 fles.create 方法將數據上傳到 OpenAI服務器,參數-p用于指定文件的用途(purpose),如fine-tune、answers 和search,代碼如下:* *

      openai api files.create -f ./training_data.jsonl -p fine-tune

      創建微調任務,參數 -t用于指定訓練數據集,--model用于指定基礎模型,代碼如下:

      openai api fine_tunes.create -t 訓練文件ID --model 選擇的基礎模型

      查看所有微調任務及其狀態信息,代碼如下:

       openai api fine_tunes.list

      根據任務ID,查看微調任務的詳細信息,代碼如下:

        openai api fine_tunes.get -i 微調任務ID

      當微調任務結束并完成模型評估后,就可以使用微調后的模型了,代碼如下:

       openai api completions.create -m 模型名稱 -p 提示詞

      還可以添加更多參數來控制文本的生成,如最大生成長度、溫度和生成數量等,代碼如下:* *

       openai api completions.create -m 模型名稱-p 提示詞 --max-tokens 100 --temperature 0.7 --n 1

      通過上述示例可以看出,使用 OpenAI的 CLI命令工具,用戶可以很方便地創建微調任務,包括準備和上傳數據集文件、創建微調任務、檢查任務狀態和使用模型等。

      3.使用API微調

      對于大多數開發者而言,使用 Fime-Tuning Ul和 CLI命令微調僅用于測試。在實際的生產環境中,需要通過編程實現微調。為此,OpenAI提供了相關的 API。先初始化 OpenAI的客戶端,配置自己的 api key,代碼如下:* *

      from openai import OpenAI

      api key = "填寫自己申請的 OpenAI的 api key" client = OpenAI(api key=api key)

      假設已經準備好微調的數據集為 mydata.jsonl文件,將 mydata.json 文件上傳到 OpenAI服務器,并指定目的是fine-tune,代碼如下:

      data_file_path ="mydata.jsonl" client.files.create(file=open(data_file_path, "rb"), purpose="fine-tune")

      根據數據集返回的文件ID,基于基礎模型 gpt-3.5-turbo 創建一個微調任務,代碼如下:

      file_id ="file-xxx" client.fine_tuning.jobs.create(training_file=file_id, model="gpt-3.5-turbo", suffix="2024-07-10")

      可以對微調任務進行列出、查詢和取消等一系列操作,代碼如下:

      client.fine_tuning.jobs.list(limit=5) fine_tuning_job_id = "ftiob-xxx" client.fine_tuning.jobs.retrieve(fine_tuning_job_id) client.fine_tuning.jobs.cancel(fine_tuning_job_id) client.fine_tuning.jobs.list_events(fine_tuning_job_id=fine_tuning_job_id, limit=5)

      微調和評估結束后,就可以使用微調出的模型了,代碼如下:

      model = "ft:gpt-3.5-turbo:demo:suffix:2024-07-10" completion = client.chat.completions.create(     model=model,     messages=[         {"role": "system", "content": "你是一個虛擬助手。"},         {"role": "assistant", "content": "您好。"},         {"role": "user", "content": "您好。"}     ] )

      本節介紹了 3種用于 ChatGPT 微調的方法:Fine-Tuning UI、CLI命令和 API。雖然這三種方法可以滿足大部分需求,但它們僅依賴于 ChatGPT。本節內容不僅適用于大多數場景,還可以作為了解和使用 ChatGPT的基礎。然而,為了滿足更多更復雜的使用場景,接下來我們將探討一些其他的微調最佳實踐。這些實踐將幫助你更靈活地利用大語言模型。以實現更出色的性能和更廣泛的應用。

      注:本文節選自機械工業出版社出版的《Python大模型應用開發:核心技術與項目實戰》,略有改動,以紙質書出版為準。

      編輯推薦

      (1)打通完整Python開發鏈條:系統梳理大模型應用開發全流程,涵蓋分詞、詞嵌入、向量數據庫、提示詞工程、模型微調與部署等關鍵技術,幫助開發者構建成體系的技能框架。

      (2)主流工具一網打盡:聚焦Hugging Face、LangChain、RAG等當前最熱門的大模型開發框架,講解其原理與實操方法,配合可運行的代碼與實戰案例,快速上手、易于應用。

      (3)項目實戰導向,深度挖掘數字人場景:通過多個數字人電商項目實戰,完整展示智能系統構建方式,貼近熱門應用場景,增強實戰價值與可落地性。

      (4)內容循序漸進,初學與進階開發者友好:全書由淺入深、結構清晰,從基礎認知到高級實戰,兼顧知識體系構建與動手能力提升,既適合AI開發初學者,也能幫助有經驗的工程師補齊短板。

      (5)作者技術實力深厚,經驗提煉與代碼實操雙助力:作者傾力總結多年AI架構實戰經驗,結合真實項目中的痛點問題,提供一線開發技巧與工程化思維,幫助開發者在實踐中掌握大模型開發的“術”與“道”。

      編輯推薦

      (1)體系完整,循序漸進:從零基礎認知到核心原理,再到開發、部署與運維,全流程掌握智能體的全棧知識體系。

      (2)案例驅動,實操為王:融合GPTs、LangChain、LlamaIndex等熱門技術,配套“即插即用”示例代碼與真實行業案例,快速落地。

      (3)應用廣泛,價值突顯:覆蓋教育、科研、醫療、設計、零售等場景,既能助新手入門,也能為開發者和創業者提供創新思路與商業機會。


      今日互動

      大模型時代,程序員的職業發展面臨哪些轉變?

      在留言區參與互動,我們將選取3名幸運讀者各獲得贈書1本(上面兩本,2選1),截止時間為2025年10月17日。(參與要求:2025年10月14日之前已關注“Ai學習的章北海”公眾號)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      震驚!朱孝天回應阿信感謝事件,無情商直言:“這是場面話,聽聽就算了吧”

      震驚!朱孝天回應阿信感謝事件,無情商直言:“這是場面話,聽聽就算了吧”

      阿廢冷眼觀察所
      2025-12-24 14:37:27
      歐盟不斷給烏克蘭貸款的真相,被匈牙利當場揭發,真相震驚世界!

      歐盟不斷給烏克蘭貸款的真相,被匈牙利當場揭發,真相震驚世界!

      青青子衿
      2025-12-23 23:41:14
      蘋果折疊屏 iPhone 機模曝光,新形態來了

      蘋果折疊屏 iPhone 機模曝光,新形態來了

      全是技能
      2025-12-24 15:21:53
      出售49%股權,海爾智家或出于這三個方面考慮

      出售49%股權,海爾智家或出于這三個方面考慮

      財視傳播
      2025-12-24 20:30:36
      70歲費玉清不孤單:和江蕙互相作伴,把晚年活成了靜水深流

      70歲費玉清不孤單:和江蕙互相作伴,把晚年活成了靜水深流

      調侃國際觀點
      2025-12-15 10:43:06
      外賣員深夜接到訂單,地址是郊區公墓,開門的竟是失蹤的未婚妻

      外賣員深夜接到訂單,地址是郊區公墓,開門的竟是失蹤的未婚妻

      罪案洞察者
      2025-12-22 11:12:39
      梅婷幫穎兒布置別墅,戴橡膠手套熱得穿T恤,付辛博帥照搶鏡

      梅婷幫穎兒布置別墅,戴橡膠手套熱得穿T恤,付辛博帥照搶鏡

      八怪娛
      2025-12-24 20:05:46
      西甲2025年身價漲幅TOP15:赫伊森上漲5200萬第1,姆巴佩第4

      西甲2025年身價漲幅TOP15:赫伊森上漲5200萬第1,姆巴佩第4

      懂球帝
      2025-12-24 05:15:11
      1955年全軍授銜,唯一的“大校軍長”站在將軍堆里,臉往哪擱?其實毛主席墻上的白手印,早就給出了答案

      1955年全軍授銜,唯一的“大校軍長”站在將軍堆里,臉往哪擱?其實毛主席墻上的白手印,早就給出了答案

      歷史回憶室
      2025-12-18 21:26:22
      金·卡戴珊成《堡壘之夜》當前最熱皮膚

      金·卡戴珊成《堡壘之夜》當前最熱皮膚

      后竹游戲
      2025-12-23 12:26:35
      拆遷全面叫停?滿24年房齡的老小區,一律按新規處理!業主迎利好

      拆遷全面叫停?滿24年房齡的老小區,一律按新規處理!業主迎利好

      boss外傳
      2025-12-23 20:30:05
      一身“塑料”卻保暖,為啥說聚酯纖維是人類最偉大的發明之一?

      一身“塑料”卻保暖,為啥說聚酯纖維是人類最偉大的發明之一?

      向航說
      2025-12-22 00:45:03
      利好突襲!剛剛,全線大漲!

      利好突襲!剛剛,全線大漲!

      數據寶
      2025-12-24 12:26:48
      生物博士變身鑒寶 公證書撤銷照樣算數 南博為何“制造”龐家后人

      生物博士變身鑒寶 公證書撤銷照樣算數 南博為何“制造”龐家后人

      金牌輿情官
      2025-12-22 22:40:53
      烏克蘭自不量力,想靠制裁中國換西方援助!

      烏克蘭自不量力,想靠制裁中國換西方援助!

      燕梳樓頻道
      2025-12-24 15:42:05
      德雷克海峽:地球上最兇險的航道,為何連現代巨輪都不敢掉以輕心

      德雷克海峽:地球上最兇險的航道,為何連現代巨輪都不敢掉以輕心

      半解智士
      2025-12-23 21:43:57
      趙露思典禮妝容被嫌臟!認了沒請化妝師,霸氣喊:不再為造型內耗

      趙露思典禮妝容被嫌臟!認了沒請化妝師,霸氣喊:不再為造型內耗

      璀璨幻行者
      2025-12-23 22:18:54
      大快人心!黎智英正式宣判,西方撈人失敗,亂港黨正式解散

      大快人心!黎智英正式宣判,西方撈人失敗,亂港黨正式解散

      路路觀察官方號
      2025-12-24 20:30:03
      夫妻買下香港山頂3層破房,在家造花園:結婚54年還像熱戀!

      夫妻買下香港山頂3層破房,在家造花園:結婚54年還像熱戀!

      一條
      2025-12-23 17:35:39
      稀土永磁第一股,訂單狂飆200%!

      稀土永磁第一股,訂單狂飆200%!

      投研邦V
      2025-12-24 19:39:33
      2025-12-25 00:00:49
      機器學習與Python社區 incentive-icons
      機器學習與Python社區
      機器學習算法與Python
      3233文章數 11081關注度
      往期回顧 全部

      科技要聞

      智譜和MiniMax拿出了“血淋淋”的賬本

      頭條要聞

      15歲女孩遭同班14歲男生殺害:對方曾拍攝其胸部等照片

      頭條要聞

      15歲女孩遭同班14歲男生殺害:對方曾拍攝其胸部等照片

      體育要聞

      26歲廣西球王,在質疑聲中成為本土得分王

      娛樂要聞

      懷孕增重30斤!闞清子驚傳誕一女夭折?

      財經要聞

      北京進一步放松限購 滬深是否會跟進?

      汽車要聞

      “運動版庫里南”一月份亮相???或命名極氪9S

      態度原創

      時尚
      房產
      旅游
      數碼
      藝術

      對不起周柯宇,是陳靖可先來的

      房產要聞

      硬核!央企海口一線江景頂流紅盤,上演超預期交付!

      旅游要聞

      歷經10年保護修繕,故宮養心殿將于本周五重新開放

      數碼要聞

      AMD Zen 6與Intel Nova Lake或將上演288 MB 3D緩存“大戰”

      藝術要聞

      2026第一福!孫曉云親筆“福”字出爐

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日韩美女久久| 国产真实露脸乱子伦原著| 深夜福利啪啪片| 激情自拍校园春色中文| 香港三日本8a三级少妇三级99| 国产又色又爽又高潮免费| 午夜不卡久久精品无码免费| 人妻在线中文| 99啪啪| 一本无码中文字幕| 富婆如狼似虎找黑人老外| 成人性生交大片免费看视频app| 狠狠躁天天躁中文字幕| 亚洲精品一区二区三区蜜臀| 免费无码毛片一区二区app| 在线播放无码后入内射少妇| 五月婷视频| 亚洲精品乱码久久久久久蜜桃91| 国产精品18久久久久久麻辣| 男人天堂一区| 曰批永久免费40分钟免费观看软件| caoporn免费视频公开| 伊人精品成人久久综合97| 日韩av在线不卡一区二区三区| 99re在线视频| 国产成人久久精品激情| 欧美老妇牲交videos| 免费精品无码av片在线观看| 亚洲日韩人妻在线| www.艹| 昌乐县| 精品成a人无码| 丰原市| 吴堡县| 亚洲最大的成人网| 国产精品毛片一区二区| 女厕偷窥一区二区三区| 久久久av波多野一区二区| 久久精品99国产国产精| 国产美女高潮流白浆视频| 五月天激情国产综合婷婷婷|