<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      ollama v0.17.6 發(fā)布:重大解析修復(fù)與 Qwen3.5 完整支持,全鏈路優(yōu)化模型渲染與工具調(diào)用

      0
      分享至




      2026 年 3 月 5 日,Ollama 正式發(fā)布了v0.17.6版本。這是一次極具實用價值的改進版本,在保持系統(tǒng)穩(wěn)定的基礎(chǔ)上,重點修復(fù)了多個長期存在的細節(jié)性問題,包括GLM-OCR 的 Prompt 渲染錯誤、Qwen 3.5 工具調(diào)用與解析邏輯, 并帶來了對模型渲染、工具鏈、配置兼容性等方面的進一步完善。

      本篇文章將全面解析 v0.17.6 的變更列表、核心代碼結(jié)構(gòu)調(diào)整、測試覆蓋改進及潛在影響,幫助開發(fā)者清晰理解此次升級的深度與意義。

      一、版本概覽

      發(fā)布日期:2026 年 3 月 5 日
      版本號:v0.17.6
      更新重點:

      1. 1. 修復(fù)GLM-OCR模型因 prompt 渲染錯誤導(dǎo)致無法工作的問題

      2. 2. 修復(fù)Qwen 3.5模型工具調(diào)用的解析與渲染問題

      3. 3. 優(yōu)化模型配置文件命名兼容,例如Ollama (local)自動遷移為Ollama

      4. 4. 移除舊版本imagegenLLM 模型與peak memoryAPI 字段

      5. 5. 引入全新的 Qwen3.5 渲染及解析模塊,全面支持thinking模式

      此次更新共包含12 次提交、修改51 個文件,由 7 名開發(fā)人員完成。從 diff 記錄看,涉及到新增代碼超過 3900 行,同時刪除舊邏輯 4010 行,可見是一次覆蓋范圍較大的“重構(gòu) + 修復(fù)”整合版本。

      二、總體改動組成 1. API 層變化:移除PeakMemory字段

      api/types.go文件中刪除了Metrics結(jié)構(gòu)體中的PeakMemory相關(guān)字段與輸出邏輯。
      其原始功能用于在模型推理時統(tǒng)計峰值內(nèi)存占用,但由于mlx(Memory Layout Executor)層的 API 已移除此項指標,因此不再返回該值。

      舊結(jié)構(gòu):

      type Metrics struct {
      TotalDuration time.Duration `json:"total_duration,omitempty"`
      PeakMemory uint64 `json:"peak_memory,omitempty"`
      }

      刪除后:

      type Metrics struct {
      TotalDuration time.Duration `json:"total_duration,omitempty"`
      }

      同時刪除了相關(guān)的格式化函數(shù)formatPeakMemory、控制臺輸出內(nèi)容,更新后的日志輸出更加簡潔,避免“空指標”誤導(dǎo)用戶。

      這也意味著未來 Ollama 將更聚焦性能時間維度指標,而非硬件狀態(tài)統(tǒng)計。

      2. 命令行層更新:移除imagegen運行參數(shù)

      cmd/cmd.go文件中刪除了--imagegen標志相關(guān)邏輯,不再通過 CLI 參數(shù)控制圖像生成模型使用內(nèi)部 Runner。

      這體現(xiàn)了 v0.17.6 開始逐步統(tǒng)一模型調(diào)用接口,將生成型與多模態(tài)模型整合至統(tǒng)一 runner 體系中,從設(shè)計上簡化用戶調(diào)用路徑。

      3. 配置遷移優(yōu)化:Ollama (local) → Ollama

      在配置管理模塊cmd/config/opencode.go中新增了名稱遷移邏輯,解決了配置兼容問題。
      許多開發(fā)者此前使用本地 provider 時,其配置如下:

      {
      "provider":{
      "ollama":{
      "name":"Ollama (local)",
      "npm":"@ai-sdk/openai-compatible",
      "options":{"baseURL":"http://localhost:11434/v1"}
      }
      }
      }

      新版本中,當檢測到Ollama (local)名稱時會自動遷移為Ollama,保證現(xiàn)有配置無需手動修改即可被識別。

      同時,新單元測試驗證邏輯如下:

      • ? 自動遷移本地 provider 名稱。

      • ? 保留自定義 provider 名稱(即不會覆蓋非默認配置)。

      • ? 刪除模型時保留非 Ollama 模型的子項。

      這確保了升級后配置文件兼容性 100%,不會破壞舊有項目結(jié)構(gòu)。

      三、模型解析層全面升級:Qwen 3.5 Parser

      v0.17.6 最為關(guān)鍵的更新在于模型解析器部分。
      新增文件model/parsers/qwen35.go(238 行新增)正式引入了Qwen3.5 專屬解析器 Qwen35Parser,取代原有的通用Qwen3Parser。

      (1) 核心特性

      • ? 完整支持thinking推理標簽 ...

      • ? 增強對分塊流式輸出的識別能力(跨 token stream 漸進渲染)

      • ? 可區(qū)分思考內(nèi)容(thinking content)與輸出內(nèi)容(response content)

      • ? 在思考區(qū)間不解析 ,避免錯把 reasoning 內(nèi)部結(jié)構(gòu)誤識別為工具調(diào)用

      (2) 狀態(tài)機設(shè)計

      新增狀態(tài):

      const (
      qwen35ParserStateCollectingThinking
      qwen35ParserStateThinkingDoneEatingWhitespace
      qwen35ParserStateCollectingContent
      )

      解析邏輯以有限狀態(tài)機(FSM)形式實現(xiàn)。當遇到 起始標簽進入思考模式,遇到切換到內(nèi)容模式。
      與此同時,對流式數(shù)據(jù)的分段處理更加精準,支持不完整的關(guān)閉標簽(如+nk>分兩次到達),確保輸出不會斷裂。

      (3) 異常情況處理

      • ? 若 未關(guān)閉,自動將后續(xù)內(nèi)容視為思考過程輸出;

      • ? 若 Assistant 消息為續(xù)寫(帶 prefill),默認跳過起始思考階段;

      • ? 處理 嵌套、空格、換行符自動剔除,輸出純凈的 reasoning 文本。

      (4) 測試覆蓋 (model/parsers/qwen35_test.go)

      測試文件新增382 行,覆蓋以下場景:

      • ? 工具調(diào)用 XML 格式識別;

      • ? 含顯式 標簽的 reasoning 內(nèi)容提??;

      • ? Assistant 預(yù)填充(prefill)場景;

      • ? 思考階段中誤判工具調(diào)用;

      • ? 標簽被分片情況;

      • ? 未閉合標簽情況下的安全輸出。

      這些測試使 Qwen 3.5 解析流程從多線程推理到斷流恢復(fù)都具備強魯棒性。

      四、模型渲染層優(yōu)化:全面更新 Qwen3.5 與 GLM-OCR Renderer

      渲染器層:model/renderers/目錄新增了兩大核心組件:

      1.Qwen35Renderer

      文件model/renderers/qwen35.go,新增 389 行。
      該渲染器對應(yīng) Qwen3.5 模型 prompt 生成邏輯,旨在讓模型完全遵循 XML 函數(shù)調(diào)用格式與 思考框架。

      功能亮點:

      • ? 支持 指令區(qū)塊嵌入,格式嚴格遵循模型需求;

      • ? 自動拼接系統(tǒng)提示與函數(shù)聲明;

      • ? 支持生成 塊,帶 ;

      • ? 邏輯層支持多工具順序調(diào)用,多次 塊組裝;

      • ? 思考與輸出完美分離,緊密銜接模型訓練格式。

      渲染示例結(jié)構(gòu):

      <|im_start|>assistant

      I need to fetch the data first.

      Here is my analysis.



      42

      <|im_end|>
      其他改進:
      • ? 支持useImgTags圖片標記嵌入([img-0], [img-1]),兼容多模態(tài);

      • ? 提供emitEmptyThinkOnNoThink參數(shù),用于未啟用思考模式時補充空 模塊;

      • ? 對工具多次調(diào)用場景支持批量寫入;

      • ? 對assistant prefill保留最后階段輸出,不關(guān)閉<|im_start|>塊。

      測試文件model/renderers/qwen35_test.go共新增 389 行,涵蓋:

      • ? 多輪對話、函數(shù)調(diào)用遞歸;

      • ? Back-to-back 工具響應(yīng);

      • ? 思考與工具交錯場景;

      • ? Assistant 預(yù)填充完整性校驗。

      該模塊的引入使得 Ollama 在多模型推理框架下更貼合阿里 Qwen3.5 推理接口的真實結(jié)構(gòu)。

      2.GLM-OCR Renderer 大幅修復(fù)

      文件model/renderers/glmocr.go修改 99 行。
      這次修復(fù)針對核心問題:GLM-OCR 模型無法正確渲染帶圖像的 prompt。

      更新要點:

      • ? 新增GlmOcrRenderer結(jié)構(gòu)體屬性useImgTags;

      • ? 引入內(nèi)部函數(shù)renderContent(),根據(jù)配置動態(tài)選擇是否添加[img-x]標記;

      • ? 改善 ImageOffset(圖片計數(shù)偏移)管理;

      • ? 用戶消息按[img-0][img-1]順序標識多圖輸入;

      • ? 流程中修正原先message.Content與圖片塊拼接順序。

      渲染前后差異:

      舊版輸出(無法識別圖片位):

      <|user|>請識別圖片內(nèi)容。

      新版輸出(帶多圖標記):

      <|user|>
      [img-0][img-1]請識別圖片內(nèi)容。

      同時新增glmocr_test.go文件(99 行),驗證包括以下 5 種情況:

      1. 1. 單張圖片;

      2. 2. 多張圖片;

      3. 3. 多輪對話圖像偏移;

      4. 4. 默認模式不添加圖像標簽;

      5. 5. 無圖像場景內(nèi)容保持一致。

      這意味著以后 GLM-OCR 模型將可以在多圖輸入下穩(wěn)定進行 OCR 推理,輸出定位將完整無誤。

      3. 渲染器選擇邏輯更新

      model/renderers/renderer.go中更新了模型映射:

      case "qwen3.5":
      renderer := &Qwen35Renderer{isThinking: true, emitEmptyThinkOnNoThink: true, useImgTags: RenderImgTags}
      case "glm-ocr":
      return &GlmOcrRenderer{useImgTags: RenderImgTags}

      即:

      • ? 將原來的Qwen3VLRenderer替換為新的Qwen35Renderer

      • ? 為GLM-OCR渲染器開啟全局圖片標簽選項。

      這使兩個模型在渲染階段均獲得一致的上下文構(gòu)造與多模態(tài)支持。

      五、服務(wù)器邏輯補充更新

      server.go中,刪除了CompletionResponse返回體的PeakMemory字段,使 API 輸出與 Metrics 同步調(diào)整。
      這確保了傳輸數(shù)據(jù)更輕量化、字段結(jié)構(gòu)一致。

      六、測試體系增強

      此次更新新增測試覆蓋超過 1000 行,主要針對以下方向:

      • ?配置遷移測試
        確保舊配置自動升級為標準名稱;

      • ?GLM-OCR 多圖輸入測試
        確認每張圖片得到正確索引;

      • ?Qwen3.5 渲染與解析系統(tǒng)測試
        模擬思考場景、函數(shù)嵌套、流式數(shù)據(jù)拼接;

      • ?工具調(diào)用與 reasoning 多階段測試
        驗證多工具連續(xù)調(diào)用的 XML 結(jié)構(gòu)合法性;

      • ?Streaming 行為測試
        分塊輸入下保持狀態(tài)一致性。

      針對復(fù)雜推理模型,如 Qwen3.5 這種包含 的混合流式結(jié)構(gòu),此輪測試確保無論在并發(fā)推理還是斷流恢復(fù)場景下都不丟失內(nèi)容。

      七、移除舊模型與無效依賴

      本次更新清理了歷史遺留的imagegen LLM模型,以及云模型拉取過程中的存根要求,進一步簡化了部署過程。
      Revert提交中體現(xiàn)了多次回滾與重放操作,表明研發(fā)團隊對云端模型加載機制進行深度優(yōu)化與驗證。

      八、總結(jié)與展望

      Ollama v0.17.6 是一次結(jié)構(gòu)性的重要版本更新。它沒有去追求新增功能,而是聚焦于底層穩(wěn)定性、模型兼容與推理一致性的打磨,體現(xiàn)出平臺從實驗型向工業(yè)化過渡的信號。

      核心收益總結(jié):

      1. 1.GLM-OCR修復(fù)后,OCR 模型可穩(wěn)定處理多圖輸入。

      2. 2.Qwen3.5渲染與解析系統(tǒng)配套上線,支持完整 思考標簽鏈路。

      3. 3.配置文件自動遷移,升級成本為零。

      4. 4.API 數(shù)據(jù)結(jié)構(gòu)簡化,輸出更清晰、兼容性更高。

      5. 5.測試覆蓋度大幅提升,確保行為穩(wěn)定與準確。

      通過對 v0.17.6 的更新,可以預(yù)見 Ollama 在未來版本中將繼續(xù)強化多模態(tài)與 reasoning 模式集成,為 LLM 本地部署與企業(yè)多模型協(xié)作提供更堅實的基礎(chǔ)。

      結(jié)語

      代碼地址:github.com/ollama/ollama

      Ollama v0.17.6 雖非大版本跳躍,但卻在細節(jié)上體現(xiàn)了極高的工程重視度。
      從配置遷移到渲染邏輯,再到工具調(diào)用與流式解析,幾乎每個子模塊都在朝著更統(tǒng)一、更可靠、更智能的方向演進。

      我們相信人工智能為普通人提供了一種“增強工具”,并致力于分享全方位的AI知識。在這里,您可以找到最新的AI科普文章、工具評測、提升效率的秘籍以及行業(yè)洞察。 歡迎關(guān)注“福大大架構(gòu)師每日一題”,發(fā)消息可獲得面試資料,讓AI助力您的未來發(fā)展。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

      A股:2.5億股民,今晚可能要興奮得睡不著覺了,你知道為什么嗎?

      另子維愛讀史
      2026-04-13 17:04:06
      8.03億歐!若熱刺降級將打破英超降級球隊最高德轉(zhuǎn)身價紀錄

      8.03億歐!若熱刺降級將打破英超降級球隊最高德轉(zhuǎn)身價紀錄

      懂球帝
      2026-04-13 19:39:06
      緊急!即日起中小學全面嚴查!教師、家長、學生三類人紅線碰不得

      緊急!即日起中小學全面嚴查!教師、家長、學生三類人紅線碰不得

      糖逗在娛樂
      2026-04-13 16:35:12
      新iPhone 最新曝光,首次采用新設(shè)計

      新iPhone 最新曝光,首次采用新設(shè)計

      科技堡壘
      2026-04-13 11:39:06
      央視曝光AI造黃!幾個關(guān)鍵詞就可"手搓"大尺度視頻,還能一鍵脫衣

      央視曝光AI造黃!幾個關(guān)鍵詞就可"手搓"大尺度視頻,還能一鍵脫衣

      派大星紀錄片
      2026-04-13 14:37:42
      曝普京住所周圍被迫再安裝8套防空系統(tǒng)!俄財政赤字超兩倍

      曝普京住所周圍被迫再安裝8套防空系統(tǒng)!俄財政赤字超兩倍

      項鵬飛
      2026-04-13 16:11:56
      手握百億,擁有頂級醫(yī)療資源,賭王女兒仍去世,60歲的她得什么病

      手握百億,擁有頂級醫(yī)療資源,賭王女兒仍去世,60歲的她得什么病

      阿纂看事
      2026-04-13 11:48:21
      觀眾看豫劇哭成“憋淚哥”,對話爆火豫劇團:有時演員自己出不了戲,有觀眾幫忙擦眼淚

      觀眾看豫劇哭成“憋淚哥”,對話爆火豫劇團:有時演員自己出不了戲,有觀眾幫忙擦眼淚

      瀟湘晨報
      2026-04-13 19:44:18
      曝《寂靜嶺》等大作將被國內(nèi)禁售!全平臺下架封禁

      曝《寂靜嶺》等大作將被國內(nèi)禁售!全平臺下架封禁

      游民星空
      2026-04-13 11:12:18
      馬斯克“西方版微信”搞抄襲?網(wǎng)友:這么光明正大,演都不演了...

      馬斯克“西方版微信”搞抄襲?網(wǎng)友:這么光明正大,演都不演了...

      品牌新
      2026-04-12 19:33:24
      沒打服伊朗,愛潑斯坦掀棺材板了?

      沒打服伊朗,愛潑斯坦掀棺材板了?

      漢唐智庫
      2026-04-13 00:04:53
      又難開又難停,中年人瘋搶的大車里,藏盡了委屈與無奈

      又難開又難停,中年人瘋搶的大車里,藏盡了委屈與無奈

      每日人物
      2026-04-12 15:56:21
      中美俄同時力挺也沒用,匈牙利強人歐爾班為何大???

      中美俄同時力挺也沒用,匈牙利強人歐爾班為何大敗?

      碼頭青年
      2026-04-13 12:32:33
      受權(quán)發(fā)布|中華人民共和國國務(wù)院令  第835號

      受權(quán)發(fā)布|中華人民共和國國務(wù)院令  第835號

      新華社
      2026-04-13 17:03:04
      被曝光的20余家法檢兩院一天之內(nèi)將公告刪干凈

      被曝光的20余家法檢兩院一天之內(nèi)將公告刪干凈

      追月數(shù)星
      2026-04-13 13:52:43
      伊朗請求世界杯三場小組賽場地從美國更改為墨西哥,被FIFA拒絕;伊朗若無緣世界杯,誰會成為遞補?

      伊朗請求世界杯三場小組賽場地從美國更改為墨西哥,被FIFA拒絕;伊朗若無緣世界杯,誰會成為遞補?

      極目新聞
      2026-04-13 13:50:22
      中國官方緊急提醒:稅務(wù)連查三年境外所得!在新加坡賺的錢,還要交一次稅?

      中國官方緊急提醒:稅務(wù)連查三年境外所得!在新加坡賺的錢,還要交一次稅?

      新加坡眼
      2026-04-13 19:16:49
      張雪機車賣到香港了!網(wǎng)友:“香港總代理”含金量等同于搖錢樹…

      張雪機車賣到香港了!網(wǎng)友:“香港總代理”含金量等同于搖錢樹…

      火山詩話
      2026-04-13 17:49:43
      小米汽車市場危機,開始公開化

      小米汽車市場危機,開始公開化

      浙江車網(wǎng)
      2026-04-13 09:15:19
      鬧掰了?王曉晨疑發(fā)文內(nèi)涵俞灝明,言語犀利絲毫沒給對方留體面!

      鬧掰了?王曉晨疑發(fā)文內(nèi)涵俞灝明,言語犀利絲毫沒給對方留體面!

      娛樂團長
      2026-04-13 20:29:53
      2026-04-14 01:59:00
      moonfdd incentive-icons
      moonfdd
      福大大架構(gòu)師每日一題
      1178文章數(shù) 64關(guān)注度
      往期回顧 全部

      科技要聞

      "抄作業(yè)"近四年,馬斯克版微信周五上線

      頭條要聞

      上海女子2個月內(nèi)結(jié)2次婚 生下的孩子卻是第3個男人的

      頭條要聞

      上海女子2個月內(nèi)結(jié)2次婚 生下的孩子卻是第3個男人的

      體育要聞

      一支球隊不夠爛,也是一種悲哀

      娛樂要聞

      初代“跑男團”合體,鄧超、鹿晗缺席

      財經(jīng)要聞

      談判未完全關(guān)閉?3國力促美伊重啟談判

      汽車要聞

      不止命名更純粹 領(lǐng)克10/10+要做純電操控新王

      態(tài)度原創(chuàng)

      數(shù)碼
      本地
      時尚
      家居
      軍事航空

      數(shù)碼要聞

      壹號本ONEXStation i1迷你主機發(fā)售,18999元

      本地新聞

      12噸巧克力有難,全網(wǎng)化身超級偵探添亂

      今年春夏一定要擁有的4條裙子,這樣穿減齡又好看!

      家居要聞

      復(fù)古風格 自然簡約

      軍事要聞

      特朗普:今晚10點封鎖伊朗 對北約非常失望

      無障礙瀏覽 進入關(guān)懷版