<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      最近很熱門的oMLX,Mac端大模型本地部署新選擇,Claude-Opus-4.6 蒸餾版 Qwen3.5-9B 實測

      0
      分享至

      oMLX 走的是 Apple Silicon + MLX 這條路,Windows 和 NVIDIA 這邊的朋友,這篇先看看熱鬧就好

      前文,評論區好幾個兄弟推薦測試 oMLX:

      • 博主有時間可以研究一下oMLX這個替代 LM Studio,據說比 lm 快很多倍。

      • 聽說 omlx 比 lm studio 更好用些,占用內存更小,有沒有嘗試部署一下?

      • 有大佬做成適合 omlx 跑的 fp8 量化版了,大概 10G,可以試試。同樣機器配置,換用了 oMLX 跑 qwen3.5 9b MLX Q4 版,利落了些,15token 左右吧。雖然回復慢,但還能用。而 ollama 跑就卡頓的很。

      花半天玩了一下,先看大家最關心的測試情況:

      • oMLX 有很多亮點,UI、菜單欄、管理后臺儀表板,Chat 頁面都很漂亮,底層有 SSD KV 緩存、設置熱緩存、支持 MCP、一鍵對接各種 AI Coding Agent,OpenAI/Anthropic 兼容接口、針對 Claude Code 優化等

      • 單請求生成速度約 20 token/s,峰值顯存/統一內存占用約 5.7GB

      • 無法硬跑 Qwen3.5-27B-Claude-4.6-Opus-Distilled-MLX-4bit,LM Studio 可以強跑,但只能加載,執行任務直接徹底卡死

      安裝、配置、使用教程

      安裝后直接進入 Perference,自定義模型位置,端口號

      模型位置后面我把他改到了外接移動硬盤


      菜單欄確實方便,一鍵啟停 server、進入管理后臺,進入聊天界面


      先要進入模型 tab 然后點下載器


      下面的瀏覽模型可以直接看能否支持當前主機


      下載速度極慢,后來我換成了 modelcope


      感覺也有 bug,直接從上面下載,他會默認下載整個項目下的不同精度模型,而我只需要 Q4


      27B 我也下了


      沒有選擇 Jackrong 原版,主要是被 mlx-community 這句話吸引了


      但是 27B 最低使得 24 GB 及以上統一內存的 Mac 都能運行該模型,且還有足夠空間容納大型上下文窗口,推薦是 32GB

      官方測試數據:

      Metric

      Result

      Model load time

      2.4 seconds

      Prompt ingestion

      86.5 tokens/sec

      Generation speed

      15.7 tokens/sec

      Peak RAM usage

      15.6 GB

      Bit-rate

      4.501 bits/weight

      Final size

      14 GB (3 shards)

      下載過程中進入設置頁


      資源管理這里可以控制內存占用情況,


      下載完畢,可以選擇在設置 - 模型設置中啟動,剛開始居然沒找到哪里加載


      聊天頁面,很清爽


      儀表盤會記錄模型運行情況


      現在往下也能把啟動的模型一見接入到 Codex、OpenCode、OpenClaw


      它還可以做基準測試


      32K 單請求測試,電腦已經有點卡了,TTFT 高的離譜,TPS 只有 11

      測試

      TTFT (ms)

      TPOT (ms/tok)

      pp TPS

      tg TPS

      端到端延遲

      吞吐量

      峰值內存

      pp32768/tg128

      187.4 tok/s

      11.8 tok/s

      185.686s

      177.2 tok/s

      9.06 GB

      單請求 + 批處理能力沒敢開高,tg TPS 20.2 tok/s。輸入拉長到 4096 token 后 TTFT 從 4.8s 變成 18.8s,tg TPS 還在 19.8 tok/s,幾乎沒掉,Peak Mem 從 5.66 GB 到 6.40 GB

      并發到 2-4 路時總吞吐提升明顯,但 8 路已經接近平臺上限,延遲代價很大。


      依舊測試閱讀理解+SVG 代碼生成 + 審美

      感覺不穩了,需要抽卡


      重新嘗試可以識別到四次,svg 寫的很丑


      讓其優化之后,它的腦回路讓我想笑,它直接設計了模擬人物動作,完全偏離了主題


      27B 無法跑起來

      改了 N 多配置都不行,有高手可以出出主意

      我要換 32G 的 Mac 了


      但是 LM Studio 就可以用 option 按鍵強跑,只是無法執行任務,機器卡死


      其他再說說

      看了官方文檔,再說幾個 oMLX 的亮點,可是我都沒嘗試

      1. 連續批處理

      它基于mlx-lmBatchGenerator做并發處理,首頁給了一組非常直觀的 benchmark,機器是 M3 Ultra 512GB,模型是 Qwen3.5-122B-A10B-4bit:

      • 單請求、8k 上下文時,Prompt 處理速度能到941 tok/s

      • Token 生成速度大約54.0 tok/s

      • 8x連續批處理下,總吞吐能到190.2 tok/s

      • 對應3.36 倍吞吐提升

      • 內存占用峰值 73 GB

      另一組我很關注的數據是Qwen3-Coder-Next-8bit

      • 8k 上下文時,Prompt 處理速度2009 tok/s

      • 8x批處理總吞吐243.3 tok/s

      • 加速比來到4.14 倍

      • 內存占用峰值 85GB

      2. Claude Code 優化

      README 里有一句:

      支持在 Claude Code 中使用較小上下文模型的上下文縮放。通過縮放上報的 Token 數量,讓自動壓縮在合適的時機觸發,同時提供 SSE keep-alive 防止長時間預填充導致的讀取超時。

      官方給出的方向主要有兩個:

      • 通過上下文縮放,讓較小上下文模型在 Claude Code 里更容易觸發合適的自動壓縮時機

      • 通過 SSE keep-alive,降低長時間 prefill 時讀超時的風險

      它本身還支持:

      • OpenAI 兼容接口:http://localhost:8000/v1

      • Anthropic 兼容接口:POST /v1/messages

      • 工具調用

      • MCP 集成

      3. 多模型服務

      它在同一服務里支持:

      • 文本 LLM

      • VLM

      • OCR 模型

      • Embedding

      • Reranker

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      摧毀海上偷渡鏈!“獴獵”行動68人落網細節曝光

      摧毀海上偷渡鏈!“獴獵”行動68人落網細節曝光

      環球網資訊
      2026-04-19 13:23:28
      一輛20萬的新車,卡扣斷了,修不起;89元的零件 逼人換13萬電池包

      一輛20萬的新車,卡扣斷了,修不起;89元的零件 逼人換13萬電池包

      娛樂圈的筆娛君
      2026-04-20 02:07:08
      主動站出來認罪的紅色高棉頭目----一個劊子手的罪與贖

      主動站出來認罪的紅色高棉頭目----一個劊子手的罪與贖

      通往遠方的路
      2026-04-20 09:57:44
      中國有貨就是不賣!印度這次徹底失算,把全球供應商都惹毛了

      中國有貨就是不賣!印度這次徹底失算,把全球供應商都惹毛了

      一個有靈魂的作者
      2026-04-19 19:40:53
      重要突破,科學家注射一個腫瘤細胞,全身癌細胞竟然消失

      重要突破,科學家注射一個腫瘤細胞,全身癌細胞竟然消失

      心中的麥田
      2026-04-19 18:26:11
      伊朗向中國通報!談判團差點被美軍“團滅”,全程連電話都不敢打

      伊朗向中國通報!談判團差點被美軍“團滅”,全程連電話都不敢打

      荷蘭豆愛健康
      2026-04-19 21:53:37
      越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

      越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

      苗苗情感說
      2026-04-19 12:38:15
      文班亞馬季后賽首秀:傳承開始

      文班亞馬季后賽首秀:傳承開始

      張佳瑋寫字的地方
      2026-04-20 12:23:10
      張蘭暗示兒媳馬筱梅欲望旺盛,汪小菲別墅空調失靈,覬覦婆婆宅邸

      張蘭暗示兒媳馬筱梅欲望旺盛,汪小菲別墅空調失靈,覬覦婆婆宅邸

      樂悠悠娛樂
      2026-04-20 10:47:48
      爺爺生前錄音贈孫女109萬元遺產,六個姑姑不服要求平分,法院:錄音無效,重新分配,患小兒麻痹癥姑姑拿大頭

      爺爺生前錄音贈孫女109萬元遺產,六個姑姑不服要求平分,法院:錄音無效,重新分配,患小兒麻痹癥姑姑拿大頭

      魯中晨報
      2026-04-17 17:00:03
      600年都不倒!天安門這4根重達2萬多公斤的華表,有何特殊含義?

      600年都不倒!天安門這4根重達2萬多公斤的華表,有何特殊含義?

      墨印齋
      2026-04-14 00:57:55
      復雜的黎巴嫩,走投無路的真主黨

      復雜的黎巴嫩,走投無路的真主黨

      寰宇大觀察
      2026-04-17 17:36:11
      靈隱寺砸飯碗!浙江4000寺廟大洗牌,滿街僧人有玄機

      靈隱寺砸飯碗!浙江4000寺廟大洗牌,滿街僧人有玄機

      一口娛樂
      2026-04-20 01:43:39
      解氣!!!來而不往非禮也!中國海軍今天出手了!

      解氣!!!來而不往非禮也!中國海軍今天出手了!

      樂趣紀史
      2026-04-20 08:03:19
      浙江25歲女子深夜跑進急診,疼到臉色發白,醫生:近兩三年這類患者越來越多,嚴重的會造成不可逆傷害

      浙江25歲女子深夜跑進急診,疼到臉色發白,醫生:近兩三年這類患者越來越多,嚴重的會造成不可逆傷害

      環球網資訊
      2026-04-20 09:25:07
      張本兄妹改名風波再升級,韓媒強烈批評,這就是狠毒的創姓改稱

      張本兄妹改名風波再升級,韓媒強烈批評,這就是狠毒的創姓改稱

      有范又有料
      2026-04-19 00:03:10
      張雪機車,全球訂單狂飆

      張雪機車,全球訂單狂飆

      第一財經資訊
      2026-04-18 18:42:46
      張雪回應為何還有6圈提前結束比賽:有事故摩托車橫躺在賽道上

      張雪回應為何還有6圈提前結束比賽:有事故摩托車橫躺在賽道上

      貝殼財經
      2026-04-19 23:56:03
      一伊朗油輪突破美國封鎖進入伊朗水域

      一伊朗油輪突破美國封鎖進入伊朗水域

      每日經濟新聞
      2026-04-20 07:10:32
      “DeepSeek首次融資”傳聞震動市場!寒武紀、沐曦股份、摩爾線程和張雪機車的天使投資人都回應了

      “DeepSeek首次融資”傳聞震動市場!寒武紀、沐曦股份、摩爾線程和張雪機車的天使投資人都回應了

      證券時報
      2026-04-19 22:52:02
      2026-04-20 12:55:00
      Ai學習的老章 incentive-icons
      Ai學習的老章
      Ai學習的老章
      3334文章數 11137關注度
      往期回顧 全部

      科技要聞

      藍色起源一級火箭完美回收 客戶衛星未入軌

      頭條要聞

      媒體:伊朗剛說不談 美國立即開打

      頭條要聞

      媒體:伊朗剛說不談 美國立即開打

      體育要聞

      七大獎項候選官宣!文班或全票DPOY

      娛樂要聞

      鹿晗生日上熱搜,被關曉彤撕下體面

      財經要聞

      月之暗面IPO迷局

      汽車要聞

      把天門山搬進廠?開仰望U8沖上45度坡的那刻 我腿軟了

      態度原創

      時尚
      本地
      家居
      健康
      公開課

      今年最流行的衣服竟然是它?高級又氣質!

      本地新聞

      12噸巧克力有難,全網化身超級偵探添亂

      家居要聞

      自然慢調 慢享時光

      干細胞抗衰4大誤區,90%的人都中招

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版