<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      實(shí)測對(duì)比OpenAI開源的gpt-oss,奧特曼給的是誠意還是糊弄?

      0
      分享至

      昨晚,OpenAI說了大半年的開源終于兌現(xiàn)了。上一次開源還是2019年的GPT-2。



      開源模型的名稱很特別:gpt-oss,不是我們見過的GPT-4系列更不是“狼來了”的GPT-5,也不是推理模型o3、o4系列。Oss具體含義官方尚未公布,但大概率是open source series(開源系列)的縮寫。

      這次OpenAI開源了 gpt-oss-120b 和 gpt-oss-20b 兩個(gè)MoE架構(gòu)的文本模型,原生基于MXFP4訓(xùn)練,采用Apache 2.0開源協(xié)議。

      其中g(shù)pt-oss-120b總參數(shù)達(dá)1170億,激活參數(shù)僅 51 億。包含36層和128個(gè)專家,每次激活4個(gè)專家;gpt-oss-20b:總參數(shù)210 億,激活參數(shù)36億,擁有24層和32個(gè)專家,同樣每次激活4個(gè)專家。

      模型在ollama、huggingface都可以下載使用。gpt-oss-120b模型需要顯存65G以上(運(yùn)行需要多張高性能顯卡橋接),gpt-oss-20b需要14G顯存以上(推薦4080及以上顯卡)。

      除了 MoE 架構(gòu),這兩個(gè)模型還融合了多項(xiàng)技術(shù),如交替使用的密集和局部帶狀稀疏注意力機(jī)制、分組多查詢注意力(grouped multi-query attention)、旋轉(zhuǎn)位置嵌入(RoPE)、能夠處理長達(dá)128k的上下文窗口。

      預(yù)訓(xùn)練、后訓(xùn)練方法

      預(yù)訓(xùn)練階段,gpt-oss 在一個(gè)以英文為主、專注于 STEM(科學(xué)、技術(shù)、工程和數(shù)學(xué))、編程及通用知識(shí)的純文本數(shù)據(jù)集上進(jìn)行訓(xùn)練。分詞器用的是跟o4-mini和GPT-4o上使用的相同分詞器o200k_harmony,在GitHub也同時(shí)開源了。在數(shù)據(jù)處理上,OpenAI 特別過濾了與化學(xué)、生物、放射性和核(CBRN)相關(guān)的有害信息,以確保模型的安全性。

      后訓(xùn)練階段,流程與o4-mini類似,包含了監(jiān)督微調(diào)(supervised fine-tuning)和高計(jì)算量的強(qiáng)化學(xué)習(xí)(RL)兩個(gè)核心步驟。這一階段的目標(biāo)是使模型與OpenAI的模型規(guī)范(OpenAIModelSpec)對(duì)齊,并教會(huì)模型使用“思維鏈”(Chain-of-Thought, CoT)進(jìn)行推理和工具使用。一個(gè)有意思的設(shè)計(jì)是,模型支持通過系統(tǒng)消息設(shè)置低、中、高三種不同的推理努力程度。在安全方面,模型通過“審慎對(duì)齊”(deliberative alignment)和“指令層級(jí)”(instruction hierarchy)等技術(shù),學(xué)習(xí)如何拒絕不安全的指令,確保了其在實(shí)際應(yīng)用中的可靠性。

      實(shí)測對(duì)比gpt-oss-20b VS qwen3-30b

      模型好不好用才是最重要的。我們選了兩個(gè)任務(wù)分別測試OpenAI的gpt-oss-20b和阿里的qwen3-30b,分別代表創(chuàng)意寫作和代碼能力。測試環(huán)境是ollama的0.11.2版本(ollama有UI界面了)。

      任務(wù)1:寫一首莎士比亞風(fēng)格的十四行詩

      難點(diǎn):結(jié)構(gòu)和規(guī)律較為復(fù)雜,分為三段四行詩和一個(gè)結(jié)尾的兩行對(duì)句。十四行中每行結(jié)尾韻腳格式通常為abab cdcd efef gg。



      gpt-oss-20b的回答

      思考長達(dá)10分鐘,可以看到“光”“王”“心”“今”等字的重復(fù),而不是韻母重復(fù)。但基本符合十四行詩韻腳規(guī)則。



      qwen3-30b的回答

      思考僅40秒,但第三小部分末尾的“心”“冰”“淪”“空”不符合EFEF的規(guī)則。押韻好得多。

      任務(wù)2:小球旋轉(zhuǎn)碰撞實(shí)驗(yàn)

      難點(diǎn):要寫代碼還要考慮物理規(guī)律

      提示詞:

      生成一個(gè)html文件,展示5個(gè)小球在5層有缺口的同圓心的圓形旋轉(zhuǎn)球殼中的碰撞運(yùn)動(dòng)軌跡。小球出現(xiàn)位置在圓心附近,小球受重力和彈力影響。每層球殼的表面除了缺口占1/10外都是封閉的,而且順時(shí)針和逆時(shí)針每層一一交替。維度設(shè)定是2D



      gpt-oss-20b的回答

      思考時(shí)間長達(dá)11分鐘,球殼沒有缺口,導(dǎo)致球掉不下來。



      qwen3-30b的回答

      思考僅7秒,球殼有缺口,但球也掉不下來。有說明、暫停等額外功能。

      測試下來的整體感受是:

      gpt-oss-20b中文理解不如qwen3-30b,但邏輯能力和穩(wěn)定性尚可,思考時(shí)間較長。gpt-oss-120b能力應(yīng)該會(huì)更好,但是65G的顯存要求讓絕大部分設(shè)備還是沒有嘗試的機(jī)會(huì)。

      至頂AI實(shí)驗(yàn)室洞見

      從這次開源可以看見一些創(chuàng)新之處,gpt-oss采用原生MXFP4精度訓(xùn)練,這是很罕見的。年初DeepSeek R1成功采用FP8混合精度訓(xùn)練已經(jīng)讓大家吃了一驚,原生FP4恐怕只會(huì)更難。

      OpenAI開源的尺寸不夠大,誠意不夠。本次開源的最強(qiáng)模型僅120b,相比其它廠商開源的最強(qiáng)模型都小得多,然而往往模型越大越強(qiáng)。比如,DeepSeek R1有671b,qwen3有235b,kimi k2大約有1040b。

      另外,開源程度還有待提升,相關(guān)技術(shù)報(bào)告沒有公開,技術(shù)細(xì)節(jié)不得而知。

      開頭Sam Altman寫了,gpt-oss是幾十億美金研究的結(jié)果,錢花得值嗎?和MiniMax和DeepSeek花了不到幾百萬美金搞出M1和R1一對(duì)比,不知道是在表達(dá)誠意還是別的什么。

      總的來說,OpenAI模型開源給電腦端的模型增加了一個(gè)選擇,但僅限于文本模型。未來oss開源系列是否還會(huì)有更多模態(tài)的好模型,還需要時(shí)間來驗(yàn)證。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      楊瀚森:深知自身差距,亦在全力追趕,希望我們一起越來越好

      楊瀚森:深知自身差距,亦在全力追趕,希望我們一起越來越好

      懂球帝
      2026-01-01 00:03:05
      002598,被證監(jiān)會(huì)立案!

      002598,被證監(jiān)會(huì)立案!

      每日經(jīng)濟(jì)新聞
      2025-12-31 23:03:18
      CBA排名一夜巨變!上海26分大勝登頂,遼寧四連敗跌出前十?

      CBA排名一夜巨變!上海26分大勝登頂,遼寧四連敗跌出前十?

      民哥臺(tái)球解說
      2026-01-01 06:28:48
      2026新年寄語100句,一起為新年干杯,望所愿皆成,所行皆坦!

      2026新年寄語100句,一起為新年干杯,望所愿皆成,所行皆坦!

      趴窗看雨的小龜
      2025-12-29 08:55:05
      0:6血洗!五星巴西跌下神壇安切洛蒂能否力挽狂瀾拯救桑巴軍團(tuán)?

      0:6血洗!五星巴西跌下神壇安切洛蒂能否力挽狂瀾拯救桑巴軍團(tuán)?

      阿晞體育
      2025-12-31 08:26:09
      申花隊(duì)內(nèi)兩人自宣離隊(duì)

      申花隊(duì)內(nèi)兩人自宣離隊(duì)

      五星體育
      2025-12-31 21:43:25
      龐家后人硬剛新華社!七條質(zhì)疑炸鍋,香港媒體敢報(bào)的真相太炸裂

      龐家后人硬剛新華社!七條質(zhì)疑炸鍋,香港媒體敢報(bào)的真相太炸裂

      滄海一書客
      2025-12-25 19:27:44
      Here we go!羅馬諾:布萊頓將從多特蒙德簽回舊將格羅斯

      Here we go!羅馬諾:布萊頓將從多特蒙德簽回舊將格羅斯

      懂球帝
      2026-01-01 05:32:07
      國足夢碎?中超巨星婉拒歸化:我太老了,沒考慮入籍,以后再說吧

      國足夢碎?中超巨星婉拒歸化:我太老了,沒考慮入籍,以后再說吧

      國足風(fēng)云
      2025-12-31 14:00:07
      “元旦吃3樣,子孫后代旺”,是指哪3樣?今天元旦,別忘了吃

      “元旦吃3樣,子孫后代旺”,是指哪3樣?今天元旦,別忘了吃

      簡食記工作號(hào)
      2026-01-01 00:16:47
      上海:明起存量個(gè)人住房公積金貸款將執(zhí)行新利率

      上海:明起存量個(gè)人住房公積金貸款將執(zhí)行新利率

      澎湃新聞
      2025-12-31 18:37:04
      三亞不香了?東北人撤離成潮,壓垮他們的不是物價(jià),而是生活現(xiàn)實(shí)

      三亞不香了?東北人撤離成潮,壓垮他們的不是物價(jià),而是生活現(xiàn)實(shí)

      歷史有些冷
      2025-12-04 20:20:06
      抖音一哥董宇輝,正跌落神壇~

      抖音一哥董宇輝,正跌落神壇~

      睿觀視界
      2025-12-31 19:30:05
      黎筍之子黎堅(jiān)誠坦言:父親選擇同中國開戰(zhàn),是其畢生最大的失策

      黎筍之子黎堅(jiān)誠坦言:父親選擇同中國開戰(zhàn),是其畢生最大的失策

      磊子講史
      2025-12-24 11:04:05
      書記每次簽字都故意讓我空等3小時(shí),我不急不躁,他晉升時(shí)卻后悔了

      書記每次簽字都故意讓我空等3小時(shí),我不急不躁,他晉升時(shí)卻后悔了

      張道陵秘話
      2025-12-28 12:08:06
      女孩在家被人打傷后續(xù)!被認(rèn)定互毆,警方回應(yīng),上門家長錄音克制

      女孩在家被人打傷后續(xù)!被認(rèn)定互毆,警方回應(yīng),上門家長錄音克制

      奇思妙想草葉君
      2025-12-28 01:17:28
      三折甩賣沒人要!曾經(jīng)的中產(chǎn)鞋王,如今成了智商稅代名詞

      三折甩賣沒人要!曾經(jīng)的中產(chǎn)鞋王,如今成了智商稅代名詞

      青眼財(cái)經(jīng)
      2025-12-31 18:55:30
      曝千萬網(wǎng)紅溫精靈塌房,前合伙人控訴:簽對(duì)賭年賺7000萬協(xié)議

      曝千萬網(wǎng)紅溫精靈塌房,前合伙人控訴:簽對(duì)賭年賺7000萬協(xié)議

      圓夢的小老頭
      2026-01-01 03:12:51
      兒子不聽話,非要娶父母沒退休金的媳婦,現(xiàn)在窮得連房貸都還不起

      兒子不聽話,非要娶父母沒退休金的媳婦,現(xiàn)在窮得連房貸都還不起

      蟬吟槐蕊
      2025-12-31 16:37:41
      騙流量!永州美女老板喊了4個(gè)月的送車口號(hào) 4天現(xiàn)原形+被人罵奸商

      騙流量!永州美女老板喊了4個(gè)月的送車口號(hào) 4天現(xiàn)原形+被人罵奸商

      風(fēng)過鄉(xiāng)
      2025-12-31 09:29:04
      2026-01-01 07:12:49
      至頂AI實(shí)驗(yàn)室 incentive-icons
      至頂AI實(shí)驗(yàn)室
      一個(gè)專注于探索生成式AI前沿技術(shù)及其應(yīng)用的實(shí)驗(yàn)室。
      895文章數(shù) 151關(guān)注度
      往期回顧 全部

      科技要聞

      老羅,演砸了,也封神了?

      頭條要聞

      土耳其宣布對(duì)持普通護(hù)照中國公民免簽

      頭條要聞

      土耳其宣布對(duì)持普通護(hù)照中國公民免簽

      體育要聞

      羅馬諾:內(nèi)馬爾與桑托斯就續(xù)約達(dá)成協(xié)議,合同期至2026年12月

      娛樂要聞

      官宣才兩天就翻車?七七被連環(huán)爆料

      財(cái)經(jīng)要聞

      高培勇:分配制度改革是提振消費(fèi)的抓手

      汽車要聞

      凱迪拉克純電中型SUV 售價(jià)不足24萬/33寸曲面屏

      態(tài)度原創(chuàng)

      本地
      旅游
      教育
      家居
      公開課

      本地新聞

      即將過去的2025年,對(duì)重慶的影響竟然如此深遠(yuǎn)

      旅游要聞

      哈瓦那街巷里的堅(jiān)韌與希望

      教育要聞

      父母常說的3句話,會(huì)嚴(yán)重破壞孩子的內(nèi)動(dòng)力

      家居要聞

      無形有行 自然與靈感詩意

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 富婆熟妇熟女二区三区| 亚洲精品久荜中文字幕| 免费无码又黄又爽又刺激| 日韩人妻综合| 久久久久久AV无码免费网站动漫| 欧美va| 日产一区日产2区| 一本色道久久88亚州精品综合| 国产精品制度丝袜电影| 国产精品亚洲а∨天堂2021| 无码h黄肉动漫在线观看网站| 定兴县| 99色区| 亚洲成av人片天堂网无码| 精产国品一二三产区m553麻豆| 欧美情侣性视频| 青田县| 制服.丝袜.亚洲.中文.综合懂| 视频一区二区不中文字幕| 美女裸体自慰在线观看| 自拍亚洲一区欧美另类| 色小说综合网| 99精品成人| 亚洲中文字幕第二十三页| 色妺妺视频网| 粗了大了 整进去好爽视频| 一区二区三区毛VⅤ| 狠狠撸综合| 成人午夜免费无码视频在线观看| 亚洲精品无码专区| 久久久久久久无码高潮| 成人中文字幕无码| 久久久久久久人妻无码中文字幕爆| 麻豆精品久久久久久久99蜜桃| 无码精品国产一区二区三区免费| 无码人妻丰满熟妇奶水区码| 海城市| 黄瓜视频91| 免费jizz| 免费国产好深啊好涨好硬视频| 一本色道久久爱88av|