<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

      斯坦福報(bào)告:AI透明度集體倒退!IBM奪冠,馬斯克xAI墊底

      0
      分享至

      最近,美國斯坦福大學(xué)等團(tuán)隊(duì)發(fā)布了一份名為《2025 年基礎(chǔ)模型透明度指數(shù)》(FMTI,The 2025 Foundation Model Transparency Index)的報(bào)告。其中,IBM 以透明度得分最高奪冠,xAI 和 Midjourney 則墊底。

      該報(bào)告揭示了一種令人擔(dān)憂的趨勢:隨著技術(shù)的發(fā)展,盡管基礎(chǔ)模型在性能等各方面持續(xù)進(jìn)步,但其在數(shù)據(jù)使用、模型訓(xùn)練和下游影響等方面的透明度卻出現(xiàn)了集體倒退。

      這是該報(bào)告自 2023 年以來發(fā)布的第三個(gè)年度版本,就像通過量化透明度為各大基礎(chǔ)模型開發(fā)者做一次“體檢”。

      本次評(píng)估共包括 13 家基礎(chǔ)模型公司,其中既有阿里巴巴、DeepSeek 和馬斯克的 xAI 等首次納入報(bào)告的企業(yè),也有 IBM、OpenAI 等老牌科技巨頭。為使評(píng)估更全面,今年的報(bào)告中還涵蓋了數(shù)據(jù)獲取、使用數(shù)據(jù)和監(jiān)控等方面的新指標(biāo)。


      (來源:The 2025 Foundation Model Transparency Index)

      從報(bào)告的整體結(jié)果來看,盡管 2024 年報(bào)告顯示模型透明度有短暫的改善,但 2025 年的報(bào)告指出,透明度指數(shù)正呈現(xiàn)倒退:各基礎(chǔ)模型的平均得分從 2024 年的 58 分下降到 2025 年的 40 分,幾乎與 2023 年報(bào)告首次發(fā)布時(shí)的水平相當(dāng)(備注:100 分為滿分)。

      報(bào)告顯示,公司在其旗艦?zāi)P偷挠?xùn)練數(shù)據(jù)、訓(xùn)練計(jì)算以及模型部署后的使用和影響方面信息披露最為有限。盡管公司在模型能力評(píng)估和風(fēng)險(xiǎn)評(píng)估方面披露較多,但在方法透明度、第三方參與、可復(fù)現(xiàn)性和訓(xùn)練-測試數(shù)據(jù)重疊報(bào)告方面仍存在挑戰(zhàn)。


      (來源:The 2025 Foundation Model Transparency Index)

      從各公司的表現(xiàn)來看差異明顯,其中 IBM 以 95 分獲得透明度最高得分,xAI 和 Midjourney 得分最低,僅 14 分。中國的兩家公司 DeepSeek 和阿里巴巴在透明度的得分則位于中下游。

      可以看到的是,公司特征和透明度指數(shù)在某些程度上存在著一些有趣的關(guān)聯(lián),例如開放模型開發(fā)者、以企業(yè)為中心的 B2B 公司、自行準(zhǔn)備透明度報(bào)告的公司以及簽署歐盟 AI 法案通用目的 AI 行為準(zhǔn)則的公司得分高于平均水平。


      (來源:The 2025 Foundation Model Transparency Index)

      那么,透明度越高就意味著模型越好嗎?

      清華大學(xué)邱寒副教授告訴 DeepTech,“這里的透明度不等同于我們常識(shí)認(rèn)為的開源,而是由一系列明確的打分表組成的量化指標(biāo)——如果不按照這個(gè)指標(biāo)披露相關(guān)的數(shù)據(jù)(而不是什么都沒披露),那么這項(xiàng)指標(biāo)得分就是 0。”


      以阿里巴巴 Qwen 和 DeepSeek 得分均為 0 的使用數(shù)據(jù)、影響、部署后監(jiān)控三項(xiàng)指標(biāo)為例:它們都各自含有更詳細(xì)的評(píng)測指標(biāo),得分為 0 并不等于什么都沒有披露,而這些計(jì)算指標(biāo)的方法與開源、安全、性能并不能直接劃等號(hào)。

      需要了解的是,透明或開源也并不意味著模型性能更好。從這份報(bào)告來看,透明度得分最高的模型(IBM 的 Granite 3.3),在實(shí)際應(yīng)用場景種的性能表現(xiàn)并不是最頂尖的那批模型。

      試想一下,如果有一個(gè)任務(wù)要做,你是會(huì)去選擇微調(diào) Qwen3 或 Claude 的 API,還是會(huì)因?yàn)橥该鞫鹊梅指叨x擇 Granite 3.3?

      邱寒認(rèn)為,透明度是安全的前提,但必須明確不一定是報(bào)告中定義的透明:如果公司拒絕披露任何模型生產(chǎn)相關(guān)的信息,比如版權(quán)內(nèi)容、隱私數(shù)據(jù)的濫用確實(shí)難以發(fā)掘和確認(rèn);模型的偏見和價(jià)值觀更難評(píng)測,確實(shí)會(huì)給安全和治理帶來一定的影響。更糟的是,一旦嚴(yán)重安全事故發(fā)生,還可能引發(fā)更粗暴的安全監(jiān)管策略落地,反而進(jìn)一步限制了大模型技術(shù)的進(jìn)步。

      該報(bào)告提到,隨著全球政策制定者越來越多地要求某些類型的透明度,這項(xiàng)工作揭示了基礎(chǔ)模型開發(fā)者的當(dāng)前透明度狀態(tài),透明度可能如何變化,以及需要更積極的政策干預(yù)來解決哪些關(guān)鍵信息問題。

      正如邱寒所指出的那樣,黑盒模型的評(píng)測技術(shù)可以在一定程度上彌補(bǔ)不透明的問題,而當(dāng)前的透明與否也只是暫時(shí)狀態(tài)。隨著模型落地的深化和監(jiān)管機(jī)制的完善,最終目標(biāo)是“公司不需完全公開,但模型行為可測、聲明可證、安全可控”。

      總之,表面上看公司信息披露程度影響透明度,但本質(zhì)上這需要一種權(quán)責(zé)歸屬的清晰界定。通過這份報(bào)告對透明度倒退的警示,我們需要看到,未來需要構(gòu)建一種綜合的激勵(lì)機(jī)制,來理解、評(píng)估并最終確保模型的安全與可信。

      參考資料:

      https://arxiv.org/abs/2512.10169

      運(yùn)營/排版:何晨龍

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      看了李宗翰的臉,我才讀懂梁朝偉皺紋里的八千種情緒有多貴

      看了李宗翰的臉,我才讀懂梁朝偉皺紋里的八千種情緒有多貴

      娛樂圈十三太保
      2025-12-17 16:39:44
      卸任6年后,新疆維吾爾自治區(qū)檢察院原黨組書記郭連山被查

      卸任6年后,新疆維吾爾自治區(qū)檢察院原黨組書記郭連山被查

      中國青年報(bào)
      2025-12-17 21:00:08
      繳獲中制先進(jìn)武器后,泰國在野黨沖到大使館,要求中方給個(gè)解釋

      繳獲中制先進(jìn)武器后,泰國在野黨沖到大使館,要求中方給個(gè)解釋

      頭條爆料007
      2025-12-16 21:14:22
      細(xì)思極恐!已經(jīng)動(dòng)手了!

      細(xì)思極恐!已經(jīng)動(dòng)手了!

      大嘴說天下
      2025-12-17 20:44:39
      尼克松訪華,毛主席只送了4兩茶葉被嫌棄?周總理笑著說出4個(gè)字,美國總統(tǒng)立馬變了臉色

      尼克松訪華,毛主席只送了4兩茶葉被嫌棄?周總理笑著說出4個(gè)字,美國總統(tǒng)立馬變了臉色

      文史明鑒
      2025-12-13 22:15:21
      吳敬中死前對余則成說:"在天津找穿藍(lán)旗袍的女人,她知道你身份"

      吳敬中死前對余則成說:"在天津找穿藍(lán)旗袍的女人,她知道你身份"

      飯小妹說歷史
      2025-12-16 16:38:39
      月薪三萬都讀不起深圳高中?雙休+不補(bǔ)課,已讓中產(chǎn)家庭瀕臨崩潰

      月薪三萬都讀不起深圳高中?雙休+不補(bǔ)課,已讓中產(chǎn)家庭瀕臨崩潰

      妍妍教育日記
      2025-12-17 19:28:20
      61歲何晴離世僅3天,同學(xué)透露她一生遺憾!意外導(dǎo)致無法體面退休

      61歲何晴離世僅3天,同學(xué)透露她一生遺憾!意外導(dǎo)致無法體面退休

      銀河史記
      2025-12-16 16:13:16
      賣房時(shí)宣傳樓下有“百畝公園”,收房后“公園”變一條草地?住建局:置業(yè)顧問口頭宣傳,個(gè)人行為

      賣房時(shí)宣傳樓下有“百畝公園”,收房后“公園”變一條草地?住建局:置業(yè)顧問口頭宣傳,個(gè)人行為

      大風(fēng)新聞
      2025-12-17 20:42:04
      徐正源遭炮轟:蓉城成功靠輸血!吃資源喜歡鬧事,豪門不會(huì)考慮他

      徐正源遭炮轟:蓉城成功靠輸血!吃資源喜歡鬧事,豪門不會(huì)考慮他

      奧拜爾
      2025-12-17 18:07:23
      鄭欽文再斬WTA年度獎(jiǎng)項(xiàng)!

      鄭欽文再斬WTA年度獎(jiǎng)項(xiàng)!

      網(wǎng)球之家
      2025-12-16 23:01:34
      吳忠警方通報(bào):第一時(shí)間啟動(dòng)核查,涉事警務(wù)人員已被停職

      吳忠警方通報(bào):第一時(shí)間啟動(dòng)核查,涉事警務(wù)人員已被停職

      新京報(bào)政事兒
      2025-12-17 19:54:07
      科普:北京首鋼安排35歲方碩打潛力賽并非笑話,5個(gè)30+指日可待

      科普:北京首鋼安排35歲方碩打潛力賽并非笑話,5個(gè)30+指日可待

      體壇野秀才
      2025-12-17 23:42:15
      中國移動(dòng)陳濤已被撤職!

      中國移動(dòng)陳濤已被撤職!

      通信頭條
      2025-12-17 21:11:12
      整個(gè)社會(huì)都在喊沒錢?看懂日本通縮30年,就知道普通人如何翻身了

      整個(gè)社會(huì)都在喊沒錢?看懂日本通縮30年,就知道普通人如何翻身了

      博覽歷史
      2025-10-08 17:02:11
      問界M6:攜鈉離子電池與華為ADS 4.0,定位25萬級(jí)SUV

      問界M6:攜鈉離子電池與華為ADS 4.0,定位25萬級(jí)SUV

      藍(lán)色海邊
      2025-12-17 14:29:34
      喜訊!兩位久違強(qiáng)援確定明年回上港,都是穆斯卡剛接手時(shí)力捧的人

      喜訊!兩位久違強(qiáng)援確定明年回上港,都是穆斯卡剛接手時(shí)力捧的人

      振剛說足球
      2025-12-17 11:16:24
      全新一代奧迪A6L實(shí)車現(xiàn)身,外觀漂亮,尺寸提升,配3.0T V6和2.0T

      全新一代奧迪A6L實(shí)車現(xiàn)身,外觀漂亮,尺寸提升,配3.0T V6和2.0T

      紅濤說車
      2025-12-17 21:01:38
      新官上任三把火!邵佳一野心暴露,確立3大目標(biāo),20歲新秀受重視

      新官上任三把火!邵佳一野心暴露,確立3大目標(biāo),20歲新秀受重視

      國足風(fēng)云
      2025-12-17 07:30:11
      要是中日真開戰(zhàn),中國老百姓會(huì)不會(huì)遭殃?會(huì),但只是小部分會(huì)

      要是中日真開戰(zhàn),中國老百姓會(huì)不會(huì)遭殃?會(huì),但只是小部分會(huì)

      我心縱橫天地間
      2025-12-05 11:25:34
      2025-12-18 01:08:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評(píng)論獨(dú)家合作
      16010文章數(shù) 514406關(guān)注度
      往期回顧 全部

      科技要聞

      特斯拉值1.6萬億靠畫餅 Waymo值千億靠跑單

      頭條要聞

      捐贈(zèng)博物館價(jià)值8800萬的名畫現(xiàn)身拍賣市場 捐贈(zèng)方發(fā)聲

      頭條要聞

      捐贈(zèng)博物館價(jià)值8800萬的名畫現(xiàn)身拍賣市場 捐贈(zèng)方發(fā)聲

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      狗仔曝?zé)岵〗愕軕僬嬲劻耍浚浚?/h3>

      財(cái)經(jīng)要聞

      重磅信號(hào)!收入分配制度或迎重大突破

      汽車要聞

      一車多動(dòng)力+雙姿態(tài) 長城歐拉5上市 限時(shí)9.18萬元起

      態(tài)度原創(chuàng)

      家居
      本地
      親子
      時(shí)尚
      藝術(shù)

      家居要聞

      溫馨獨(dú)棟 駝色與淺色碰撞

      本地新聞

      云游安徽|踏過戰(zhàn)壕與石板,讀一部活的淮北史

      親子要聞

      撒潑打滾的娃媽媽只有一早就制服了

      你算老幾?我算老己!

      藝術(shù)要聞

      毛主席書寫林則徐詩詞,字跡超凡,引發(fā)關(guān)注。

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 日本毛茸茸的丰满熟妇| 国产成人高清精品免费软件| 中文字幕无码精品亚洲35| 亚洲无码一二| 国产精品第四页| 99国产精品在线观看| 777米奇色狠狠888俺也去乱| 亚洲原创无码| 无玛视频| 国产成人一区二区三区A片免费| 风韵丰满熟妇啪啪区老熟熟女| av一本久道久久综合久久鬼色| 狠狠躁夜夜躁人人爽蜜桃| 成人日韩亚洲| 性无码一区二区三区在线观看| 成人免费无码大片a毛片软件 | 亚洲成av人片天堂网无码| 国产免费自拍视频| 久草资源在线| aa性欧美老妇人牲交免费| 亚洲色无码中文字幕| 黑人玩弄人妻中文在线| 乱伦日屄| 躁躁躁日日躁| 香蕉97超级碰碰碰免费公开| 国产360激情盗摄全集| 国产jizzjizz视频| 丝袜老师办公室里做好紧好爽| 欧美国产综合视频| 精品人妻一区介绍| 日韩精品人妻中文字| 日韩人妻一区二区三区蜜桃视频 | 夜夜添狠狠添高潮出水| 超碰人人干| 亚洲爆乳精品无码一区二区三区| 成人无码av一区二区| 老司机性色福利精品视频| 极品国模无码国产在线观看| 国产女高清在线看免费观看| 狠狠躁天天躁夜夜躁婷婷| 中文字幕在线观看亚洲|