<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      斯坦福報告:AI透明度集體倒退!IBM奪冠,馬斯克xAI墊底

      0
      分享至

      最近,美國斯坦福大學等團隊發布了一份名為《2025 年基礎模型透明度指數》(FMTI,The 2025 Foundation Model Transparency Index)的報告。其中,IBM 以透明度得分最高奪冠,xAI 和 Midjourney 則墊底。

      該報告揭示了一種令人擔憂的趨勢:隨著技術的發展,盡管基礎模型在性能等各方面持續進步,但其在數據使用、模型訓練和下游影響等方面的透明度卻出現了集體倒退。

      這是該報告自 2023 年以來發布的第三個年度版本,就像通過量化透明度為各大基礎模型開發者做一次“體檢”。

      本次評估共包括 13 家基礎模型公司,其中既有阿里巴巴、DeepSeek 和馬斯克的 xAI 等首次納入報告的企業,也有 IBM、OpenAI 等老牌科技巨頭。為使評估更全面,今年的報告中還涵蓋了數據獲取、使用數據和監控等方面的新指標。


      (來源:The 2025 Foundation Model Transparency Index)

      從報告的整體結果來看,盡管 2024 年報告顯示模型透明度有短暫的改善,但 2025 年的報告指出,透明度指數正呈現倒退:各基礎模型的平均得分從 2024 年的 58 分下降到 2025 年的 40 分,幾乎與 2023 年報告首次發布時的水平相當(備注:100 分為滿分)。

      報告顯示,公司在其旗艦模型的訓練數據、訓練計算以及模型部署后的使用和影響方面信息披露最為有限。盡管公司在模型能力評估和風險評估方面披露較多,但在方法透明度、第三方參與、可復現性和訓練-測試數據重疊報告方面仍存在挑戰。


      (來源:The 2025 Foundation Model Transparency Index)

      從各公司的表現來看差異明顯,其中 IBM 以 95 分獲得透明度最高得分,xAI 和 Midjourney 得分最低,僅 14 分。中國的兩家公司 DeepSeek 和阿里巴巴在透明度的得分則位于中下游。

      可以看到的是,公司特征和透明度指數在某些程度上存在著一些有趣的關聯,例如開放模型開發者、以企業為中心的 B2B 公司、自行準備透明度報告的公司以及簽署歐盟 AI 法案通用目的 AI 行為準則的公司得分高于平均水平。


      (來源:The 2025 Foundation Model Transparency Index)

      那么,透明度越高就意味著模型越好嗎?

      清華大學邱寒副教授告訴 DeepTech,“這里的透明度不等同于我們常識認為的開源,而是由一系列明確的打分表組成的量化指標——如果不按照這個指標披露相關的數據(而不是什么都沒披露),那么這項指標得分就是 0。”


      以阿里巴巴 Qwen 和 DeepSeek 得分均為 0 的使用數據、影響、部署后監控三項指標為例:它們都各自含有更詳細的評測指標,得分為 0 并不等于什么都沒有披露,而這些計算指標的方法與開源、安全、性能并不能直接劃等號。

      需要了解的是,透明或開源也并不意味著模型性能更好。從這份報告來看,透明度得分最高的模型(IBM 的 Granite 3.3),在實際應用場景種的性能表現并不是最頂尖的那批模型。

      試想一下,如果有一個任務要做,你是會去選擇微調 Qwen3 或 Claude 的 API,還是會因為透明度得分更高而選擇 Granite 3.3?

      邱寒認為,透明度是安全的前提,但必須明確不一定是報告中定義的透明:如果公司拒絕披露任何模型生產相關的信息,比如版權內容、隱私數據的濫用確實難以發掘和確認;模型的偏見和價值觀更難評測,確實會給安全和治理帶來一定的影響。更糟的是,一旦嚴重安全事故發生,還可能引發更粗暴的安全監管策略落地,反而進一步限制了大模型技術的進步。

      該報告提到,隨著全球政策制定者越來越多地要求某些類型的透明度,這項工作揭示了基礎模型開發者的當前透明度狀態,透明度可能如何變化,以及需要更積極的政策干預來解決哪些關鍵信息問題。

      正如邱寒所指出的那樣,黑盒模型的評測技術可以在一定程度上彌補不透明的問題,而當前的透明與否也只是暫時狀態。隨著模型落地的深化和監管機制的完善,最終目標是“公司不需完全公開,但模型行為可測、聲明可證、安全可控”。

      總之,表面上看公司信息披露程度影響透明度,但本質上這需要一種權責歸屬的清晰界定。通過這份報告對透明度倒退的警示,我們需要看到,未來需要構建一種綜合的激勵機制,來理解、評估并最終確保模型的安全與可信。

      參考資料:

      https://arxiv.org/abs/2512.10169

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      太尷尬!某單位一把手調離,在群里發臨別感言,整整2天無人回應

      太尷尬!某單位一把手調離,在群里發臨別感言,整整2天無人回應

      火山詩話
      2025-08-08 15:17:30
      仇英《江南春》之謎要早日查清,這關乎文博機構的公信力|鋒面評論

      仇英《江南春》之謎要早日查清,這關乎文博機構的公信力|鋒面評論

      上觀新聞
      2025-12-18 12:27:05
      哈佛研究發現:情緒不好,不是性格問題,是生理問題。

      哈佛研究發現:情緒不好,不是性格問題,是生理問題。

      小卿情感說
      2025-12-01 23:21:49
      花費1億請趙本山代言,成本2毛騙農戶200億,創始人被判無期徒刑

      花費1億請趙本山代言,成本2毛騙農戶200億,創始人被判無期徒刑

      法老不說教
      2025-12-17 20:08:06
      CCTV5直播,廣東男籃PK廣州龍獅,杜鋒斗法米歇爾,鹿死誰手?

      CCTV5直播,廣東男籃PK廣州龍獅,杜鋒斗法米歇爾,鹿死誰手?

      體壇小快靈
      2025-12-18 16:07:14
      聰明反被聰明誤!本想為女兒鋪路的李湘,卻栽在了何超瓊手里

      聰明反被聰明誤!本想為女兒鋪路的李湘,卻栽在了何超瓊手里

      觀察鑒娛
      2025-12-18 09:43:05
      中央定調,延遲退休實施!男職工2026年1月和5月退休,哪種領的多

      中央定調,延遲退休實施!男職工2026年1月和5月退休,哪種領的多

      八斗小先生
      2025-12-18 14:49:44
      結束了!朱拉尼宣布重磅消息,敘利亞人狂歡:終于不用提心吊膽了

      結束了!朱拉尼宣布重磅消息,敘利亞人狂歡:終于不用提心吊膽了

      沈言論
      2025-12-15 16:15:03
      今晚,珠海全市夜查!

      今晚,珠海全市夜查!

      珠海發布
      2025-12-18 09:41:05
      哈佛大學驚奇發現:壽命和晚飯有關!晚飯吃的越多,活的就越久?

      哈佛大學驚奇發現:壽命和晚飯有關!晚飯吃的越多,活的就越久?

      阿捤武器裝備科普
      2025-12-16 19:00:35
      龍虎局 3:飯店火拼

      龍虎局 3:飯店火拼

      金昔說故事
      2025-12-18 16:25:13
      歷史開了個玩笑,第一個倒下的不是烏克蘭,而是百年中立的瑞士

      歷史開了個玩笑,第一個倒下的不是烏克蘭,而是百年中立的瑞士

      壹知眠羊
      2025-12-15 07:11:38
      A股,兩個利空信號傳來,明天,或將迎來變盤大跳水!

      A股,兩個利空信號傳來,明天,或將迎來變盤大跳水!

      夜深愛雜談
      2025-12-18 16:46:32
      她靠一部劇吃一輩子,二婚嫁小6歲窮小子,如今丈夫紅到讓人嫉妒

      她靠一部劇吃一輩子,二婚嫁小6歲窮小子,如今丈夫紅到讓人嫉妒

      白面書誏
      2025-12-16 18:30:25
      絲芭傳媒發“最后告知”:藝人鞠婧祎涉嫌嚴重經濟犯罪,將擇日全網公開實名舉報!她剛被曝1.39億元收入,還有每月25萬元固定工資

      絲芭傳媒發“最后告知”:藝人鞠婧祎涉嫌嚴重經濟犯罪,將擇日全網公開實名舉報!她剛被曝1.39億元收入,還有每月25萬元固定工資

      每日經濟新聞
      2025-12-18 14:49:08
      中日聯合國激烈交鋒,日本拒絕認錯,中方再下通牒,要求撤回言論

      中日聯合國激烈交鋒,日本拒絕認錯,中方再下通牒,要求撤回言論

      起喜電影
      2025-12-18 14:53:49
      高市早苗連續2天喊話中國,承認自己該反思,希望與中方高層對話

      高市早苗連續2天喊話中國,承認自己該反思,希望與中方高層對話

      南宮一二
      2025-12-18 13:20:50
      轟22+7奪連勝!中國男籃18歲2米03新星留美爆發:手握4所大學邀約

      轟22+7奪連勝!中國男籃18歲2米03新星留美爆發:手握4所大學邀約

      李喜林籃球絕殺
      2025-12-18 13:38:53
      因商業環境惡化,瓜迪奧拉即將永久關閉在曼市開了7年的餐廳

      因商業環境惡化,瓜迪奧拉即將永久關閉在曼市開了7年的餐廳

      懂球帝
      2025-12-18 06:43:09
      江蘇一中學原黨總支書記、校長侵吞“校園餐”,9人被處理

      江蘇一中學原黨總支書記、校長侵吞“校園餐”,9人被處理

      環球網資訊
      2025-12-18 09:25:03
      2025-12-18 18:04:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16011文章數 514408關注度
      往期回顧 全部

      科技要聞

      2025新一代人工智能創業大賽

      頭條要聞

      南京博物院稱受贈5幅畫被鑒定為"假" 捐贈者后人回應

      頭條要聞

      南京博物院稱受贈5幅畫被鑒定為"假" 捐贈者后人回應

      體育要聞

      巴黎首奪世界級冠軍 加冕6冠王比肩巴薩拜仁

      娛樂要聞

      絲芭放大招了!實名舉報鞠婧祎經濟犯罪

      財經要聞

      尹艷林:呼吁加快2.5億新市民落戶進程

      汽車要聞

      在零下30℃的考場里 凡爾賽C5 X和508L拿到了"穩"的證明

      態度原創

      時尚
      數碼
      親子
      本地
      教育

      “棕色大衣”今年冬天又火了,怎么搭都高級時髦

      數碼要聞

      PConline 2025智臻科技獎|年度智臻產品:羅技GPW4小狗電競鼠標

      親子要聞

      寶藍在房間里搭了一個小水池,和爸爸一起玩釣魚游戲,好有趣~

      本地新聞

      云游安徽|決戰烽火照古今,千秋一脈看宿州

      教育要聞

      有料青年 | 主打吃魚!上海食品專業位列第一的竟然是上海海洋大學

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 人妻aⅴ无码一区二区三区| 亚洲成人性爱网站| 无限A片| 精品亚洲天堂| 2018天天拍拍天天爽视频| 欧美性猛交ⅹxxx乱大交妖精| 国产精品无码素人福利不卡| 国产老熟女伦老熟妇露脸| 怀宁县| 蜜桃精品成人影片| 免费看欧美成人a片无码| 中文字幕+乱码+中文乱码91| 国产成人A片| 亚洲熟妇丰满多毛xxxx| 亚洲欧美日本韩国| 国产亚洲无线码一区二区| 亚洲AV第一页| 日本丰满少妇裸体自慰| 五月婷婷开心中文字幕| 精品国产欧美一区二区三区在线| 在线视频A| 国产精品鲁鲁鲁| 欧美日韩精品一区二区在线观看| 最新午夜男女福利片视频| 亚洲男人天堂网| 无码纯肉视频在线观看| 国产精品无码专区在线播放| 蜜臀午夜一区二区在线播放| 91人妻人人澡人人爽人人精品| 国产美女高潮流白浆视频| 欧美偷拍视频| 成人国产亚洲精品天堂AV| 国产99免费视频| 三男一女吃奶添下面视频| 亚洲国产午夜精品理论片| 69人妻人人澡人人爽人人精品| 亚洲综合色在线| 性色av免费观看| 亚洲精品日本久久久中文字幕| 国产精品电影久久| 少妇一边呻吟一边说使劲视频|