<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      神經網絡把數據"揉面團":3層變換后,線性不可分變一刀兩斷

      0
      分享至

      2024年,全球AI訓練算力消耗了相當于1.2個三峽電站的年發電量。但問一個從業者"模型到底學到了什么",多半會聽到"學習模式"這種正確的廢話——就像說廚師"處理食材",說了等于沒說。

      Medium作者Faisal Shahzad提出一個更鋒利的視角:神經網絡不是在學權重,而是在重塑數據所在的空間本身。這個解釋讓"學習"二字從抽象動詞變成了可觀察的幾何操作。

      兩層數據混在一起,為什么直線切不開

      想象一個二分類問題:紅點和藍點交錯分布,像打翻的調色盤。用一條直線分割?不可能。這就是經典的"異或問題"(XOR),1969年Minsky和Papert正是用它證明了單層感知機的致命缺陷。

      但人類直覺知道這些點"應該"能被分開。問題不在數據,在工具——直線太僵硬了。你需要的是把空間本身擰一把,讓原本纏在一起的兩類點,在新的坐標系里變得涇渭分明。

      神經網絡做的就是這個。每一層隱藏層都在對空間施加一次非線性變換:某些方向被拉長,某些被壓扁,整體旋轉、彎曲、重新折疊。單看一層變化不大,但多層堆疊后,原本線性不可分的數據會被逐步"梳理"成可用超平面分割的形態。

      Shahzad把這個過程比作揉面團。原始數據是混著芝麻和核桃的面團,目標是讓芝麻聚成一團、核桃聚成另一團。每層網絡像一次揉壓——不是把芝麻挑出來,而是改變面團內部的相對位置關系。

      權重更新 vs 空間變形:同一枚硬幣的兩面

      傳統解釋聚焦權重更新:損失函數算誤差,反向傳播調參數,預測準確率慢慢爬升。這沒錯,但只描述了"怎么做",沒回答"做什么"。

      幾何視角把兩者統一了。權重矩陣的每一次調整,都對應著對輸入空間的一次線性變換(旋轉+縮放);激活函數(如ReLU、Sigmoid)則引入非線性彎曲。線性+非線性的交替,讓網絡獲得了"揉面團"的能力。

      可視化工具如TensorBoard的Embedding Projector能直接觀察這個過程。MNIST手寫數字的784維原始空間混沌一片,經過幾層網絡后,相同數字的向量在降維投影中明顯聚類。空間被重塑了,分類邊界自然浮現。

      這個視角還能解釋過擬合的本質:網絡對訓練數據的空間變形"過度定制",導致新數據進來時找不到對應位置。正則化技術如Dropout,相當于在揉面團時隨機按住某些部位不讓動,強制網絡學習更魯棒的空間結構。

      從"特征提取"到"表征學習":術語背后的認知升級

      早期文獻愛說"隱藏層學習特征",暗示網絡在識別邊緣、紋理、形狀等人類可理解的視覺元素。這在卷積神經網絡(CNN)的前幾層確實成立——第一層可能學到Gabor濾波器式的邊緣檢測器。

      但深層網絡學到的"特征"越來越抽象,人類難以命名。幾何視角繞過了這個困境:不必糾結特征是否可解釋,只需觀察空間是否被重塑到"可分"狀態。表征學習(Representation Learning)這個術語的流行,正是這種認知遷移的標志。

      Transformer架構把這個邏輯推向極致。自注意力機制(Self-Attention)不是在局部滑動窗口提取特征,而是動態計算token間的關聯權重,相當于為每個輸入樣本定制專屬的空間變形方案。BERT、GPT系列的成功,驗證了"靈活的空間重塑"比"固定的特征模板"更強大。

      Shahzad在文中坦承,這個視角他"希望有人早點解釋給自己"。很多從業者困在權重矩陣的數值迷宮里,忘了抬頭看數據點在空間中的流動軌跡。

      一個未被回答的問題

      幾何視角漂亮地解釋了"神經網絡如何工作",但留下了更深的謎題:為什么這種特定的空間重塑策略——分層非線性變換——在幾乎所有數據類型上都有效?圖像、文本、蛋白質結構、棋局狀態,看似無關的領域,為何共享同一種"揉面團"的數學結構?

      這是表示學習(Representation Learning)領域的核心追問。有研究者猜測,真實世界的數據分布本身具有層次化、組合式的結構,恰好與深度網絡的層級架構共振。也有人從神經正切核(Neural Tangent Kernel)角度,把訓練過程近似為核方法的空間映射。

      但尚無定論。就像我們知道飛機能飛是因為機翼產生升力,卻仍在爭論"為什么空氣分子會這樣集體行動"。

      你在訓練模型時,會可視化隱藏層的空間分布嗎?還是只盯著損失曲線上的那個數字?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      男孩偷自行車后續:被通報全校社死,寶媽拒不道歉,婆婆主動賠罪

      男孩偷自行車后續:被通報全校社死,寶媽拒不道歉,婆婆主動賠罪

      潮鹿逐夢
      2026-04-07 11:42:53
      張雪公布自己設計的跨界踏板車設計圖,最新回應:正在制作踏板摩托,這款踏板偏運動越野風格,售價可能比傳統的貴一點

      張雪公布自己設計的跨界踏板車設計圖,最新回應:正在制作踏板摩托,這款踏板偏運動越野風格,售價可能比傳統的貴一點

      魯中晨報
      2026-04-07 17:13:05
      事故調查報告:湖南湘潭一致3死爆燃事故,公司負責人因盲目救火遇難

      事故調查報告:湖南湘潭一致3死爆燃事故,公司負責人因盲目救火遇難

      澎湃新聞
      2026-04-07 17:04:26
      遲重瑞妻子陳麗華去世,溫馨全家福曝光,4個兒女都很優秀

      遲重瑞妻子陳麗華去世,溫馨全家福曝光,4個兒女都很優秀

      180視角
      2026-04-07 14:19:49
      郭艾倫正式辟謠:我沒有被騙 被詐騙是造謠 要追究法律責任

      郭艾倫正式辟謠:我沒有被騙 被詐騙是造謠 要追究法律責任

      醉臥浮生
      2026-04-07 13:50:59
      晚點獨家丨Kimi 計劃提前 1 年授予 27 屆頂尖人才期權

      晚點獨家丨Kimi 計劃提前 1 年授予 27 屆頂尖人才期權

      晚點LatePost
      2026-04-03 11:58:07
      鄭麗文剛落地上海,就傳出不尋常信號!6天后,兩岸會有大動作?

      鄭麗文剛落地上海,就傳出不尋常信號!6天后,兩岸會有大動作?

      閆樹軍論評
      2026-04-07 16:29:13
      賽力斯:公司不承擔其他品牌門店的建店、運營相關費用

      賽力斯:公司不承擔其他品牌門店的建店、運營相關費用

      每日經濟新聞
      2026-04-07 15:53:45
      人工智能+金融:打造數字化轉型新引擎

      人工智能+金融:打造數字化轉型新引擎

      Daily每日財報
      2026-02-06 11:42:54
      鄭麗文率團抵達上海開啟大陸參訪行程

      鄭麗文率團抵達上海開啟大陸參訪行程

      環球網資訊
      2026-04-07 13:18:07
      美拯救大兵“Bravo”更多驚險細節曝光:靠尋呼機式定位器求救,回答私密問題驗身

      美拯救大兵“Bravo”更多驚險細節曝光:靠尋呼機式定位器求救,回答私密問題驗身

      紅星新聞
      2026-04-07 13:13:17
      美國第一夫人梅拉尼婭竟聲稱“開戰是為了伊朗兒童的未來”,網友怒嗆:所以把他們炸死?

      美國第一夫人梅拉尼婭竟聲稱“開戰是為了伊朗兒童的未來”,網友怒嗆:所以把他們炸死?

      極目新聞
      2026-04-07 13:50:54
      安徽6歲女童遇害:兇手報復下黑手,兩次轉移遺體,搜救細節曝光

      安徽6歲女童遇害:兇手報復下黑手,兩次轉移遺體,搜救細節曝光

      眼光很亮
      2026-04-07 11:17:56
      突發! 沙特遭襲 年產量約6000萬噸 石化基地發生爆炸

      突發! 沙特遭襲 年產量約6000萬噸 石化基地發生爆炸

      每日經濟新聞
      2026-04-07 10:18:32
      971萬對1616萬!幼兒園新生暴跌40%,2027年小學招生只剩50%——

      971萬對1616萬!幼兒園新生暴跌40%,2027年小學招生只剩50%——

      葉初七
      2026-04-07 11:02:01
      難以置信!上海一女生宿舍曝光,紙巾都被貼上名字,掛在專屬位置

      難以置信!上海一女生宿舍曝光,紙巾都被貼上名字,掛在專屬位置

      火山詩話
      2026-04-07 07:20:47
      第2架!美包機飛抵臺灣省,鄭麗文趕在來滬前,用英語通告全世界

      第2架!美包機飛抵臺灣省,鄭麗文趕在來滬前,用英語通告全世界

      書紀文譚
      2026-04-07 16:06:19
      陳麗華因病去世,病情曝光!

      陳麗華因病去世,病情曝光!

      陳意小可愛
      2026-04-07 13:33:25
      監控系統出現漏洞,300多人 被帶走?海康威視回應

      監控系統出現漏洞,300多人 被帶走?海康威視回應

      每日經濟新聞
      2026-04-07 15:06:19
      “最后期限”將至,特朗普的底牌已被看穿 | 京釀館

      “最后期限”將至,特朗普的底牌已被看穿 | 京釀館

      新京報
      2026-04-07 12:09:08
      2026-04-07 18:47:00
      Ping值焦慮
      Ping值焦慮
      有態度網友ytd
      827文章數 20關注度
      往期回顧 全部

      科技要聞

      滿嘴謊言!OpenAI奧特曼黑料大起底

      頭條要聞

      英媒:伊朗最高領袖病重昏迷 無法參與任何國家決策

      頭條要聞

      英媒:伊朗最高領袖病重昏迷 無法參與任何國家決策

      體育要聞

      官宣簽約“AI球員”,這支球隊被罵慘了...

      娛樂要聞

      女首富陳麗華離世 被曝生前已分好遺產

      財經要聞

      10萬億財政轉移支付,被誰拿走了?

      汽車要聞

      不止是大 極狐首款MPV問道V9靜態體驗

      態度原創

      游戲
      本地
      時尚
      教育
      公開課

      勁爆大雷新作與你共探神秘小樹林 面紅嬌羞白天可別玩

      本地新聞

      跟著歌聲游安徽,聽古村回響

      楊超越之后,全網頭像錦鯉的C位被她搶走了

      教育要聞

      可樂、魚腥草進教室…武漢商學院這堂“食品感官分析”課,夯爆了

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版