★加星zzllrr小樂公眾號數學科普不迷路!
《量子雜志》每周都會闡釋推動現代研究發展的重要理念之一。本周,計算機科學專欄作家Ben Brubaker將為你解讀計算機科學家為何尋求更好的方法來計算矩陣乘法。
![]()
圖源:量子雜志Quanta Magazine
作者:Ben Brubaker(量子雜志計算機科學專欄作家)2025-6-30
譯者:zzllrr小樂(數學科普公眾號)2025-7-1
1925年夏天,年輕的物理學家維爾納·海森堡(Werner Heisenberg)前往偏遠的黑爾戈蘭島,尋求緩解季節性過敏癥狀。10天后,他帶著一個方程回來,這個方程現在是量子物理學理論的核心。
雖然該方程正確地預測了實驗結果,但只有一個問題:它涉及操縱數字表的奇怪規則。海森堡本人不知道該如何看待數學,直到他的導師馬克斯·玻恩(Max Born)將這些表格識別為當時晦澀難懂的數學對象,稱為矩陣(matrices)。
一百年后,矩陣絕非晦澀難懂。它們在科學和技術方面有無數的應用,從基礎物理學到計算機圖形學再到人工智能。尋找更好的矩陣乘法算法是計算機科學中最具標志性的問題之一。
矩陣來自稱為線性代數(linear algebra)的數學分支,它研究涉及多個變量的簡單方程。線性代數中的中心數學對象(稱為向量vector)是描述系統特定性質的數字列表:對象的空間方向、量子粒子的狀態,甚至是單詞的含義 https://www.quantamagazine.org/how-embeddings-encode-what-words-mean-sort-of-20240918/ 。
矩陣是二維數字表,表示將一個向量轉換為另一個向量的過程。在最簡單的情況下,矩陣可能表示旋轉對象的特定方式。但矩陣也可以表示更奇特的變換。在物理學中,它們描述了量子態如何隨時間演變。在計算機科學中,它們控制著ChatGPT等AI模型在給定輸入時如何生成輸出。
如果有兩個連續的變換,則需要將相應的矩陣相乘,這涉及到以特定組合將它們的元素相加和相乘。但是,當應用于大型矩陣(如AI模型中使用的矩陣)時,這種標準方法會變得非常緩慢。研究人員的目標是設計更好的矩陣乘法算法,也就是使用更高效的步驟序列獲得與標準方法相同的答案的過程。50多年來,對更好算法的追求一直是一個豐富的研究脈絡。
新增的和值得注意的內容
矩陣乘法算法的研究始于1969年,當時數學家Volker Strassen發現了一種計算2×2矩陣乘積的方法,該方法只需將其元素的特定組合做7次乘法,而標準程序則為8次。
這聽起來可能并不多,但是當你反復將大矩陣切成較小的塊并每次都應用Strassen算法時,乘法步驟就會減少一個。Strassen的發現開啟了長達數十年的尋找最佳算法的序幕,用于非常大的矩陣相乘。
2021年,Kevin Hartnett調查了矩陣乘法算法的歷史 https://www.quantamagazine.org/mathematicians-inch-closer-to-matrix-multiplication-goal-20210323/ 和最新發展。去年,Steve Nadis報告了一種新方法 https://www.quantamagazine.org/new-breakthrough-brings-matrix-multiplication-closer-to-ideal-20240307/ ,該方法產生了十多年來最大的改進。
一些研究人員采用不同的方法來搜索矩陣乘法算法。他們不是試圖為大型矩陣尋找最佳算法,而是尋求在較小比例下工作的更好方法,例如4×4或5×5矩陣。2022年,Google DeepMind的研究人員使用一種全新的定性方法為這項工作做出了重大貢獻:
他們訓練了一個名為AlphaTensor的AI系統來自動搜索矩陣乘法算法,并發現了在一些特殊情況下效果更好的算法。在我作為計算機科學記者的第一個故事 https://www.quantamagazine.org/ai-reveals-new-possibilities-in-matrix-multiplication-20221123/ 中報道了這個結果。量子雜志還制作了一段視頻,探討了AlphaTensor的搜索工作原理 https://www.youtube.com/watch?v=fDAPJ7rvcUw 。
歸根結底,研究人員研究矩陣乘法,因為它是解決線性代數問題的成熟方法。但這并不是唯一的方法。
2021年,Hartnett報告說,在某些情況下,利用隨機性力量 https://www.linkedin.com/pulse/counterintuitive-power-randomness-quanta-magazine-riaoe/ 的替代方法 https://www.quantamagazine.org/new-algorithm-breaks-speed-limit-for-solving-linear-equations-20210308/ 比最著名的矩陣乘法算法略快。
這可能是一個小的改進,但它說明了矩陣乘法算法的研究仍然充滿驚喜。正如計算機科學家周任飛在接受Nadis采訪時所說,“人們仍處于理解這個古老問題的早期階段。”
![]()
計算機科學家周任飛
網絡上的報道
來自YouTube頻道3Blue1Brown的這個視頻系列 https://www.3blue1brown.com/topics/linear-algebra 是對線性代數和矩陣的精彩介紹。
數學教育家Trefor Bazett發布了一個很好的視頻, https://www.youtube.com/watch?v=sZxjuT1kUd0 介紹了Strassen的矩陣乘法算法。
5月,IEEE Spectrum報告了Google DeepMind推出的一款名為AlphaEvolve的新型通用AI系統 https://spectrum.ieee.org/deepmind-alphaevolve ,該系統發現了比AlphaTensor更好的矩陣乘法算法。
參考資料
https://mailchi.mp/quantamagazine.org/the-mystery-of-the-muon-4866944
https://www.quantamagazine.org/how-embeddings-encode-what-words-mean-sort-of-20240918/
https://www.quantamagazine.org/mathematicians-inch-closer-to-matrix-multiplication-goal-20210323/
https://www.quantamagazine.org/new-breakthrough-brings-matrix-multiplication-closer-to-ideal-20240307/
https://www.quantamagazine.org/ai-reveals-new-possibilities-in-matrix-multiplication-20221123/
https://www.youtube.com/watch?v=fDAPJ7rvcUw
https://www.linkedin.com/pulse/counterintuitive-power-randomness-quanta-magazine-riaoe/
https://www.quantamagazine.org/new-algorithm-breaks-speed-limit-for-solving-linear-equations-20210308/
https://www.3blue1brown.com/topics/linear-algebra
https://www.youtube.com/watch?v=sZxjuT1kUd0
https://spectrum.ieee.org/deepmind-alphaevolve
出版社和作家自薦通道
小樂數學科普薦書
小樂數學科普近期文章
·開放 · 友好 · 多元 · 普適 · 守拙·![]()
讓數學
更加
易學易練
易教易研
易賞易玩
易見易得
易傳易及
歡迎評論、點贊、在看、在聽
收藏、分享、轉載、投稿
查看原始文章出處
點擊zzllrr小樂
公眾號主頁
加星★
數學科普不迷路!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.