![]()
來源:跟著大咖學AI
著名數學家、菲爾茲獲得者陶哲軒在最近的一次視頻訪談中談到AI并發表了自己的觀點。他 認為,訓練和運行大語言模型和其他現代AI所需的數學知識并不高深,本科數學專業的基礎就足夠支撐,核心只需掌握矩陣乘法和基礎微積分。
人類早已掌握大語言模型的搭建、訓練和運行方法,真正的核心難題并非“如何讓模型跑起來”,而是缺乏可靠的理論框架來提前預測其任務表現。
以下相關視頻和文字內容:
『 訓練和運行大語言模型(或其他現代 AI)所需的數學知識并沒有那么復雜。本科數學專業的學生就已經具備了必要的相關知識 —— 本質上,你只需要掌握矩陣乘法和一點微積分就行。
The mathematics required to train and run a large language model (or any other modern AI) isn’t that complicated. An undergraduate math major already has all the necessary prerequisites—basically, you just need to understand matrix multiplication and a bit of calculus.
真正的難點不在于讓這些模型 “如何運行”,我們已經知道怎么構建、訓練和操作大語言模型了。難點在于理論層面我們缺少可靠的方法來評估或預測它們的性能。
The real challenge isn’t how these models run (we know how to build, train, and operate large language models). Instead, the problem lies in theory: we lack a reliable way to evaluate or predict their performance.
讓人意外的是,這些模型在某些任務上表現極佳,在另一些任務上卻效果很差,但我們沒法提前預判哪些任務會是哪種情況。我們甚至連基礎的經驗法則都沒有,只能依賴實證實驗。
What’s surprising is that these models work extremely well for some tasks but poorly for others—and we can’t predict which tasks will fall into which category in advance. We don’t even have basic heuristic rules of thumb for this; we can only rely on empirical experiments.』
視頻來源:
https://www.youtube.com/watch?v=ukpCHo5v-Gc ,油管 ,@DrBrianKeating
閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”
https://wx.zsxq.com/group/454854145828
![]()
未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯網、超級智能,數智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.