<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      谷歌大腦之父訪談首次曝光一個秘密!茶水間一次閑聊引爆了一個萬億帝國!

      0
      分享至

      谷歌大腦之父首次訪談曝光!

      茶水間閑聊引爆萬億帝國,

      AI自我突破觸及門檻


      來源:新智元

      【導讀】剛剛,AI界傳奇Jeff Dean深度訪談重磅放出!作為谷歌大腦奠基人、TensorFlow與TPU背后的關鍵推手,他親述了這場神經網絡革命的非凡歷程。

      剛剛,「現代互聯網架構之父」Jeff Dean最新對談流出。

      這位AI領域的傳奇,是Google Brain的奠基者,也是推動神經網絡走向規模化的關鍵人物。

      從讓神經網絡「看懂貓」的重大突破,到TensorFlow與TPU的誕生,他的故事幾乎是一部AI發展史。

      最新一期「登月播客」(The Moonshot podcast)深度訪談中Jeff Dean回顧了個人成長經歷、Google Brain的早期故事,以及他對AI未來的思考


      節目中,他揭秘了他本人所知的一些細節和趣事:

      · 小時候,Jeff Dean打印了400頁源碼自學。

      · 90年代,他提出「數據并行/模型并行」概念時,還沒這些術語。

      · Google Brain的最初靈感,竟然是在谷歌的微型茶水間與吳恩達的一次閑聊中誕生。

      · 「平均貓」圖像的誕生,被Jeff比作「在大腦里找到了觸發祖母記憶的神經元」。

      · 他把AI模型比作「蘇格拉底式伙伴」,能陪伴推理、辯論,而不是單向工具。

      · 對未來的隱喻:「一億老師,一個學生」,人類不斷教AI模型,所有人都能受益。

      超級工程師,早已看好神經網絡

      Jeff是工程超級英雄口中的「工程超級英雄」,很少有人像Jeff Dean這樣的單個工程師,贏得人們如此多的仰慕。


      主持人的第一個問題是:Jeff Dean是如何成為工程師的?

      Jeff Dean認為他有一個不同尋常的童年。因為經常搬家,在12年里他換了11所學校。

      在很小的時候,他喜歡用樂高積木搭建東西,每次搬家總要帶上他的樂高套裝。

      當九歲的時候,他住在夏威夷。

      Jeff的父親是一名醫生,但他總是對計算機如何用于改善公共衛生感興趣。當時如果想用計算機,他只能去健康部門地下室的機房,把需求交給所謂的「主機大神」,然后等他們幫你實現,速度非常慢。


      在雜志上,Jeff的爸爸看到一則廣告,買下了DIY計算機套件。那是一臺Intel 8080的早期機型(大概比Apple II還要早一兩年)。


      最初,這臺電腦就是一個閃爍燈和開關的盒子,后來他們給它加了鍵盤,可以一次輸入多個比特。再后來,他們安裝了一個BASIC解釋器。Jeff Dean買了一本《101個BASIC語言小游戲》的書,可以把程序一行一行敲進去,然后玩,還能自己修改。

      這就是他第一次接觸編程。

      后來,Jeff一家搬到明尼蘇達州。全州的中學和高中都能接入同一個計算機系統,上面有聊天室,還有交互式冒險游戲。

      這就像「互聯網的前身」,比互聯網普及早了15~20年。

      當時,Jeff大概13、14歲,他在玩兒的一款多人在線的游戲源碼開源了。

      Jeff偷偷用了一臺激光打印機,把400頁源代碼全都打印了出來,想把這款多人主機游戲移植到UCSD Pascal系統上。

      這個過程讓他學到了很多關于并發編程的知識。

      這是Jeff Dean第一次編寫出并不簡單的軟件。

      大概是91年,人工智能第一次抓住了Jeff Dean想象力。

      具體而言,是使用lisp代碼進行遺傳編程。

      而在明尼蘇達大學本科的最后一年,Jeff Dean第一次真正接觸了人工智能。

      當時,他上了一門并行與分布式編程課,其中講到神經網絡,因為它們本質上非常適合并行計算。


      那是1990年,當時神經網絡剛好有一波熱潮。它們能解決一些傳統方法搞不定的小問題。

      當時「三層神經網絡」就算是「深度」了,而現在有上百層。

      他嘗試用并行的方法來訓練更大的神經網絡,把32個處理器連在一起。但后來發現,需要的算力是100萬倍,32個遠遠不夠


      論文鏈接:https://drive.google.com/file/d/1I1fs4sczbCaACzA9XwxR3DiuXVtqmejL/view

      雖然實驗規模有限,但這就是他和神經網絡的第一次深度接觸,讓他覺得這條路很對。

      即便到了90年代末,神經網絡在AI領域已經完全「過時」了。之后,很多人放棄了「神經網絡」研究。

      但Jeff Dean并沒有完全放棄。當時整個AI領域都轉移了關注點,他就去嘗試別的事情了。

      畢業后,他加入了Digital Equipment Corporation在Palo Alto的研究實驗室。


      數字設備公司Digital Equipment Corporation,簡稱DEC,商標迪吉多Digital,是成立于1957年的一家美國電腦公司,發明了PDP系列迷你計算機、Alpha微處理器,后于1998年被康柏電腦收購

      后來,他加入谷歌,多次在不同領域「從頭再來」:

      搜索與信息檢索系統、大規模存儲系統(Bigtable、Spanner)、機器學習醫療應用,最后才進入Google Brain。

      谷歌大腦秘辛:一次茶水間閑聊

      在職業生涯里,Jeff Dean最特別的一點是:一次又一次地「從零開始」。

      這種做法激勵了很多工程師,證明了「影響力」不等于「手下的人數」,而是推動事情發生的能力。

      就像把雪球推到山坡上,讓它滾得足夠快、足夠大,然后再去找下一個雪球。Jeff Dean喜歡這種方式。


      然后在Spanner項目逐漸穩定后,他開始尋找下一個挑戰,遇到了吳恩達。


      在谷歌的茶水間偶然碰面,吳恩達告訴Jeff Dean:「在語音和視覺上,斯坦福的學生用神經網絡得到了很有前景的結果。」

      Jeff一聽就來了興趣,說:「我喜歡神經網絡,我們來訓練超大規模的吧。」

      這就是Google Brain的開端,他們想看看是否能夠真正擴大神經網絡,因為使用GPU訓練神經網絡,已經取得良好的結果。

      Jeff Dean決定建立分布式神經網絡訓練系統,從而訓練非常大的網絡。最后,谷歌使用了2000臺計算機,16000個核心,然后說看看到底能訓練什么。

      漸漸地,越來越多的人開始參與這個項目。

      谷歌在視覺任務訓練了大型無監督模型,為語音訓練了大量的監督模型,與搜索和廣告等谷歌部門合作做了很多事情。


      最終,有了數百個團隊使用基于早期框架的神經網絡。

      紐約時報報道了這一成就,刊登了那只貓的照片,有點像谷歌大腦的「啊哈時刻」。


      因為他們使用的是無監督算法。

      他們把特定神經元真正興奮的東西平均起來,創造最有吸引力的輸入模式。這就是創造這只貓形象的經過,稱之為「平均貓」。

      在Imagenet數據集,谷歌微調了這個無監督模型,在Imagenet 20000個類別上獲得了60%的相對錯誤率降低(relative error rate reduction)。

      同時,他們使用監督訓練模型,在800臺機器上訓練五天,基本上降低了語音系統30%的錯誤率。這一改進相當于過去20年的語音研究的全部進展。

      因此,谷歌決定用神經網絡進行早期聲學建模。這也是谷歌定制機器學習硬件TPU的起源。

      注意力機制三部曲

      之后不久,谷歌大腦團隊取得了更大的突破,就是注意力機制(attention)。

      Jeff Dean認為有三個突破。

      第一個是在理解語言方面,詞或短語的分布式表示(distributed representation)。

      這樣不像用字符「New York City」來表示紐約市,取而代之的是高維空間中的向量。

      紐約市傾向于出現的固有含義和上下文,所以可能會有一個一千維的向量來表示它,另一個一千維的向量來表示番茄(Tomato)。

      而實現的算法非常簡單,叫做word2vec(詞向量),基本上可以基于試圖預測附近的詞是什么來訓練這些向量。


      論文鏈接:https://arxiv.org/abs/1301.3781

      接下來,Oriol Vinyals, Ilya Sutskever和Quoc Le開發了一個叫做序列到序列(sequence to sequence)的模型,它使用LSTM(長短期記憶網絡)。


      論文鏈接:https://arxiv.org/abs/1409.3215

      LSTM有點像是一個以向量作為狀態的東西,然后它處理一堆詞或標記(tokens),每次它稍微更新它的狀態。所以它可以沿著一個序列掃描,并在一個基于向量的表示中記住它看到的所有東西。

      它是系統運行基礎上的短期記憶。

      結果證明這是建模機器翻譯的一個非常好的方法。

      最后,才是注意力機制,由Noam Shazeer等八人在Transformer中提出的注意力機制。


      這個機制的想法是,與其試圖在每個單詞處更新單個向量,不如記住所有的向量。


      所以,注意力機制是這篇非常開創性的論文的名字,他們在其中開發了這種基于transformer的注意力機制,這個機制在序列長度上是n平方的,但產生了驚人的結果。

      LLM突破觸及門檻,自動化閉環顛覆人類

      一直以來,LLM神經網絡運作機制很難被人理解,成為一個無法破譯的「黑箱」。

      而如今,隨著參數規模越來越龐大,人們無法像理解代碼一樣去理解LLM。

      研究人員更像是在做「神經科學」研究:觀察數字大腦的運作方式,然后試著推理背后的機制。


      人類理解模型的想法,未來會怎么發展?

      Jeff Dean對此表示,研究這一領域的人,把它稱之為「可解釋性」。所謂可解釋性,就是能不能搞清楚LLM到底在做什么,以及它為什么會這么做?

      這確實有點像「神經科學」,但相較于研究人類神經元,LLM畢竟是數字化產物,相對來說探測比較容易。

      很多時候,人們會嘗試做一些直觀的可視化,比如展示一個70層模型里,第17層在某個輸入下的情況。

      這當然有用,但它還是一種比較靜態的視角。

      他認為,可解釋性未來可能的發展一個方向——如果人類想知道LLM為何做了某種決定,直接問它,然后模型會給出回答。

      主持人表示,自己也不喜歡AGI術語,若是不提及這一概念,在某個時候,計算機會比人類取得更快的突破。

      未來,我們需要更多的技術突破,還是只需要幾年的時間和幾十倍的算力?

      Jeff Dean表示,自己避開AGI不談的原因,是因為許多人對它的定義完全不同,并且問題的難度相差數萬億倍。

      就比如,LLM在大多數任務上,要比普通人的表現更強。

      要知道,當前在非物理任務上,它們已經達到了這個水平,因為大多數人并不擅長,自己以前從未做過的隨機任務。在某些任務中,LLM還未達到人類專家的水平。

      不過,他堅定地表示,「在某些特定領域,LLM自我突破已經觸及門檻」。


      前提是,它能夠形成一個完全自動化閉環——自動生成想法、進行測試、獲取反饋以驗證想法的有效性,并且能龐大的解決方案空間中進行探索。

      Jeff Dean還特別提到,強化學習算法和大規模計算搜索,已證明在這種環境中極其有效。

      在眾多科學、工程等領域,自動化搜索與計算能力必將加速發展進程。

      這對于未來5年、10年,甚至15-20年內,人類能力的提升至關重要。


      未來五年規劃

      當問及未來五年個人規劃時,Jeff Dean稱,自己會多花些時間去思考,打造出更加強大、更具成本效益的模型,最終部署后服務數十億人。

      眾所周知,谷歌DeepMind目前最強大的模型——Gemini 2.5 Pro,在計算成本上非常高昂,他希望建造一個更優的系統。

      Jeff Dean透露,自己正在醞釀一些新的想法,可能會成功,也可能不會成功,但朝著某個方向努力總會有奇妙之處。

      參考資料:

      https://www.youtube.com/watch?v=OEuh89BWRL4

      為偉大思想而生!

      AI+時代,互聯網思想(wanging0123),

      第一必讀自媒體

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      與紅衣美女熱聊,王楚欽戀情曝光?女方身份確認,媽媽全程陪同

      與紅衣美女熱聊,王楚欽戀情曝光?女方身份確認,媽媽全程陪同

      懂球社
      2026-01-12 08:59:11
      172cm九頭身女神小坂七香:出道即巔峰卻想退圈?這劇情太魔幻!

      172cm九頭身女神小坂七香:出道即巔峰卻想退圈?這劇情太魔幻!

      素然追光
      2026-01-01 01:30:05
      多家媒體:卡里克出任曼聯臨時主帥

      多家媒體:卡里克出任曼聯臨時主帥

      體壇周報
      2026-01-12 23:56:13
      賭王110億遺產爭奪戰打響!何鴻燊設10億家族基金限制子女支取,何超瓊扛下賭王基業,何超賢法庭當場索要全部遺產,這時何超雄甩出賭王密信

      賭王110億遺產爭奪戰打響!何鴻燊設10億家族基金限制子女支取,何超瓊扛下賭王基業,何超賢法庭當場索要全部遺產,這時何超雄甩出賭王密信

      星宇共鳴
      2026-01-11 20:16:16
      爆冷門!前總冠軍狂輸35分,沈梓捷賴俊豪傷情出爐,最新排名如下

      爆冷門!前總冠軍狂輸35分,沈梓捷賴俊豪傷情出爐,最新排名如下

      老吳說體育
      2026-01-13 01:00:40
      柬埔寨鐵籠拉人后續!警方已找到三輪車主,籠子是買來養動物的

      柬埔寨鐵籠拉人后續!警方已找到三輪車主,籠子是買來養動物的

      夜深愛雜談
      2026-01-11 20:24:26
      日網熱搜:日本政府決定拋售7萬億日元中國國債,打擊中國經濟

      日網熱搜:日本政府決定拋售7萬億日元中國國債,打擊中國經濟

      朔方瞭望
      2026-01-11 11:10:46
      毛主席去世后,華國鋒給耿飚寫了一份手令,耿飚:手槍不必帶了

      毛主席去世后,華國鋒給耿飚寫了一份手令,耿飚:手槍不必帶了

      春秋硯
      2026-01-12 16:30:03
      國家發改委原副主任扶持公司上市,原始股十三年后獲利數千萬

      國家發改委原副主任扶持公司上市,原始股十三年后獲利數千萬

      南方都市報
      2026-01-12 22:21:05
      弦論的數學工具,正幫助我們理解真實世界的物理網絡

      弦論的數學工具,正幫助我們理解真實世界的物理網絡

      原理
      2026-01-11 21:05:55
      你聽過最勁爆的瓜是啥?網友:被大八歲的補習班老師表白了

      你聽過最勁爆的瓜是啥?網友:被大八歲的補習班老師表白了

      帶你感受人間冷暖
      2025-11-26 00:10:06
      面對大量“逃兵”狀況,烏軍總司令西爾斯基,是如何表態的?

      面對大量“逃兵”狀況,烏軍總司令西爾斯基,是如何表態的?

      戰風
      2026-01-12 15:56:59
      史玉柱再陷債務危機,大半輩子都在還債

      史玉柱再陷債務危機,大半輩子都在還債

      冰川思想庫
      2025-07-21 12:31:53
      明天重點關注這些板塊!

      明天重點關注這些板塊!

      風風順
      2026-01-12 03:25:02
      幾乎完全一致 國外化學博主宣稱破解可口可樂百年秘方

      幾乎完全一致 國外化學博主宣稱破解可口可樂百年秘方

      3DM游戲
      2026-01-12 12:17:05
      鄧榕問父親這輩子跟誰最鐵,劉伯承竟然不在名單里,鄧公報出的三個名字讓人淚目

      鄧榕問父親這輩子跟誰最鐵,劉伯承竟然不在名單里,鄧公報出的三個名字讓人淚目

      文史明鑒
      2026-01-12 23:45:11
      整整180天,那個敢炮轟以色列,彈打美國航母的男人再沒出現過。

      整整180天,那個敢炮轟以色列,彈打美國航母的男人再沒出現過。

      安安說
      2026-01-12 14:15:45
      為什么美國抓走馬杜羅后,委內瑞拉的股市反而暴漲50%

      為什么美國抓走馬杜羅后,委內瑞拉的股市反而暴漲50%

      總在茶余后
      2026-01-12 05:43:01
      記者:曼聯內部人士對關于索爾斯克亞迅速升溫的輿論感到不滿

      記者:曼聯內部人士對關于索爾斯克亞迅速升溫的輿論感到不滿

      懂球帝
      2026-01-12 20:48:51
      馬卡:勞爾-阿森西奧具備鐵血精神,這點與拉莫斯一脈相承

      馬卡:勞爾-阿森西奧具備鐵血精神,這點與拉莫斯一脈相承

      懂球帝
      2026-01-12 23:24:09
      2026-01-13 02:04:49
      互聯網思想 incentive-icons
      互聯網思想
      AI時代,互聯網思想觀察
      2383文章數 16901關注度
      往期回顧 全部

      科技要聞

      面對SpaceX瘋狂“下餃子” 中國正面接招

      頭條要聞

      視頻:巴基斯坦海軍發射中國產導彈 摧毀空中目標

      頭條要聞

      視頻:巴基斯坦海軍發射中國產導彈 摧毀空中目標

      體育要聞

      一場安東尼奧式勝利,給中國足球帶來驚喜

      娛樂要聞

      蔡少芬結婚18周年,與張晉過二人世界

      財經要聞

      倍輕松信披迷霧 實控人占用資金金額存疑

      汽車要聞

      增配不加價 北京現代 第五代 勝達2026款上市

      態度原創

      教育
      藝術
      時尚
      親子
      本地

      教育要聞

      高考地理中的斷層線與不整合面

      藝術要聞

      開工!美肌全球總部基地“云灣美谷”,效果圖公布

      看了日本主婦的搭配才明白,年紀大了這么穿,優雅又不油膩

      親子要聞

      楊樂樂曬兒子正臉照,一家四口合照曝光,沐沐疑和妹妹睡上下鋪

      本地新聞

      云游內蒙|“包”你再來?一座在硬核里釀出詩意的城

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产拳交视频| 亚洲小视频| 中国农村真卖bbwbbw| 国产精品成人一区无码 | 一本久道久久综合狠狠躁av| 亚洲乱人伦中文字幕无码| 日B免费视频| 亚洲第一网站| 免费中文熟妇在线影片| 亚洲午夜亚洲精品国产成人| 中文字幕午夜福利片午夜福利片97 | 18禁黄无遮挡网站免费| 国产成人免费ā片在线观看| jizz亚洲人| 亚洲3p| 国产又色又爽无遮挡免费动态图| 国产一区二区三区精品综合 | 蓬溪县| 特级做a爰片毛片免费看无码| 国产精品国产三级国产专区53| 国产内射一级一片内射高清视频| 光棍天堂在线手机播放免费| 国产精品自在线拍国产| 国产成人a人亚洲精品无码| 一区二区三区福利午夜| 精品人妻伦九区久久aaa片69| 久久发布国产伦子伦精品| 亚洲国产精品一区二区久久| 欧美又粗又大| 蜜臀久久99精品久久久久久牛牛| 高清无码18| 国产欧美精品一区二区三区-老狼| 久久亚洲国产成人亚| 亚洲欧美日韩人成在线播放| 2022国产成人精品视频人| 边做边爱完整版| 久久婷婷五月综合色欧美| 济阳县| 国精品无码一区二区三区在线蜜臀| 2022亚洲无码| 玩弄人妻少妇500系列视频|