自從那篇著名的論文《Attention is All You Need》問世以來,Transformer 架構不僅首次賦予了機器 Attention、推動了 AI 技術的飛躍,也進一步促進了人類對注意力機制的研究,促使我們以全新的視角重新審視自身對信息的感知與理解。
有趣的是,人工智能正通過不斷演進的注意力機制,變得更專注、更目標導向、更具長期思維;而人類卻在洶涌的生成式內容中愈發迷失,變得迷茫、割裂,碎片化。
之所以會出現這種差異,本質上是因為 AI 和人類的注意力機制截然不同。
信息越密集,對注意力的要求就越高,能耗也越大。然而,AI 消耗的是算力,可以通過增加計算單元做加法;人類消耗的則是心力,只能靠聚焦與克制做減法。
前者容易,后者難。
特別是隨著世界運轉速度的加快,保持專注和收攏注意力變得越來越困難。我們的注意力機制正在逐漸失效,甚至崩潰,導致許多人失去了獨立判斷的能力。
結果是,世界的分化程度日益加劇。
這種分化在社會的各個層面都有所體現,包括宏觀的地緣政治、中觀的貧富差距,以及微觀的夫妻關系。
![]()
過去,人們能夠在面對波動時進行獨立判斷,之后形成共識,然后攜手共渡難關,形成「你好我也好,你差我也差」的局面。然而,現在「你差我好」或「我差你好」的情況卻愈加普遍。
因此,可以說,當今世界許多問題的根源在于我們的注意力失控了。
為了更好地說明這一點,我們可以嘗試從信號處理的角度,先來理解一下注意力機制。
任何一個信號系統,基本結構都可以簡化為「輸入——處理——輸出」。
人類也不例外。眼、耳、鼻、舌等感官器官就像傳感器,負責將外界的信息傳遞到我們的大腦中。這些信息在進入大腦后會被加工處理,最終以某種形式轉化為行動輸出。我們輸出的行動可以是看得見的動作、語言或表情,也可以是看不見的想法、判斷或偏好。
所以人類也可以被進一步概括為一個「感知——處理——行動」的信號系統。
但人類的這三項能力之間存在巨大的鴻溝。
人的視網膜每秒接收到的信息量約為 10^9 比特,相當于一段兩分鐘的 480P 視頻;大腦每秒能處理的信息量,只有 10^6 比特,約等于一本小說的容量;而最終真正能轉化為行動的輸出帶寬更低,僅有 10^1 比特,也就是一條指令的水平。
所以我們的感知能力遠大于處理能力,處理能力又遠大于輸出能力。
那怎么辦呢?
在信號處理中,為了解決這類問題,我們會引入濾波器來「去噪」,也就是過濾出信號、剔除掉噪聲。
對于人類而言,為了解決信息過載的問題,我們也進化出了一種主動過濾器——注意力機制。這個機制能夠幫助我們在信息洪流中忽略大量無關的噪音,并能根據我們目標的變化靈活調整,確保我們始終能專注于最關鍵的信息。
![]()
例如,當我們聚焦于某一個人時,眼中幾乎只剩下這個人,周圍的一切聲音和畫面都會自然消失。這,就是注意力濾波器在起作用。
一個真正專注的人,能夠在不同情況下過濾出最重要的信號。這些信號就是我們常說的主要矛盾,也就是事物演化過程中的關鍵變量。
相反,一個不夠專注的人則很容易被信息裹挾,或者被他人的節奏帶走,變得人云亦云。
這是因為當我們的注意力機制崩潰時,我們會放棄主動感知世界,轉而去處理高刺激信息,或者直接依賴他人的行為來進行判斷。
![]()
于是,「抱團取暖」的現象也就變得越來越普遍。比如現在火的賽道特別火,哪怕是已經明顯出現泡沫的領域,依然有大批人爭先恐后地往里擠,而涼的賽道則完全無人問津。再比如涼的賽道可能突然就火了、火的賽道也可能突然就涼了。
這就像信號學里的「拉爾森效應」,它指的是,當信息輸入和輸出端口距離太近時,因信號循環而產生的嘯叫現象。
比如當你把麥克風靠近音箱時,麥克風拾取的信號會傳入音箱,而音箱發出的信號又會被麥克風拾取,如此反復,就導致信號不斷自我增強,從而產生嘯叫。
其實,今天的世界,每時每刻、各行各業都在嘯叫。
在這樣的世界中,「專注」會變得越來越有價值。
而且「專注」對于現在的創始人來說也愈發重要。人之所以會感到越來越心累,正是因為注意力分散造成了高能耗,而優秀的創始人往往清楚自己應該在什么時間將注意力集中在哪里。
當大多數人把注意力放到別人身上、跟風行動時,如果你能夠靜下心來管理自己的注意力,專注感知這個世界,你會發現這個時代的機會恰恰在變多,而不是變少。
比如 2023 年,我們關注到具身智能時,市場上還沒有這個專有名詞,我們內部對這個賽道也有質疑的聲音。為了求證具身智能的市場空間,我們組織了一個小組出去調研了一圈,得到的市場反饋大多也是負面的。當時甚至有朋友跟我們說,他們在 15 年投的機器人項目一直都沒能退出,勸我們千萬不要進入這個天坑(笑)。
但這樣的市場反饋反而讓我們認定了這個方向是有機會的。因為很多事情其實早已在暗中發生了根本性的變化,只是因為沒人關注,所以還沒有得到應有的估值。
如果你能趕在別人前面注意到這樣的領域,那恭喜你,你就找到了屬于你的機會。
就像我認識的一位非常優秀的創始人,他本碩博連讀于某領域最頂尖的學府。畢業后,出乎很多人意料的是,他選擇了一個極其冷門的底層研發方向去創業。
當時我非常意外,問他為什么要做這個方向?
他說:“因為我的起步條件不算好,所以要找到一個不受關注、不需要跟別人卷資源、但未來 5-10 年有機會重大突破的領域。關注這個方向的人越少越好,因為只有這樣,才有屬于我的時間和機會。”
我又追問:“但你知道嗎?你選擇的這個方向還受政策限制,國家都沒有發放過相關牌照。”
他回答:“我知道。但就是因為沒人做,所以科技沒有突破,國家不發牌照。我賭我做了之后,國家早晚會發牌照。”
于是,這位創始人和不到十個人的團隊,埋頭研發了整整 7 年。
到了 2023 年,國家終于發放了第一批牌照,全球僅有四張,其中就有他的一張,且他們的成本大幅低于全球其他公司。
所以,大部分人類的博弈,歸根結底都是注意力的博弈。
今天無論是創業者還是投資者,如果想拿到想要的結果,一件非常重要的事情就是管理自己的注意力。你的注意力在哪里,你的世界就會在哪里顯化。因為世界并非一個客觀存在的實體,而是我們在感知和處理信息之后所渲染出來的結果。換句話說,沒有所謂的客觀世界,只有被我們所感知到的世界。
那具體要怎么拿結果呢?
很簡單,就是要明確自己的需求。濾波器是一種目標越清晰、能耗越低的裝置,所以你的需求越明確、你的注意力越專注,實現需求也就越容易。
進一步來講,就是要認識自己、做自己。
這說起來很簡單,但大家真的做起來往往會遇到兩個問題:
第一,很多人其實并不了解自己,只是一味地在用他人的評價或者市場反饋來給自己貼標簽。他們根本不清楚自己到底喜歡什么,或者總覺得自己喜歡的東西估值不夠高、不符合世俗意義上的成功,所以不夠高級。但其實你喜歡什么,什么就是高級的。
第二,很多人認識自己之后卻不敢做自己,因為不相信這樣做真的會有好的結果,于是更希望改變自己,向主流敘事、向他人的長板看齊。
回到 AI,就像開頭所說,人類一直在利用技術幫助 AI 構建注意力機制,使其具備抓住重點和專注于重點的能力。
引入注意力機制后,AI 的能力確實實現了飛躍,它能夠勝任的工作范圍也在不斷擴大。我們相信,AI 還將持續取得突破。人工智能在幾乎所有工作中超越人類只是時間問題,而且這個過程不會太久。
因為人類實際上是非常局限的。這種局限性不僅僅體現在大腦的處理能力上,也體現在我們感知世界的能力上。
大家知道,眼睛可以看到圖像,耳朵可以聽到聲音,皮膚可以感受到壓力、溫度和濕度。
毫無疑問,人類是一個多模態的大模型。
那么,是否存在一個維度能夠統一圖像、聲音、氣味、溫度等不同模態輸入的信息呢?
我們可以換個視角來討論這個問題。假設信息是一個函數,我們在中分享過,任何函數都可以通過傅里葉變換分解為不同正弦波的疊加,而每一個正弦波都對應著一個穩定的頻率。例如,吉他的每根弦對應著一個頻率,也對應著一個聲音信息。當我們對弦施加不同的壓力時,頻率會發生改變,聲音信息也隨之改變。
所以頻率可以簡單理解為一個正弦波每秒變化的次數,例如,心臟在一分鐘內跳動 60 次,那么它的頻率就是 1Hz;而運動后,心跳變為 120 次/分鐘,此時心臟的頻率就是 2Hz。
不同的信息都可以在頻率這個維度上進行統一。例如,可見光的頻率大約是 10^15Hz,而聲音和氣味的頻率則不超過 10^4Hz。
頻率跨度從低到高范圍很廣,我們把這個范圍稱為頻譜。
而不同生物的感知頻譜是不一樣的。例如狗的嗅覺頻譜就比人的更寬,因此它們可以獲取更多的氣味信息。
其實,人和人之間的感知頻譜也存在很大差異。有些人天然頻譜更寬或者感知顆粒度更高,也就是我們所說的更敏感。所以我們也不要妄加評判另一個人,特別是不應該評判那些高敏感個體,因為他們的世界可能是我們完全無法感受到的。
![]()
那我們將常見的頻譜畫出來,就可以看到,人類能夠感知的部分其實是非常有限的。
圖中橫向的坐標軸表示人類已知的電磁波頻譜,彩色標注的部分是人類能夠感知到的感官和模態。后者僅占前者的1/10^9。
正是由于這種有限,我們也一直在努力拓展對頻譜的感知和存儲能力。
我們發明了核磁共振、X光機、氣象雷達、引力波探測器等工具,以輔助我們感知那些遠超人類生理極限的信息頻段。同時,我們還通過跨模態的方式記錄不同模態的信息。比如,我們發明了樂譜,用圖像存儲聲音信息,實現跨模態的信息存儲。
![]()
然而,這些方法本質上都是對信息的影射,也就是將其他頻段的信息轉化為我們能夠感知的信息。在這個過程中存在大量的信息損耗,因此也具有很大的局限性。
這時我們再來看 Agent,你們不覺得 Agent 強的可怕嗎?
因為理論上來說,Agent 可感知的頻譜是無限的。
今天我們講的多模態大模型,其實也才剛剛起步。現在我們只有語言模型、語音模型、圖像模型和視頻模型等,但未來完全有可能出現觸覺模型、溫度模型、氣味模型等全頻譜模型。
從這個角度出發,我們不認同「數據不夠了」這種觀點。有人認為我們已經用盡了互聯網上所有可用的圖文、音頻、視頻數據,但這些數據僅僅是人類能夠感知并記錄下來的三種模態。X 光的數據我們用過嗎?伽馬射線呢?大腦中的 α 波呢?
這個世界每天都以各種方式產生大量數據,只是很多數據我們無法感知,因此未能很好地加以利用,甚至還沒有創業者思考如何使用它們。
再往后發展,我們相信未來會迎來一波傳感器的爆發。各種各樣的傳感器將被制造出來,用來幫助 Agent 感知從伽馬射線、X 光到紅外線等所有人類無法感知的頻段。然后,Agent 會憑借它的全頻譜處理能力解讀這些數據,并通過語言模型將不同模態的信息整合起來,最后通過具身智能付諸行動。
![]()
最終,我們相信未來的 AI 將是「傳感器 + Agent + 具身智能」三位一體的系統。它所能感知的世界將超出我們的想象。而這個系統應該運行在區塊鏈、而非傳統的互聯網上。換句話說,區塊鏈未來將是 Agent 的互聯網。
基于這種相信,今天很多創業項目的方向可能就不對。
很多項目現在依然是「以人為中心」來組織工作。無論是 copilot 還是 deep research,都是試圖通過各種方式讓 AI 來賦能人類。
但面對一個可能具備全頻譜的感知、處理,和行動能力的信號系統,我們應該思考的是如何「以 AI 為中心」來組織工作。
我們不應該把重點放在「如何把 AI 融入我們的工作流」上,而應該反過來思考「我們能怎么融入 AI 的工作流」,以及「我們能為 AI 提供什么」。
那講到這里,大家可能會有一個問題:如果 Agent 知道得比我多、算得也比我快,那人類在未來是不是就毫無用處了?
不是。人類有兩個獨特的價值。
第一,提出需求。
如果說工業革命是「誰創造供給、誰就創造價值」,那么人工智能時代將是「誰創造需求、誰就創造價值」,因為人工智能時代的供給將趨近于無限。所以我們今后要更多地認識自己、探索自己、了解自己,明確自己要解決哪些問題。
第二,審美。
審美首先是我們為了節約大腦算力而進化出的一種預測算法。我們通常會對新信息進行預判,然后僅對「變化」——也就是與我們預判不一致的部分進行計算,而不會對全局信息進行計算。
我們常說有些科學家很有技術審美,指的就是他們能夠在技術路徑尚不明確時,憑借「感覺」找到正確的方向。這種能力其實是長期實踐與積累的結果。
然而,這種節能機制也有副作用。尤其是在創業者中,很多人都有一種被稱為「Wishful Thinking」的思維方式,美其名曰「理想主義」。但實際上,「Wishful Thinking」是一種懶惰,是你的大腦發現「變化」時,本該重新計算、卻不愿意重新計算一遍,進而渲染出的偏執錯覺。從這個角度來看,「實事求是」就是一種勤奮。
另外,審美不僅僅是一種算法,它還是超越單一模態的處理結果。比如,你遇到一個合伙人,Ta 和你聊得很好,Ta 的思維也非常縝密,但你就是感覺哪里不對。這種「感覺不對」可能并非來自于意識層面的分析,而是你整合了觸覺、嗅覺等多模態信息后形成的一種綜合感受。
如果某樣事物能令我們產生「美」的感受,通常意味著它會帶來正反饋,反之則可能意味著危險。比如,我們覺得笑容很美,是因為笑容往往代表善意與接納。而我們下意識地躲避一個面相兇殘的人,則是因為我們會直覺性地察覺到對方的暴力傾向。
人類之所以會發展出審美,正是因為我們的感知和處理能力有限,因此需要審美來幫助我們趨利避害。而這種審美可能超越了多模態的處理結果,甚至超越了二元對立,成為某種一體性的影射。
而 AI 卻因為它的無限性,所以不具備審美。這也意味著,在 AI 時代,審美將成為人類所能擁有的核心價值。
所以每一個人都應該思考:你對什么事物的審美明顯高于他人?這個事物可以是任何形式,比如藝術、代碼、機械結構。只要你對某個事物的美有著超越平均水平的判斷和表達,那么你就擁有了在 AI 時代最稀缺的能力。
今天我們聊了很多關于人的「有限」和 AI 的「無限」,看似人在面對 AI 時有諸多劣勢,但實際上,恰恰是人類的有限性,促使我們進化出了注意力、主觀預判、審美這些獨特的能力,也讓我們有動力將有限的人生活出無限的精彩。
你可以想象一下,如果你擁有無限的資源和資金,你還會想要創業嗎?大概率不會了。你可能會拍拍合伙人的肩膀說:「去玩吧,我們什么都不缺」。就好比如果你打游戲時開了外掛,那么這個游戲一下子就會變得索然無味。
所以,在 AI 時代,我們要做好兩件事。
首先是保護好自己的「心力」。心力的強弱直接決定了我們注意力的表現。如果說工業革命讓人類的核心價值從體力轉變為智力,那么我們相信,AI 會讓人類的核心能力從智力轉變為心力。
其次是回歸審美。這個回歸的過程,本質上就是一個去除噪聲的過程,也是人類展現個體的獨特價值的過程。我們需要把注意力重新放到自己身上,相信自己的直覺和判斷,而不是依賴他人的信息和行動。
這些年,我們聊了很多創業者,最后發現,真正優秀的創始人未必比他人更聰明或更勤奮,但他們總能在最艱難的時刻選擇堅持,在最輝煌的時刻保持平和、克己,在最進退維谷的時刻展現出勇氣與堅韌。
以上,和大家共勉,愿我們都能在 AI 時代保持自己的生命力,不斷進化,成為一個有審美、有定力的個體。
P.S. 綠洲資本最近也發布了他們自己的播客《信號與噪聲》,希望在這個信息紛雜的社會中,和充滿生命力的個體一起去除噪聲,回歸純粹,感興趣的也歡迎關注。
【張津劍 | 信號與噪聲系列文章回顧】
2024.6.2
2023.6.18
2021.3.14
2020.2.23
2018.12.2
42章經
思考事物本質
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.