說到選擇或者決策,我們大都把注意力放在“選”這個(gè)動(dòng)作以及選擇過后所產(chǎn)生的結(jié)果上,很容易忽略掉構(gòu)成選擇的關(guān)鍵要素——選項(xiàng)。有的時(shí)候,選項(xiàng)顯而易見,就像菜單上的小吃和甜點(diǎn),但大部分生活中的選項(xiàng)都隱藏在伊西斯的面紗之下,而這些選項(xiàng)是自然給我們?cè)O(shè)下的陷阱還是憑人類自身的理智所構(gòu)建出來的路徑的區(qū)別,也是困擾了哲學(xué)家多年的決定論與自由意志之爭(zhēng)。
![]()
姑且放下形而上的爭(zhēng)執(zhí),如今越來越多的人認(rèn)識(shí)到好的問題比答案更重要,也可以由此擴(kuò)展到,好的選項(xiàng)比選擇本身更關(guān)鍵。那么什么又是洞見選項(xiàng)的基本能力呢?說起來并不復(fù)雜,它就跟我們?nèi)粘5纳罹o緊的關(guān)聯(lián)在一起,那就是——分類。
想要將某個(gè)人歸入某一類別(朋友或敵人:值得信任或不值得信任)是人類與生俱來的天性,對(duì)事情的歸類也是如此,這種渴求為智力發(fā)展提供了基礎(chǔ)。如果我們不去構(gòu)成類別,我們就只能注意到個(gè)例,而觸及不到任何總體性思考。
![]()
可以設(shè)想,如果一個(gè)常人缺乏分類的能力,他就會(huì)迷失在浩如煙海的日常事務(wù)中——他無法識(shí)別朋友和敵人,甚至都不會(huì)構(gòu)建“朋友”這樣的詞語,他身邊只能是一個(gè)個(gè)獨(dú)特的個(gè)體;他也無法識(shí)別蘋果,他只能認(rèn)識(shí)到一個(gè)個(gè)長(zhǎng)得略有不同的能吃的東西。以此類推,在在他的頭腦里,是無法想象“人類”、“世界”、“宇宙”這樣的存在的,因?yàn)橹挥蟹诸悾拍茏屛覀兘栌蓚€(gè)體達(dá)到總體。
從形式上看,選項(xiàng)就是在某一些規(guī)則之下的分類。所以在做選擇之前,學(xué)會(huì)更好的分類,可能比在選項(xiàng)之間比來比去更加重要。在《分類思維:不確定情境中合理決策的科學(xué)與藝術(shù)》這本書中,作者就將最佳選擇的探索延伸到分類上,探究在不確定的世界里構(gòu)建一種好的分類方式以獲得優(yōu)秀決策的方法。
![]()
“分類是指根據(jù)線索使用分類規(guī)則將個(gè)體分配到各個(gè)類別”。不過分類并不是看起來這么簡(jiǎn)單,當(dāng)我們深入去體會(huì)這個(gè)概念,即可找到分類的兩種層次動(dòng)作:一種是構(gòu)建分類規(guī)則,另一種是根據(jù)分類規(guī)則將具體的事物分配到各個(gè)類別當(dāng)中。很明顯,構(gòu)建分類規(guī)則相對(duì)來說更基礎(chǔ),也更重要。
如果我們能夠找到最佳分類方法,那么就可以避免掉大多數(shù)因?yàn)檫x項(xiàng)錯(cuò)誤所導(dǎo)致的決策失誤。比如,如果我們希望車輛可以在紅綠燈前面自動(dòng)決策的話。那就要根據(jù)紅綠燈的規(guī)則來構(gòu)建一系列的決策分類,這個(gè)相對(duì)來說比較簡(jiǎn)單,考慮到直行、左轉(zhuǎn)和右轉(zhuǎn)在三個(gè)燈下的狀態(tài),無非也就是九種分類而已。但問題在于現(xiàn)實(shí)世界中任何一個(gè)路口,都不會(huì)僅僅只有紅綠燈,還有著眾多的交通參與者,這樣規(guī)則就變得復(fù)雜起來,即便不考慮所有情況,規(guī)則也會(huì)乘法級(jí)的增長(zhǎng)。
![]()
所以近些年自動(dòng)駕駛的研發(fā)逐漸放棄了規(guī)則算法,轉(zhuǎn)而尋找適應(yīng)性更強(qiáng)的方式。本質(zhì)上就是在現(xiàn)實(shí)情境中,未來可能以不可預(yù)知的方式不同于過去,最佳分類規(guī)則是不可知的。在一個(gè)穩(wěn)定、可控的世界中,根據(jù)過往的經(jīng)驗(yàn)進(jìn)行微調(diào)的規(guī)則很可能會(huì)成功。微調(diào)往往會(huì)導(dǎo)致統(tǒng)計(jì)數(shù)據(jù)和機(jī)器學(xué)習(xí)的標(biāo)準(zhǔn)庫提供復(fù)雜的分類規(guī)則。相反,在動(dòng)態(tài)、不穩(wěn)定的現(xiàn)實(shí)環(huán)境中,變化可能會(huì)突然發(fā)生,對(duì)過往經(jīng)驗(yàn)進(jìn)行微調(diào)可能會(huì)導(dǎo)致巨大的預(yù)測(cè)錯(cuò)誤。在這里,規(guī)則的復(fù)雜性可能需要在一定程度上減少而不是增加:現(xiàn)實(shí)情境中,簡(jiǎn)單規(guī)則表現(xiàn)良好。
在分類思維這本書中,就提出了一個(gè)鮮明的觀點(diǎn):簡(jiǎn)單規(guī)則反而在現(xiàn)實(shí)情境中表現(xiàn)良好。在國際象棋、圍棋或人臉識(shí)別等穩(wěn)定的情況下,如果有大量數(shù)據(jù)可用,復(fù)雜算法的表現(xiàn)優(yōu)于快速節(jié)儉啟發(fā)式。相比之下,在現(xiàn)實(shí)情境中,未來是不確定的,而且未來可能以一種不可預(yù)測(cè)的方式不同于過去,無論可用數(shù)據(jù)規(guī)模是大是小,簡(jiǎn)單的啟發(fā)式都可以勝過復(fù)雜的方法,并稱此為“不穩(wěn)定世界原則”。
![]()
“啟發(fā)式”這個(gè)詞源自于古希臘,意思是“積極主動(dòng)地發(fā)現(xiàn)或探索”。18世紀(jì)被引入到英語中,是指代解決那些難以用邏輯和概率論加以處理的問題、有用甚至不可缺少的認(rèn)知過程。分類思維這本書關(guān)注兩類啟發(fā)式,這兩類啟發(fā)式開發(fā)了人類智力的兩個(gè)核心能力:計(jì)數(shù)和排序。計(jì)數(shù)啟發(fā)式只計(jì)算將個(gè)體分配至某一類別的原因。快速節(jié)儉樹對(duì)原因進(jìn)行排序,并使得使用者基于其中一個(gè)或幾個(gè)原因就能做出快速?zèng)Q策。
這聽起來可能有些學(xué)術(shù),可以通過兩個(gè)例子來分別理解計(jì)數(shù)法和快速節(jié)儉樹。
每四年一次的美國大選,不僅關(guān)乎美國人的日常生活,甚至還會(huì)影響世界政治、經(jīng)濟(jì)走勢(shì)。所以人們往往希望在大選結(jié)果產(chǎn)生前預(yù)測(cè)誰能夠入主白宮。當(dāng)然這其中最常用的就是傳統(tǒng)的民意調(diào)查法,如果想要獲得更精準(zhǔn)的結(jié)論,就要耗時(shí)耗力,擴(kuò)大樣本所涵蓋的類別等等,而準(zhǔn)確度也難以保證。有一位歷史教授,通過一個(gè)簡(jiǎn)單的方式,就能夠輕松地使得自己預(yù)測(cè)的準(zhǔn)確度超過大多數(shù)民調(diào)。
![]()
這個(gè)方法就是“13把進(jìn)入白宮的鑰匙”:拿到6把(即問題結(jié)果為否),挑戰(zhàn)者獲勝,否則執(zhí)政黨獲勝。以下就是這13個(gè)問題。
1、執(zhí)政黨授權(quán)。中期選舉后,執(zhí)政黨在美國眾議院比之前的中期選舉后持有更多的席位。
2、提名競(jìng)賽,現(xiàn)任黨內(nèi)沒有激烈的提名競(jìng)爭(zhēng)。
3、在任,執(zhí)政黨候選人是現(xiàn)任總統(tǒng)。
4、第三黨。沒有重要的第三方或獨(dú)立參選人。
5、短期經(jīng)濟(jì)。競(jìng)選期間未陷入衰退。
6、長(zhǎng)期經(jīng)濟(jì)。在這一總統(tǒng)任期內(nèi),實(shí)際的年人均經(jīng)濟(jì)增長(zhǎng)等于或超過前兩個(gè)總統(tǒng)任期的平均增長(zhǎng)。
7、政策變化,現(xiàn)任政府對(duì)國家政策產(chǎn)生重大影響。
8、社會(huì)動(dòng)蕩。任期內(nèi)沒有持續(xù)的社會(huì)動(dòng)蕩。
9、丑聞。現(xiàn)任政府沒有受到重大丑聞的影響,
10、外交、軍事失敗。現(xiàn)任政府沒有在外交、軍事事務(wù)上出現(xiàn)重大失敗。
11、外交、軍事成就。現(xiàn)任政府在外交、軍事事務(wù)上取得了重大成功。
12、在位者個(gè)人魅力。執(zhí)政黨候選人具有超凡魅力或是一位國家英雄,
13、挑戰(zhàn)者個(gè)人魅力。在野黨候選人既沒有個(gè)人魅力也非國家英雄。
這13把鑰匙有一些特別之處——所有的鑰匙都聚焦在執(zhí)政黨、執(zhí)政黨過去的表現(xiàn)、執(zhí)政黨當(dāng)前的候選人上,唯一的例外是鑰匙13關(guān)注的挑戰(zhàn)著個(gè)人魅力。(答案是,執(zhí)政黨拿到鑰匙,答案否,在野黨拿到鑰匙)。而且這13個(gè)問題沒有權(quán)重,一視同仁,拿到一個(gè)積一分,最后計(jì)算總分即可。
![]()
這就是計(jì)數(shù)法的本質(zhì):在不確定的情況下,人應(yīng)該簡(jiǎn)單地計(jì)數(shù),而不要試圖權(quán)衡比重。
再看一個(gè)快速節(jié)儉樹的例子。在美國快速的HIV篩查一般分為三步,先做一次酶免疫測(cè)試,陰性則停止,并確認(rèn)無HIV,陽性則繼續(xù)再做一次酶免疫測(cè)試,陰性則確認(rèn)無HIV,陽性則再進(jìn)行一次蛋白質(zhì)測(cè)試,陰性則確認(rèn)無HIV,陽性則確認(rèn)HIV感染。
![]()
其實(shí)這并不是一種“最佳”的規(guī)則,如果“最佳”的定義是最大化的檢測(cè)出HIV感染者以及最小化誤診。因?yàn)榈谝淮蚊该庖邷y(cè)試,一定有一些沒有被檢測(cè)出來的HIV感染者,最后被宣布無HIV。但是,因?yàn)檫@個(gè)概率比較低,如果為了找出那些遺漏的HIV感染者,將會(huì)耗費(fèi)大量的人力物力。所以最終采用了一種更為“節(jié)儉”的決策樹。
如果用符號(hào)K表示線索(檢測(cè)次數(shù))的數(shù)量,這里K等于3。如果一條線索只有兩個(gè)值,如“正/負(fù)”(即陰性陽性),則這條線索稱為二元線索。快速節(jié)儉樹中,可以進(jìn)行分類的空間稱為“出口”,一個(gè)快速節(jié)儉樹正好有K+1個(gè)出口,跟完整決策樹的檢索出口數(shù)量即2的K次方相比,當(dāng)K大于2的時(shí)候,節(jié)儉樹就有優(yōu)勢(shì),K越大,優(yōu)勢(shì)越大。所以使用快速節(jié)儉樹來替代完整決策樹?可以大大減少檢測(cè)上的時(shí)間,減少醫(yī)療系統(tǒng)所承受的負(fù)擔(dān),同時(shí)可以用相對(duì)較少的漏報(bào)為代價(jià)保護(hù)大量個(gè)體不被誤診。
![]()
在此補(bǔ)充一些醫(yī)療檢測(cè)當(dāng)中的關(guān)鍵定義。首先大前提是,任何一種針對(duì)性的檢測(cè),都不是百分之百準(zhǔn)確的,這意味著有一部分真實(shí)的病人未被檢測(cè)出來,同時(shí)還有一部分健康的人被誤診。所以針對(duì)真實(shí)陽性和真實(shí)陰性情況,對(duì)應(yīng)檢查出來陽性和陰性,就會(huì)有四種情況:
真實(shí)陽性被檢測(cè)出陽性稱為命中,也叫做真陽性;真實(shí)陽性被檢查出來陰性則成為漏報(bào),也叫做偽陰性。命中與命中和漏報(bào)的總和的比稱為命中率或靈敏度。真實(shí)陰性被檢查出陰性稱為正確拒絕,也叫做真陰性;真實(shí)陰性被檢查出陽性稱為誤報(bào),也叫做偽陽性。誤報(bào)與誤報(bào)和正確拒絕之和的比例被稱為誤報(bào)率。
![]()
當(dāng)我們?cè)俾牭剑热缫粋€(gè)乳腺癌檢測(cè)命中率為75%時(shí),先不要著急下結(jié)論說這個(gè)檢測(cè)很管用,看看它的誤報(bào)率,比如平均誤報(bào)率為46%,意味著大約每隔一個(gè)人就會(huì)出現(xiàn)沒有患乳腺癌的女性被該測(cè)試診斷為患有乳腺癌的情況。這種高命中率的代價(jià)是將更多的為患病的人誤報(bào)作為基礎(chǔ)的。相比之下,正常的乳房X光檢測(cè)篩查的命中率約為80%,但誤報(bào)率在10%以下。
![]()
這是一個(gè)小小的題外話,分類思維這本書,核心就要告訴我們的是,真實(shí)世界中存在著線索的不確定性,線索權(quán)重的不確定性以及最佳分類規(guī)則的不確定性。因此,如果去構(gòu)建一個(gè)“最佳”分類規(guī)則去盡可能準(zhǔn)確地描述過往的分類,就可能會(huì)引起錯(cuò)誤的判斷,與此相反,我們認(rèn)為,簡(jiǎn)單啟發(fā)式(例如計(jì)數(shù)和快速節(jié)儉樹)可以在現(xiàn)實(shí)情境中表現(xiàn)良好,因?yàn)樗鼈円蕾囉诜€(wěn)定的原則來減少錯(cuò)誤。
快速節(jié)儉分類最典型的特征是簡(jiǎn)單。簡(jiǎn)單是由兩種方式實(shí)現(xiàn)的:首先,分類使用的線索相對(duì)較少;其次,各條線索以簡(jiǎn)單的方式組合。因此,分類可以快速進(jìn)行,要理解和解釋分類背后的邏輯推理也很簡(jiǎn)單,考察了兩種最簡(jiǎn)潔的方法,第一種方法稱為“計(jì)數(shù)”,在同一時(shí)間使用各條線索,賦予他們相等的權(quán)重。第二種方法稱為“快速節(jié)儉樹”,按順序使用各條線索,一次使用一個(gè),對(duì)線索施加優(yōu)先級(jí)順序。
![]()
雖然這本書中陸續(xù)介紹了很多計(jì)數(shù)法和快速節(jié)儉樹的構(gòu)建方法,但很多都需要過硬的數(shù)學(xué)功底和相應(yīng)的計(jì)算工具的輔助,對(duì)程序開發(fā)可能有比較大的幫助,但對(duì)于普通人來說,只需要記住,它反對(duì)了一種普遍的觀念,即復(fù)雜的分類方法總是更好,更多的數(shù)據(jù)總是導(dǎo)致更高的準(zhǔn)確性,盡管在確定的和完全控制的情況下(未來和過去相似),這種觀念是正確的,但是在不確定的和缺乏控制的情況下,這種觀念就不見得成立了。在這樣的情況下,簡(jiǎn)單的規(guī)則可以根據(jù)較少的信息進(jìn)行更準(zhǔn)確的預(yù)測(cè),并且,簡(jiǎn)單的規(guī)則更加透明、更易懂,以便啟動(dòng)操作。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.