貝葉斯公式:
![]()
H表示Hypothesis(假設(shè)),E表示Evidence(證據(jù)),貝葉斯定理的意義就在于,給定一個先驗(yàn)概率P(H),在出現(xiàn)了證據(jù)E的情況下,計算后驗(yàn)概率P(H|E)。而P(E|H)則為當(dāng)假設(shè)H為已知時,結(jié)果為證據(jù)E一致的概率。
有趣的例子一(https://liaoxuefeng.com/blogs/all/2023-08-27-bayes-explain/index.html):
已知一種疾病的發(fā)病率為0.1%。有一種檢測手段測試結(jié)果準(zhǔn)確率非常高:
- 如果有病,則準(zhǔn)確率是99%(即有1%未檢出陽性);
- 如果沒有病,則誤報率是2%(即有2%誤報為陽性)。
現(xiàn)在,如果一個人測試顯示陽性,請問他患病的概率是多少?
用H表示患病,E表示測試為陽性,那么,我們要計算在測試為陽性的條件下,一個人患病的概率,就是計算P(H|E)。根據(jù)貝葉斯定理,計算如下:
P(H∣E)=P(E∣H)×P(H)/P(E)
P(H)表示患病的概率,根據(jù)發(fā)病率可知,P(H)=0.1%;
P(E|H)表示在患病的情況下,測試為陽性的概率,根據(jù)“如果有病,則準(zhǔn)確率是99%”可知,P(E|H)=99%;
P(E)表示測試為陽性的概率。這個概率就稍微復(fù)雜點(diǎn),因?yàn)樗侵笇λ腥耍ò∪撕徒】等耍┻M(jìn)行測試,結(jié)果陽性的概率。
我們可以把檢測人數(shù)放大,例如放大到10萬人,對10萬人進(jìn)行檢測,根據(jù)發(fā)病率可知:
- 有100人是病人,另外99900是健康人;(發(fā)病率為0.1%)
- 對100個病人進(jìn)行測試,有99人顯示陽性,另有1人未檢出(陰性);(測出準(zhǔn)確率為99%)
- 對99900個健康人進(jìn)行測試,有2%=1998人顯示陽性(誤報),另有98%=97902人為陰性。(誤報率為2%)
所以,對于10萬人的樣本空間來說,事件E=顯示陽性的概率為(99+1998)/100000=2.097%。
帶入公式:
![]()
計算結(jié)果為患病的概率為4.721%。(概率)
如果這個患者再次進(jìn)行了檢測,結(jié)果依然為陽性,那么他患病的概率又是多少?
我們?nèi)匀皇褂秘惾~斯定理計算,只不過現(xiàn)在先驗(yàn)概率P(H)不再是0.1%,而是4.721%,P(E|H)和P(E|H)仍保持不變,計算新的P(H|E):
![]()
結(jié)果為71%,兩次檢測為陽性的結(jié)果使得先驗(yàn)概率從0.1%提升到4.721%再提升到71%,繼續(xù)第三次檢測如果為陽性則概率將提升至99.18%。
第二個例子就是廣為流傳的三門問題了:
一個抽獎節(jié)目,舞臺上有三扇門,其中一扇門的后面有汽車,其余兩扇沒有,選中有汽車的那扇門就可以贏得該汽車。首先參與者從三扇門中選擇一扇,接著主持人會故意打開一扇沒有車的門,并詢問參與者是否要更改自己的選項(xiàng)。請問更改選項(xiàng)和不更改選項(xiàng)哪個的中獎概率更高?
這是一個很容易犯錯的問題,許多人會忽略題目中隱藏的一個重要信息——主持人事先知道哪扇門后面有車、哪扇門后面沒車。主持人不會直接打開參與者選擇的門(因?yàn)檫@樣節(jié)目就直接結(jié)束了),也不會打開有車的那扇門。
定義H E兩個事件:
H:參與者選擇的是有車的那扇門的概率。P(H)=1/3
E:主持人打開除去參與者選擇的,剩下兩扇門中,其中一扇的概率。P(E) = 1/2
我們用A/B/C來表示三扇門來表示與順序無關(guān)。
參與者選擇了A門,主持人打開了B門。此時主持人問參與者要不要將選項(xiàng)更換為C門?
![]()
我們來計算下P(H|E)的概率,既參與者對于支持人給出的是否修改選擇機(jī)會時,做出修改選擇和不修改選擇的不同情況中大獎的概率。
這個公式中,P(H)=1/3;P(E)=1/2。
但是,P(E|H)既主持人確定參與者選擇A。因?yàn)橹鞒秩耸侵儡囋谀纳乳T之后,開啟B門或開啟C門的概率是不一樣的。
假設(shè)車子在A門之后,主持人開啟B/C門的概率是一樣,既P(E|H) = 1/2。既參與者不更換選擇,帶入公式我們得到的結(jié)果是不更換選擇,中獎概率與第一次選擇時的概率一致都為1/3.
P(H|E)(A)= (1/2[P((E|H)|(A))])*(1/3)/(1/2)= 1/3
假設(shè)車子在B門之后,主持人打開B門的概率為0。因?yàn)橹鞒秩酥儡囎釉贐門后,不會開啟B門。
假設(shè)車子在C門之后,主持人打開B門的概率為1。此時參與者修改選擇,從之前的A門換位選擇C門。
P(H|E)(C)=(1[P((E|H)|(C)))*(1/3)/(1/2)= 2/3
當(dāng)然這只是數(shù)學(xué)世界里純粹的概率計算題,現(xiàn)實(shí)世界里是不是會遇上一個知道三門問題而“古布迷陣”的支持人也未可知。
壞心眼的“聰明人”不會放實(shí)物,而使用字條/獎卷這樣的替代品,在最終開啟之前“貍貓換太子”的可能性也不是沒可能,你說是不是--某某彩票?
貝葉斯是一個計算概率的公式,現(xiàn)在被越來越多的應(yīng)用在人工智能領(lǐng)域。這個公式有趣的地方在于,當(dāng)引入了證據(jù)之后,原本難以預(yù)測的事件或者結(jié)果變的不那么“無法預(yù)測”了。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.