![]()
面對(duì)統(tǒng)計(jì)檢驗(yàn)時(shí),很多人第一時(shí)間都會(huì)問(wèn)一句:「p 值到底是什么意思?」這個(gè)數(shù)字經(jīng)常出現(xiàn)在報(bào)告、論文、t 檢驗(yàn)、ANOVA、回歸分析里,卻也常被誤解得最離譜。為了讓概念更直觀,我們不談公式、不談復(fù)雜符號(hào),只從一個(gè)簡(jiǎn)單的場(chǎng)景開(kāi)始想。
想像你統(tǒng)計(jì)了一組數(shù)據(jù),例如比較兩所學(xué)校學(xué)生的身高。你在 A 學(xué)校量了10個(gè)人,在 B 學(xué)校也量了10個(gè)人。結(jié)果發(fā)現(xiàn)兩組的平均身高有些差異。
接下來(lái),你可能希望用這些樣本來(lái)推斷整體情況:也就是說(shuō),或許 A 學(xué)校的學(xué)生平均來(lái)說(shuō)比 B 學(xué)校的學(xué)生更高。
![]()
然而:有人走過(guò)來(lái)說(shuō),不,我對(duì)你的結(jié)果有不同的解釋?zhuān)耗阒皇窃谀愕臉颖局邪l(fā)現(xiàn)了差異,但整個(gè)學(xué)校都是一樣的。你只是碰巧從A學(xué)校挑了高個(gè)子學(xué)生,從B學(xué)校挑了矮個(gè)子學(xué)生。
當(dāng)批評(píng)者說(shuō)“你的結(jié)果只是隨機(jī)誤差造成的”時(shí),他們實(shí)際上是在主張零假設(shè)。因此,在繼續(xù)任何分析之前,你必須先回應(yīng)這種質(zhì)疑:你得證明如果差異真的只是隨機(jī)造成的,你的數(shù)據(jù)不會(huì)大概率呈現(xiàn)成現(xiàn)在這樣。這總是有可能的,但你可以證明它不太可能,這就是你唯一能合理做的事情。
在零假設(shè)下找到你的數(shù)據(jù)的機(jī)率是p值。如果p值非常低,這意味著僅僅由于毒素的隨機(jī)變化而找到你的影響的可能性非常小。
![]()
p 值(綠色陰影區(qū)域, 上圖)是在原假設(shè)為真的前提下,出現(xiàn)某個(gè)觀測(cè)結(jié)果(或更極端結(jié)果)的概率。
相反,如果p值不是那么低,你的數(shù)據(jù)與你所期望的只是由于噪音而產(chǎn)生的影響非常吻合。
每隔一段是說(shuō)p值必須低于0.05才能夠駁回零假設(shè)批評(píng)。由于你的p值更大,你不能說(shuō)你的數(shù)據(jù)只是由于偶然性而足夠出乎意料。相反,這種影響在統(tǒng)計(jì)學(xué)上并不顯著。
請(qǐng)注意,p值始終是在給定假設(shè)下影響的機(jī)率。它不是零假設(shè)本身的機(jī)率,你不知道。你所說(shuō)的只是數(shù)據(jù)與零假設(shè)不太一致。如果你想嘗試假設(shè)分配一個(gè)機(jī)率,你必須使用貝葉斯方法并涉及先驗(yàn)。不過(guò),在大多數(shù)情況下,我認(rèn)為恰當(dāng)?shù)厥褂?p 值,已經(jīng)足以支持這樣一種主張:現(xiàn)有數(shù)據(jù)難以由零假設(shè)合理解釋。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.