條件概率
A+醫(yī)學(xué)百科 >> 條件概率 |
示例:就是事件 A 在另外一個事件 B 已經(jīng)發(fā)生條件下的發(fā)生概率。條件概率表示為 P(A|B),讀作“在 B 條件下 A 的概率”。
如:根據(jù)大量的統(tǒng)計,大熊貓活到十歲的概率是0.8,活到十五歲的概率是0.6,若現(xiàn)有一只大熊貓已經(jīng)十歲了,則他活到十五歲的概率是多少?
聯(lián)合概率:表示兩個事件共同發(fā)生的概率。A 與 B 的聯(lián)合概率表示為 P(AB) 或者 P(A,B)。
邊緣概率:是某個事件發(fā)生的概率,而與其它事件無關(guān)。邊緣概率是這樣得到的:在聯(lián)合概率中,把最終結(jié)果中不需要的那些事件合并成其事件的全概率而消失(對離散隨機變量用求和得全概率,對連續(xù)隨機變量用積分得全概率)。這稱為邊緣化(marginalization)。A的邊緣概率表示為 P(A),B 的邊緣概率表示為 P(B)。
需要注意的是,在這些定義中 A 與 B 之間不一定有因果或者時間順序關(guān)系。A 可能會先于 B 發(fā)生,也可能相反,也可能二者同時發(fā)生。A 可能會導(dǎo)致 B 的發(fā)生,也可能相反,也可能二者之間根本就沒有因果關(guān)系。
例如考慮一些可能是新的信息的概率條件性可以通過貝葉斯定理實現(xiàn)。
目錄 |
定義
在同一個樣本空間 Ω 中的事件或者子集 A 與 B,如果隨機從 Ω 中選出的一個元素屬于 B,那么下一個隨機選擇的元素屬于 A 的概率就定義為在 B 的前提下 A 的條件概率?! ?/p>
統(tǒng)計獨立性
當(dāng)且僅當(dāng)兩個隨機事件 A 與 B 滿足 P(A∩B)=P(A)P(B).
的時候,它們才是統(tǒng)計獨立的,這樣聯(lián)合概率可以表示為各自概率的簡單乘積。
同樣,對于兩個獨立事件 A 與 B 有P(A|B) = P(A)
以及P(B|A) = P(B)
換句話說,如果 A 與 B 是相互獨立的,那么 A 在 B 這個前提下的條件概率就是 A 自身的概率;同樣,B 在 A 的前提下的條件概率就是 B 自身的概率?! ?/p>
互斥性
當(dāng)且僅當(dāng) A 與 B 滿足 P(A∪B)=P(A)+P(B)
且 P(A∩B)=0
, 的時候,A 與 B 是互斥的。
因此,
換句話說,如果 B 已經(jīng)發(fā)生,由于 A 不能 B 在同一場合下發(fā)生,那么 A 發(fā)生的概率為零;同樣,如果 A 已經(jīng)發(fā)生,那么 B 發(fā)生的概率為零?! ?/p>
其它
如果事件 B 的概率 P(B) > 0,那么 Q(A) = P(A | B) 在所有事件 A 上所定義的函數(shù) Q 就是概率測度。 如果 P(B) = 0,P(A | B) 沒有定義。 條件概率可以用決策樹進行計算。
條件概率謬論
條件概率的謬論是假設(shè) P(A|B) 大致等于 P(B|A)。數(shù)學(xué)家John Allen Paulos 在他的《數(shù)學(xué)盲》一書中指出醫(yī)生、律師以及其他受過很好教育的非統(tǒng)計學(xué)家經(jīng)常會犯這樣的錯誤。這種錯誤可以通過用實數(shù)而不是概率來描述數(shù)據(jù)的方法來避免。
P(A|B) 與 P(B|A)的關(guān)系如下所示:
下面是一個虛構(gòu)但寫實的例子,P(A|B) 與 P(B|A)的差距可能令人驚訝,同時也相當(dāng)明顯。
若想分辨某些個體是否有重大疾病,以便早期治療,我們可能會對一大群人進行檢驗。雖然其益處明顯可見,但同時,檢驗行為有一個地方引起爭議,就是有檢出假陽性的結(jié)果的可能:若有個未得疾病的人,卻在初檢時被誤檢為得病,他可能會感到苦惱煩悶,一直持續(xù)到更詳細(xì)的檢測顯示他并未得病為止。而且就算在告知他其實是健康的人后,也可能因此對他的人生有負(fù)面影響。
這個問題的重要性,最適合用條件機率的觀點來解釋。
假設(shè)人群中有1%的人罹患此疾病,而其他人是健康的。我們隨機選出任一個體,并將患病以disease、健康以well表示:
P(disease) = 1% = 0.01 and P(well) = 99% = 0.99. 假設(shè)檢驗動作實施在未患病的人身上時,有1%的機率其結(jié)果為假陽性(陽性以positive表示)。意即:
P(positive | well) = 1%,而且P(negative | well) = 99%. 最后,假設(shè)檢驗動作實施在患病的人身上時,有1%的機率其結(jié)果為假陰性(陰性以negative表示)。意即:
P(negative | disease) = 1%且P(positive | disease) = 99%。 現(xiàn)在,由計算可知:
是整群人中健康、且測定為陰性者的比率。
是整群人中得病、且測定為陽性者的比率。
是整群人中被測定為假陽性者的比率。
是整群人中被測定為假陰性者的比率。
進一步得出:
是整群人中被測出為陽性者的比率。
是某人被測出為陽性時,實際上真的得了病的機率。
這個例子里面,我們很輕易可以看出 P(positive|disease)=99% 與 P(disease|positive)=50% 的差距:前者是你得了病,而被檢出為陽性的條件機率;后者是你被檢出為陽性,而你實際上真得了病的條件機率。由我們在本例中所選的數(shù)字,最終結(jié)果可能令人難以接受:被測定為陽性者,其中的半數(shù)實際上是假陽性。
離散概率分布:均勻 ? 伯努利 ? 幾何 ? 二項 ? 泊松 ? 超幾何 ? 多項 ? 負(fù)二項 ? 玻爾茲曼 ? 復(fù)合泊松 ? 退化 ? 高斯-庫茲明 ? 對數(shù) ? 拉德馬赫 ? Skellam
? Yule-Simon ? ζ ? 齊夫 ? 齊夫-曼德爾布羅特 ? 拋物線分形
連續(xù)概率分布:均勻 ? 正態(tài) ? 指數(shù) ? β(貝塔) ? β'(第二類) ? 柯西 ? χ2(卡方) ? δ(德爾塔) ? Erlang ? 廣義誤差 ? F ? 衰落 ? Fisher的z
? Fisher-Tippett ? γ(伽瑪) ? 廣義極值 ? 廣義雙曲 ? 半邏輯 ? Hotelling的T平方 ? 雙曲正割 ? 超指數(shù) ? 逆χ2 ? 逆高斯 ? 廣義逆高斯
? 逆γ ? Kumaraswamy ? Landau ? 拉普拉斯 ? 列維 ? 穩(wěn)定 ? 邏輯 ? 對數(shù)正態(tài)?麥克斯韋-玻爾茲曼?麥克斯韋速率分布律 ? 玻色-愛因斯坦
? 費米-狄拉克 ? Pareto ? Pearson ? 極角 ? 余弦平方 ? 瑞利 ? 相對論的Breit-Wigner ? 萊斯 ? t(學(xué)生氏) ? 三角 ? 第一類Gumbel
?第二類Gumbel ? Voigt ? von Mises ? 韋氏 ? Wigner半圓形
其它分布:康托爾分布 ? 條件概率 ? 指數(shù)分布族 ? infinitely divisible ? location-scale family ? marginal ? maximum entropy ? phase-type ? posterior
? prior ? 擬概率 ? 抽樣分配 ? singular
多隨機變量:狄利克雷 ? 肯特 ? 矩陣常態(tài)分配 ? 多變量常態(tài)分配 ? von Mises-Fisher ? Wigner擬概率 ? Wishart Ewens抽樣公式
關(guān)于“條件概率”的留言: | 訂閱討論RSS |
目前暫無留言 | |
添加留言 |