Teorema de Bayes

El teorema de Bayes va sorgir intentant contestar a preguntes com aquesta:

Si m'han fet un test de COVID i he donat positiu. Quina és la probabilitat de què realment tingui la malaltia?

Definim el problema: Suposem que el 20% d'una població se sap que està infectada de COVID perquè se li ha fet un anàlisi de sang i s'hi ha vist el virus. Fer això és molt costòs, per la qual cosa es fa servir un test molt barat fregant una mostra de moc amb un palet amb un coto fluix i un reactiu. Se sap que detecta el 95% de vertaders positius i entre la població no infectada dona un 8% de falsos positius. Volem contestar a preguntes del tipus: Si el test dona positiu, quina és la probabilitat de que la persona a la que s'ha fet el test tingui realment la malaltia?

`P(S)=0,8`; `P(-|I)=0,05`; `P(-|S)=0,92`

`P(I|+)`

					`Total`

		`P(+\|I)=0,95`	`P(I\cap +)=P(I)·P(+\|I)=`	`0,2·0,95 =`	`0,19`
	`P(I)= 0,2<`
		`P(-\|I)=0,05`	`P(I\cap -)=P(I)·P(-\|I)=`	`0,2·0,05 =`	`0,01`
`<`
		`P(+\|S)=0,08`	`P(S\cap +)=P(S)·P(+\|S)=`	`0,8·0,08 =`	`0,064`
	`P(S)= 0,8 <`
		`P(-\|S)=0,92`	`P(S\cap-)=P(S)·P(-\|S)=`	`0,8·0,92 =`	`0,736`

					`0,19+0,01+0,064+0,736 = 1`

`P(+)·P(I|+) = P(I)·P(+ | I)`

`P(I|+) = (P(I)·P(+ | I))/(P(+))`

`P(I|+) = (P(I)·P(+ | I))/(P(I)·P(+ | I)+P(S)·P(+ | S))`

`P(I|+) = (0,19)/(0,19+0,064) = 0,748031`

Un `74,8%`. O sigui, hi ha un `24,2%` de no tenir-la.

"Fixeu-vos que, tot i que el test té un `95%` de fiabilitat, si dones positiu la teva probabilitat real d'estar malalt és del `75%`. Això passa perquè la malaltia no és extremadament comuna (`20%`) i els falsos positius del grup sa (`8%`) pesen molt en el resultat final."

Comprovació visual amb una taula de contingència:

Suposem que tenim `1000` persones.

	Infectats	Sans	Total
test positiu `+`	`1000*0,2·0,95`	`1000·0,8·0,08`
test negatiu `-`	`1000·0,2·0,05`	`1000·0,8·0,92`

	Infectats	Sans	Total
test positiu `+`	`190`	`64`	`254`
test negatiu `-`	`10`	`736`	`746`
	`200`	`800`	`1000`

La probabilitat de que estiguin infectats entre els que donin positiu `P(I|+)=190/254 = 0,748031`

Fórmules

Teorema de Bayes (f1):
`P(A|B)=(P(A)·P(B|A))/(P(B))`

Suposem que tenim `E`, Espai mostral d'una certa experiència aleatòria partit per `{A_1,A_2,...,A_n}, n` esdeveniments mutuament excloents `=>`

Tot plegat fa que `B= \sum_{i=1}^n A_i \cap B` `=>` `P(B)= \sum_{i=1}^\n P(A_i \cap B)` `=>` `P(B)= \sum_{i=1}^\n P(A_i)· P(B|A_i)` (f2)

Fórmula de bayes (f3):
`P(A_k|B)=(P(A_k)·P(B|A_k))/(\sum_{i=1}^\n P(A_i)· P(B|A_i))`

Exemple 0: La probabilitat que un autobús que va a Barcelona tingui un accident en un dia ennuvolat és de `0,09`, i en un dia de sol, `0,005`. Durant un perióde de deu dies ha fet set dies de sol i tres ennuvolat.

Esdeveniments:

`E`, estar ennubolat - `S`, dia assolejat. `A` accident - `N` no accident.

Probabilitats condicionades:

`P(A|E) = P(`Tenir accident sabent que està ennubolat`)` . `P(A|S) = P(`Tenir accident sabent que no està ennubolat`)`

Dades que ens donen:

`P(S)=7/10=0,7` - `P(E)=3/10=0,3` . `P(A|E)=0,09` - `P(A|S)=0,005`

Posem aquesta informació en una taula:

					`Total`

		`P(A\|E)=0,09`	`P(E\capA)=P(E)·P(A\|E)=`	`0,3·0,09 =`	`0,027`
	`P(E)= 0,3<`
		`P(N\|E)=0,91`	`P(E\capN)=P(E)·P(N\|E)=`	`0,3·0,91 =`	`0,273`
`<`
		`P(A\|S)=0,005`	`P(S\capA)=P(S)·P(A\|S)=`	`0,7·0,005 =`	`0,0035`
	`P(S)= 0,7 <`
		`P(N\|S)=0,995`	`P(S\|N)=P(S)·P(N\|S)=`	`0,7·0,995 =`	`0,6965`

					`0,027+0,273+0,0035+0,6965 = 1`

Sabent que s’ha produït un accident en aquest dies, troba:

(f3)

El que ens demanen és `P(S|A)=(P(S)·P(A|S))/(P(A))=(0,0035)/(0,027+0,0035) = 0,114754`

Exemple 1 (és l'exemple 0 sense tantes explicacions. Aplicant les fórmules, suposant que les sabem): La probabilitat que un autobús que va a Barcelona tingui un accident en un dia ennuvolat és de `0,09`, i en un dia de sol, `0,005`. Durant un perióde de deu dies ha fet set dies de sol i tres ennuvolat. Sabent que s’ha produït un accident en aquest dies, troba:

a) La probabilitat que s’hagi produït en un dia ennuvolat.

b) La probabilitat que s’hagi produït en un dia de sol.

Solució:

`E`, estar ennubolat - `S`, dia assolejat. `A` accident - `N` no accident.

`P(A|E)=0,09` - `P(A|S)=0,005`. `P(S)=7/10=0,7` - `P(E)=3/10=0,3`

(f2)

`P(A)=P(E)·P(A|E)+P(S)·P(A|S)=0,3*0,09+0,7*0,005 = 0,0305`

(f1)

Exemple 2: Coneixem que una malatia anomenada X la pateix l'`1 %` de la població. La prova mèdica que la detecta té un error del `5%` en falsos positius i un `2%` en falsos negatius. Si una persona li passem la prova i dona positiva, quina és la probabilitat de què tingui realment la malatia?

Solució:

`M`, Té la malaltia - `\overline M`, no la té. `P` dona positiva la prova - `\overline P` dona negatiu la prova.

Exemple 2': I, en el cas anterior, si una persona dona negatiu, quina és la probabilitat que tingui la malaltia?

Solució:

`M`, Té la malaltia - `\overline M`, no la té. `P` dona positiva la prova - `\overline P` dona negatiu la prova.

Exemple 2'': Finalment ens preguntarem pel càlcul de les dues probabilitats que ens falten: La probabilitat de no tenir la malaltia en cas de donar positiu i no tenir la malaltia en cas de donar negatiu.

Solució:

`M`, Té la malaltia - `\overline M`, no la té. `P` dona positiva la prova - `\overline P` dona negatiu la prova.

`P(M|P)+P(\overlineM|P)=0,165261+0,834739 = 1`

`P(M|\overline P)+P(\overline M|\overline P)=0,000213+0,999787 = 1`