|
El teorema de Bayes va sorgir intentant contestar a preguntes com aquesta: Si m'han fet un test de COVID i he donat positiu. Quina és la probabilitat de què realment tingui la malaltia? Definim el problema: Suposem que el 20% d'una població se sap que està infectada de COVID perquè se li ha fet un anàlisi de sang i s'hi ha vist el virus. Fer això és molt costòs, per la qual cosa es fa servir un test molt barat fregant una mostra de moc amb un palet amb un coto fluix i un reactiu. Se sap que detecta el 95% de vertaders positius i entre la població no infectada dona un 8% de falsos positius. Volem contestar a preguntes del tipus: Si el test dona positiu, quina és la probabilitat de que la persona a la que s'ha fet el test tingui realment la malaltia?
`I` estar infectat amb la malaltia, `S` No estar infectat (Estar sa), `+` donar positiu en el test barat, `-` donar negatiu en el test barat. L'expressió `P(+|I)` es llegeix probabilitat de ser positiu en el test entre els que estan realment infectats. Anem a escriure les dades el problema que són probabilitats.
`P(+|I)=0,95`; `P(+|S)=0,08` Fent servir la probabilitat de l'esdeveniment contrari `P(bar(A))=1-P(A)` podem calcular les altres probabilitats:
I la pregunta: Si el test dona positiu, quina és la probabilitat de que tingui realment la malaltia? es tradueix:
Anem a fer un diagrama d'arbre on hi posarem totes aquestes probabilitats:
I ara recordem `P(+)·P(I|+) = P(+ \cap I) =P(I)·P(+ | I)` `P(I|+) = (P(I)·P(+ | I))/(P(+))` I podem calcular `P(+)=P(+ \cap I)+ P(+\cap S)=P(I)·P(+ | I)+P(S)·P(+ | S)` O sigui: I com tot això ja és a la taula: Un `74,8%`. O sigui, hi ha un `24,2%` de no tenir-la. "Fixeu-vos que, tot i que el test té un `95%` de fiabilitat, si dones positiu la teva probabilitat real d'estar malalt és del `75%`. Això passa perquè la malaltia no és extremadament comuna (`20%`) i els falsos positius del grup sa (`8%`) pesen molt en el resultat final." Comprovació visual amb una taula de contingència: Suposem que tenim `1000` persones.
La probabilitat de que estiguin infectats entre els que donin positiu `P(I|+)=190/254 = 0,748031` `P(A|B)=(P(A \cap B))/(P(B))` i `P(B|A)=(P(A \cap B))/(P(A))` `P(A \cap B) = P(B)·P(A|B)` i `P(A \cap B) = P(A)·P(B|A)` `P(B)·P(A|B)=P(A)·P(B|A)` Teorema de Bayes (f1): Suposem que tenim `E`, Espai mostral d'una certa experiència aleatòria partit per `{A_1,A_2,...,A_n}, n` esdeveniments mutuament excloents `=>`
2- `A_i \cap A_j = \emptyset` ` \forall i,j<=n` `/ i ne j ` Tot plegat fa que `B= \sum_{i=1}^n A_i \cap B` `=>` `P(B)= \sum_{i=1}^\n P(A_i \cap B)` `=>` `P(B)= \sum_{i=1}^\n P(A_i)· P(B|A_i)` (f2) Fórmula de bayes (f3): Exemple 0: La probabilitat que un autobús que va a Barcelona tingui un accident en un dia ennuvolat és de `0,09`, i en un dia de sol, `0,005`. Durant un perióde de deu dies ha fet set dies de sol i tres ennuvolat. Esdeveniments:
Probabilitats condicionades:
Dades que ens donen:
Posem aquesta informació en una taula:
Sabent que s’ha produït un accident en aquest dies, troba:
b) La probabilitat que s’hagi produït en un dia de sol. a)
Sabem que `P(A)·P(E|A)=P(A\capE)=P(E)·P(A|E)` O sigui: `P(E|A)=(P(E)·P(A|E))/(P(A))` I `P(A)=P(A\capE)+ P(A\capS)=P(E)·P(A|E)+P(S)·P(A|S)` La qual cosa vol dir: `P(E|A)=(P(E)·P(A|E))/(P(E)·P(A|E)+P(S)·P(A|S))` que és la fórmula de Bayes (f3) En el nostre cas i mirant els valors a la taula: `P(E|A)=(0,027)/(0,027+0,0035) = 0,885246` b)
Exemple 1 (és l'exemple 0 sense tantes explicacions. Aplicant les fórmules, suposant que les sabem): La probabilitat que un autobús que va a Barcelona tingui un accident en un dia ennuvolat és de `0,09`, i en un dia de sol, `0,005`. Durant un perióde de deu dies ha fet set dies de sol i tres ennuvolat. Sabent que s’ha produït un accident en aquest dies, troba: a) La probabilitat que s’hagi produït en un dia ennuvolat. b) La probabilitat que s’hagi produït en un dia de sol. Solució: Esdeveniments:
Dades que ens donen:
Necessitem saber la probabilitat de tenir un accident (f2): Respostes: Apliquem teorema de Bayes (f1)
b) `P(S|A)=(P(S)·P(A|S))/(P(A))=(0,7*0,005)/(0,0305) = 0,114754` Exemple 2: Coneixem que una malatia anomenada X la pateix l'`1 %` de la població. La prova mèdica que la detecta té un error del `5%` en falsos positius i un `2%` en falsos negatius. Si una persona li passem la prova i dona positiva, quina és la probabilitat de què tingui realment la malatia? Solució:
La pregunta que ens fan és, la probabilitat que tingui la malatia si ha donat positiu. `P(M|P)`. Dades que ens donen:
`P(P|\overline M)=0,05` `=>` `P(\overline P | \overline M)=0,95` `P(\overline P | M)=0,02` `=>` `P(P|M)=0,98` `P(M|P)=(P(M)·P(P|M))/(P(P))=(P(M)·P(P|M))/(P(M)·P(P|M)+P(\overline M)·P(P|\overline M))=(0,01*0,98)/(0,01*0,98+0,99*0,05) = 0,165261` Exemple 2': I, en el cas anterior, si una persona dona negatiu, quina és la probabilitat que tingui la malaltia? Solució:
La pregunta que ens fan és, la probabilitat que tingui la malatia si ha donat negatiu. `P(M|\overline P)`. Dades que ens donen:
`P(P|\overline M)=0,05` `=>` `P(\overline P | \overline M)=0,95` `P(\overline P | M)=0,02` `=>` `P(P|M)=0,98` `P(M|\overline P)=(P(M)·P(\overline P|M))/(P(\overline P))=(P(M)·P(\overline P|M))/(P(M)·P(\overline P|M)+P(\overline M)·P(\overline P|\overline M))=(0,01*0,02)/(0,01*0,02+0,99*0,95) = 0,000213` Exemple 2'': Finalment ens preguntarem pel càlcul de les dues probabilitats que ens falten: La probabilitat de no tenir la malaltia en cas de donar positiu i no tenir la malaltia en cas de donar negatiu. Solució:
Les preguntes que ens fan son, `P(\overline M|P)` i `P(\overline M|\overline P)`. Dades que ens donen:
`P(P|\overline M)=0,05` `=>` `P(\overline P | \overline M)=0,95` `P(\overline P | M)=0,02` `=>` `P(P|M)=0,98` `P(\overline M|P)=(P(\overline M)·P(P|\overline M))/(P(P))=(P(\overline M)·P(P|\overline M))/(P(M)·P(P|M)+P(\overline M)·P(P|\overline M))=(0,99*0,05)/(0,01*0,98+0,99*0,05) = 0,834739` `P(\overline M|\overline P)=(P(\overline M)·P(\overline P|\overline M))/(P(\overline P))=(P(\overline M)·P(\overline P|\overline M))/(P(M)·P(\overline P|M)+P(\overline M)·P(\overline P|\overline M))=(0,99*0,95)/(0,01*0,02+0,99*0,95) = 0,999787` Podem fer la següent comprovació, entre els que donen positiu la suma de les probabilitats de tenir o no tenir la malaltia ha de donar `1 =>` I entre els que donen negatiu,la suma de les probabilitats de tenir o no tenir la malaltia ha de donar `1 =>` |