cosa dice il teorema di Bayes

Il teorema di Bayes, cioè la formula che permette di invertire una probabilità condizionata, esprime P(A\mid B) tramite P(B\mid A), le probabilità dei due eventi e la probabilità totale di B. Per esempio, se un test è positivo con probabilità 0{,}95 quando la malattia c'è, e la malattia ha probabilità 0{,}02, Bayes serve a stimare la probabilità reale di malattia dato un test positivo.

Probabilità condizionata e teorema di Bayes

Calcolo di eventi condizionati

Altre opzioni

Simula interrogazione Risolutore esercizi Correggi compiti

Concetto chiave

Probabilità condizionata e teorema di Bayes

La probabilità condizionata misura la probabilità di un evento A sapendo che B si è verificato. Il teorema di Bayes permette di invertire questa informazione e di risalire a $P(A\mid B)$ partendo da dati più semplici.

P(A\mid B)=\frac{P(A\cap B)}{P(B)}

✓Condizionata: si considera solo il caso in cui B è avvenuto.
✓Composta: $P(A\cap B)=P(A\mid B)\cdot P(B)$ .
✓Indipendenza: se A e B sono indipendenti, allora $P(A\mid B)=P(A)$ .
✓Bayes: aggiorna una probabilità alla luce di una nuova informazione.
✓Totale: si usa una partizione dello spazio campionario per calcolare probabilità complesse.

Formule e proprietà della probabilità condizionata e di Bayes

Formula/Proprietà	Significato	Condizioni/Note
$\displaystyle { P(A\mid B)=\frac{P(A\cap B)}{P(B)} }$	Probabilità che si verifichi $A$ sapendo che si è verificato $B$	Serve $P(B)>0$ ; si restringe lo spazio ai casi con $B$
$P(A\cap B)=P(A\mid B)\cdot P(B)$	Formula della probabilità composta	Vale anche scambiando i ruoli di $A$ e $B$
$P(A\cap B)=P(B\mid A)\cdot P(A)$	Stessa intersezione scritta con la probabilità condizionata opposta	Utile per confrontare i due versi della relazione
$P(A\mid B)=P(A)$	Definizione operativa di eventi indipendenti	Equivale a $P(A\cap B)=P(A)\cdot P(B)$
$P(A)=\sum_i P(A\mid B_i)\,P(B_i)$	Teorema della probabilità totale	Gli eventi $B_i$ devono formare una partizione dello spazio campionario
$\displaystyle { P(B_j\mid A)=\frac{P(A\mid B_j)\,P(B_j)}{\sum_i P(A\mid B_i)\,P(B_i)} }$	Teorema di Bayes: aggiorna la probabilità di una causa dopo l’osservazione di un effetto	Vale con partizione $\{B_i\}$ e $P(A)>0$
Test diagnostico	Bayes serve per calcolare la probabilità di malattia dato un esito positivo	Conta anche la prevalenza e i falsi positivi
Estrazioni senza reimmissione	La probabilità condizionata cambia dopo ogni estrazione	Gli eventi non sono in genere indipendenti

Probabilità condizionata e teorema di Bayes

La probabilità condizionata, cioè la probabilità di un evento sapendo che un altro evento è già avvenuto, serve quando l'informazione cambia il calcolo.

Si pensa a una situazione in cui il campione disponibile si restringe. Non si ragiona più su tutti i casi possibili, ma solo su quelli compatibili con l'informazione nota.

Questo passaggio è essenziale nei test medici, nelle estrazioni e nei problemi in cui i dati arrivano in più fasi.

P(A\mid B)=\frac{P(A\cap B)}{P(B)}\qquad \text{con }P(B)>0

Per esempio, se $P(A\cap B)=0{,}12$ e $P(B)=0{,}3$ , allora $P(A\mid B)=0{,}12/0{,}3=0{,}4$ .

Il teorema di Bayes, cioè la regola che permette di invertire una probabilità condizionata, risponde alla domanda opposta: come si aggiorna la probabilità della causa, sapendo l'effetto osservato?

Si osserva quindi una catena logica precisa: prima si restringe il contesto, poi si ricava la probabilità cercata con formule coerenti tra loro.

[IMMAGINE: Diagramma ad albero con due eventi B e non B, sottoeventi A e non A, probabilità sui rami, evidenziazione dell'intersezione A ∩ B e della condizionata P(A|B)]

Definizione di probabilità condizionata

La definizione nasce da un'idea concreta: se l'evento $B$ è già accaduto, allora lo spazio dei casi possibili diventa solo quello di $B$ .

In questo nuovo spazio, si misura quanta parte di $B$ contiene anche $A$ .

P(A\mid B)=\frac{P(A\cap B)}{P(B)}

Per esempio, se in una classe il 20% degli studenti porta gli occhiali e il 5% porta gli occhiali e il cappello, allora, sapendo che uno studente porta gli occhiali, la probabilità che porti anche il cappello è $0{,}05/0{,}20=0{,}25$ .

La formula ha senso solo se $P(B)>0$ . Se $P(B)=0$ , il rapporto non è definito e l'informazione non può essere usata in questo modo.

Si tratta quindi di una normalizzazione: si prende la parte comune $A\cap B$ e la si confronta con tutto $B$ .

P(A\cap B)=P(A\mid B)\cdot P(B)

Per esempio, se $P(A\mid B)=0{,}4$ e $P(B)=0{,}3$ , allora $P(A\cap B)=0{,}4\cdot 0{,}3=0{,}12$ .

Eventi indipendenti

Due eventi sono indipendenti, cioè uno non cambia la probabilità dell'altro, quando l'informazione su uno dei due non modifica il calcolo dell'altro.

Pensala come due azioni separate. Conoscere il risultato della prima non dà vantaggi sulla seconda.

P(A\mid B)=P(A)

Per esempio, se $P(A)=0{,}2$ e si verifica anche $B$ , allora, nei casi indipendenti, resta $P(A\mid B)=0{,}2$ .

P(A\cap B)=P(A)\cdot P(B)

Per esempio, se $P(A)=0{,}2$ e $P(B)=0{,}5$ , allora $P(A\cap B)=0{,}2\cdot 0{,}5=0{,}1$ .

Le due definizioni sono equivalenti quando $P(B)>0$ .

Se vale $P(A\mid B)=P(A)$ , gli eventi sono indipendenti.
Se vale $P(A\cap B)=P(A)P(B)$ , gli eventi sono indipendenti.

Teorema della probabilità totale

Il teorema della probabilità totale serve quando un evento può avvenire tramite casi diversi e incompatibili tra loro.

Si considera una partizione, cioè una suddivisione completa e disgiunta dello spazio campionario in eventi che non si sovrappongono.

Gli eventi $H_1,\dots,H_n$ sono incompatibili a due a due.
La loro unione copre tutto lo spazio campionario.
Ogni $H_i$ ha probabilità positiva.

P(A)=\sum_{i=1}^{n}P(A\mid H_i)\,P(H_i)

Per esempio, se ci sono due urne possibili con probabilità $0{,}6$ e $0{,}4$ , e le probabilità condizionate di estrarre una pallina rossa sono $0{,}3$ e $0{,}8$ , allora $P(A)=0{,}3\cdot 0{,}6+0{,}8\cdot 0{,}4=0{,}5$ .

Questo risultato permette di calcolare una probabilità globale partendo da scenari parziali diversi.

Teorema di Bayes

Il teorema di Bayes permette di invertire l'informazione: si parte dall'effetto osservato e si risale alla causa più probabile.

Si tratta della stessa struttura della probabilità condizionata, riscritta in modo utile quando si conosce $P(A\mid B)$ ma si cerca $P(B\mid A)$ .

P(H_i\mid A)=\frac{P(A\mid H_i)\,P(H_i)}{\sum_{j=1}^{n}P(A\mid H_j)\,P(H_j)}

Per esempio, se un test è positivo e si confrontano due ipotesi compatibili, la formula permette di aggiornare la probabilità di ciascuna ipotesi in modo rigoroso.

Nel numeratore compare l'ipotesi cercata. Nel denominatore compare la probabilità totale dell'evento osservato.

P(B\mid A)=\frac{P(A\mid B)\,P(B)}{P(A)}

Per esempio, se $P(A\mid B)=0{,}7$ , $P(B)=0{,}2$ e $P(A)=0{,}5$ , allora $P(B\mid A)=0{,}7\cdot 0{,}2/0{,}5=0{,}28$ .

Il cuore del metodo è confrontare la parte utile dell'informazione con tutta l'informazione osservata.

Applicazioni ed esercizi

Nei test diagnostici si ragiona spesso in termini di falsi positivi e falsi negativi, cioè risultati del test che non coincidono con lo stato reale.

Si distingue la sensibilità, cioè la probabilità di risultato positivo se la malattia c'è, dalla specificità, cioè la probabilità di risultato negativo se la malattia non c'è.

P(\text{malattia}\mid \text{test positivo})=\frac{P(\text{test positivo}\mid \text{malattia})\,P(\text{malattia})}{P(\text{test positivo})}

Per esempio, se la malattia ha prevalenza $0{,}01$ e il test è positivo nel $95\%$ dei malati, il valore finale può restare basso se i falsi positivi sono numerosi.

Questo spiega perché un test positivo non equivale sempre a una probabilità alta di essere malati.

Negli esercizi con estrazioni senza reimmissione si aggiorna il calcolo dopo ogni estrazione, perché la composizione dell'insieme cambia.

Per esempio, se si estraggono due carte da un mazzo senza rimetterle, la seconda probabilità dipende già dalla prima estrazione.

Esempio — Test diagnostico con Bayes

Si consideri un test con prevalenza bassa e risultato positivo.

Si calcola prima la probabilità del risultato positivo totale tramite la probabilità totale.

P(+)=P(+\mid M)P(M)+P(+\mid \overline{M})P(\overline{M})

Poi si applica Bayes per ottenere la probabilità richiesta:

P(M\mid +)=\frac{P(+\mid M)P(M)}{P(+)}

Il risultato finale può essere molto diverso da $P(+\mid M)$ perché entrano anche i falsi positivi.

In sintesi, Bayes non serve a memorizzare un trucco. Serve a leggere correttamente i dati quando l'informazione arriva in senso inverso rispetto alla causa cercata.

Formule e proprietà

La probabilità condizionata, cioè la probabilità che un evento accada sapendo che un altro evento si è verificato, si definisce con un rapporto tra probabilità.

P(A\mid B)=\frac{P(A\cap B)}{P(B)}\qquad P(B)>0

Si legge: la probabilità di $A$ dato $B$ è uguale alla probabilità dell'intersezione divisa per la probabilità di $B$ . Il simbolo $\cap$ indica che i due eventi si verificano insieme.

Esempio — Calcolo di P(A|B)

Si considerino due eventi con $P(A\cap B)=0{,}12$ e $P(B)=0{,}30$ .

P(A\mid B)=\frac{0{,}12}{0{,}30}=0{,}4

Il risultato significa che, sapendo che $B$ si è verificato, la probabilità di $A$ è pari a $0{,}4$ .

La probabilità composta, cioè la probabilità che due eventi avvengano entrambi, si ottiene moltiplicando la probabilità condizionata per la probabilità del condizionante.

P(A\cap B)=P(A\mid B)\cdot P(B)

In questa forma si usa spesso la grandezza nota e si ricava l'intersezione. Se $P(A\mid B)=0{,}4$ e $P(B)=0{,}30$ , allora $P(A\cap B)=0{,}12$ .

Esempio — Probabilità composta da dati condizionati

Si supponga che $P(A\mid B)=0{,}25$ e $P(B)=0{,}8$ .

P(A\cap B)=0{,}25\cdot 0{,}8=0{,}2

L'intersezione vale $0{,}2$ . Il dato esprime la probabilità dei casi in cui $A$ e $B$ avvengono insieme.

Due eventi sono indipendenti, cioè il verificarsi di uno non modifica la probabilità dell'altro, quando la probabilità condizionata coincide con la probabilità semplice.

P(A\mid B)=P(A)\qquad \text{e quindi}\qquad P(A\cap B)=P(A)\cdot P(B)

Se $P(A)=0{,}5$ e $P(B)=0{,}2$ , allora per indipendenza si ha $P(A\cap B)=0{,}1$ . Non si deve confondere l'indipendenza con la disgiunzione.

Si richiede $P(B)>0$ per definire $P(A\mid B)$
L'indipendenza vale in entrambe le direzioni.
Se gli eventi sono indipendenti, allora conoscere $B$ non cambia $P(A)$

Il teorema della probabilità totale, cioè la somma delle probabilità di un evento sui casi di una partizione, si applica quando lo spazio campionario è diviso in eventi incompatibili ed esaustivi.

P(A)=\sum_{i=1}^{n}P(A\mid B_i)\,P(B_i)

Gli eventi $B_i$ devono formare una partizione, cioè essere a due a due disgiunti e coprire tutti i casi possibili. Se i casi sono tre, per esempio $B_1$ , $B_2$ e $B_3$ , si sommano tre contributi distinti.

Esempio — Probabilità totale con tre casi

Si considerino tre casi con $P(B_1)=0{,}2$ , $P(B_2)=0{,}3$ e $P(B_3)=0{,}5$ .

Si abbia inoltre $P(A\mid B_1)=0{,}1$ , $P(A\mid B_2)=0{,}4$ e $P(A\mid B_3)=0{,}6$ .

P(A)=0{,}1\cdot 0{,}2+0{,}4\cdot 0{,}3+0{,}6\cdot 0{,}5=0{,}43

La probabilità dell'evento $A$ è quindi $0{,}43$ .

Il teorema di Bayes, cioè la formula che permette di invertire una probabilità condizionata, ricava la probabilità di una causa sapendo che si è osservato un effetto.

P(B_j\mid A)=\frac{P(A\mid B_j)\,P(B_j)}{\sum_{i=1}^{n}P(A\mid B_i)\,P(B_i)}

Il numeratore contiene il caso cercato. Il denominatore è la probabilità totale dell'evento osservato $A$ . Questa è la forma più utile negli esercizi con dati diagnostici o classificazioni.

Esempio — Bayes in un test diagnostico

Si consideri un test con $P(M)=0{,}02$ per la malattia, $P(+\mid M)=0{,}95$ e $P(+\mid \overline{M})=0{,}08$ .

P(M\mid +)=\frac{0{,}95\cdot 0{,}02}{0{,}95\cdot 0{,}02+0{,}08\cdot 0{,}98}

Si ottiene $P(M\mid +)\approx 0{,}195$ . Il risultato mostra che un esito positivo non coincide con certezza con la malattia. Questa distinzione è essenziale nei problemi di falsi positivi.

Negli esercizi di estrazione senza reimmissione, cioè quando un oggetto estratto non viene rimesso nell'urna, le probabilità condizionate cambiano a ogni passo.

P(A\mid B)=\frac{n(A\cap B)}{n(B)}\qquad \text{nei casi equiprobabili}

Se l'urna contiene 5 sfere rosse e 5 blu, la probabilità di estrarre una rossa sapendo che la prima estratta era blu si calcola sul nuovo totale disponibile. Se restano 4 rosse su 9 sfere, allora la probabilità vale $\displaystyle { \frac{4}{9} }$ .

Esempi svolti

Esempio 1 — Calcolo di una probabilità condizionata

Si considerino una scatola con 5 palline rosse e 3 palline blu. Si estrae una pallina, sapendo che è blu, e si calcola la probabilità che sia la seconda pallina del gruppo blu.

Si indichino con $A$ l’evento "seconda pallina del gruppo blu" e con $B$ l’evento "la pallina estratta è blu". Si cercano i dati utili per $P(A|B)$ .

La probabilità condizionata richiede prima l’intersezione. In questo contesto, l’evento $A∩B$ coincide con l’estrazione della seconda pallina blu dopo avere saputo che la pallina è blu.

P(A|B)=\frac{P(A\cap B)}{P(B)}

Si calcola $\displaystyle { P(B)=\frac{3}{8} }$ , perché le palline blu sono 3 su 8. L’intersezione vale $\displaystyle { P(A\cap B)=\frac{1}{8} }$ , perché una sola pallina soddisfa la richiesta.

P(A|B)=\frac{\frac{1}{8}}{\frac{3}{8}}=\frac{1}{3}

La probabilità cercata è $1/3$ .

Errore comune: usare il numero totale delle palline senza restringere lo spazio agli eventi compatibili con B.

Esempio 2 — Eventi indipendenti

Si lanciano due dadi equilibrati. Si considerino gli eventi: $A$ = "il primo dado mostra 6" e $B$ = "il secondo dado mostra 6".

Si verifica se i due eventi sono indipendenti, cioè se conoscere uno non cambia la probabilità dell’altro.

P(A)=\frac{1}{6},\qquad P(B)=\frac{1}{6}

L’intersezione corrisponde alla coppia $(6,6)$ . Su 36 esiti possibili, uno solo è favorevole.

P(A\cap B)=\frac{1}{36}

Si confronta il prodotto delle probabilità con la probabilità congiunta. Si ottiene $\displaystyle { \frac{1}{6}\cdot\frac{1}{6}=\frac{1}{36} }$ .

I due eventi sono indipendenti perché vale $P(A\cap B)=P(A)P(B)$ .

Errore comune: pensare che due eventi su dadi diversi siano sempre indipendenti senza verificare la condizione formale.

Esempio 3 — Teorema di Bayes in un test diagnostico

Un test diagnostico ha sensibilità del 95% e falsi positivi del 4%. La malattia ha prevalenza del 2%. Si calcola la probabilità di essere malati dato che il test è positivo.

Si definiscano $M$ = "malattia", $T$ = "test positivo". Si cerca $P(M|T)$ .

Si usi il teorema di Bayes. Serve anche la probabilità totale di $T$ .

P(M|T)=\frac{P(T|M)\,P(M)}{P(T|M)\,P(M)+P(T|\overline{M})\,P(\overline{M})}

Si sostituiscono i dati: $P(T|M)=0.95$ , $P(M)=0.02$ , $P(T|\overline{M})=0.04$ , $P(\overline{M})=0.98$ .

P(M|T)=\frac{0.95\cdot 0.02}{0.95\cdot 0.02+0.04\cdot 0.98}

P(M|T)=\frac{0.019}{0.0582}\approx 0.326

La probabilità richiesta è circa il 32.6%. Il test positivo non implica automaticamente malattia certa.

Errore comune: confondere sensibilità elevata con probabilità elevata di essere malati dopo un test positivo.

Esempio 4 — Estrazione senza reimmissione e probabilità totale

In un’urna ci sono 4 palline bianche e 6 nere. Si estraggono due palline senza reimmissione. Si calcola la probabilità che la seconda sia bianca, sapendo che la prima era nera.

Si indichino con $B_1$ l’evento "prima pallina nera" e con $W_2$ l’evento "seconda pallina bianca". Si cerca $P(W_2|B_1)$ .

Dopo una prima estrazione nera, restano 4 bianche e 5 nere. Lo spazio campionario si aggiorna.

P(W_2|B_1)=\frac{4}{9}

La probabilità condizionata si legge direttamente dai casi favorevoli e dai casi possibili rimasti. I casi favorevoli sono 4 su 9.

In alternativa, si può calcolare con la formula della probabilità composta: $P(B_1\cap W_2)=P(B_1)\,P(W_2|B_1)$ .

La probabilità richiesta è 4/9.

Errore comune: trattare la seconda estrazione come se ci fossero ancora 10 palline, ignorando l’assenza di reimmissione.

Errori comuni nella probabilità condizionata e nel teorema di Bayes

✗

Scrivere $\displaystyle { P(A\mid B)=\frac{P(A)}{P(B)} }$ .

✓

Usare $\displaystyle { P(A\mid B)=\frac{P(A\cap B)}{P(B)} }$ , con $P(B)\neq 0$ .

La probabilità condizionata, cioè la probabilità di $A$ sapendo che $B$ è avvenuto, si calcola sull’intersezione. L’errore nasce dal confondere “sapendo che” con un semplice rapporto tra probabilità separate.

✗

Dimenticare che il condizionamento cambia lo spazio di riferimento.

✓

Interpretare $P(A\mid B)$ come probabilità di $A$ dentro il caso in cui $B$ è già certo.

Dopo aver imposto $B$ , si ragiona solo sui casi compatibili con $B$ . Se $B$ non si usa come nuova base, il risultato diventa incoerente.

✗

Applicare Bayes come se fosse $P(A\mid B)=P(B\mid A)$ .

✓

Usare $\displaystyle { P(A\mid B)=\frac{P(B\mid A)\,P(A)}{P(B)} }$ .

Il teorema di Bayes, cioè la formula che inverte una condizione, non scambia direttamente i ruoli di $A$ e $B$ . Serve sempre il fattore di normalizzazione $P(B)$ .

✗

Calcolare $P(B)$ senza la probabilità totale.

✓

Scrivere $P(B)=\sum_i P(B\mid A_i)P(A_i)$ se $\{A_i\}$ è una partizione.

Il teorema della probabilità totale, cioè la scomposizione di un evento in casi incompatibili, è spesso indispensabile in Bayes. L’errore nasce dal usare un denominatore incompleto.

✗

Concludere che due eventi sono indipendenti perché non sono uguali.

✓

Verificare che $P(A\mid B)=P(A)$ oppure che $P(A\cap B)=P(A)P(B)$ .

Indipendenza, cioè assenza di influenza tra eventi, non significa differenza tra eventi. Si controlla una delle due uguaglianze equivalenti.

✗

Trattare come indipendenti due estrazioni senza reimmissione.

✓

Considerare la dipendenza tra estrazioni successive e aggiornare le probabilità a ogni passo.

Senza reimmissione la composizione dell’urna cambia. Per questo le probabilità condizionate variano e Bayes può essere necessario per risalire alla causa più probabile.

Domande frequenti

La probabilità condizionata, cioè la probabilità di un evento sapendo che un altro evento è già avvenuto, misura un'informazione parziale.

P(A\mid B)=\frac{P(A\cap B)}{P(B)}\qquad P(B)>0

Per esempio, se si estraggono carte e si sa che la carta è un asso, la probabilità che sia di cuori cambia rispetto al caso totale. Se gli assi sono 4 e l'asso di cuori è 1, allora $\displaystyle { P(\text{cuori}\mid \text{asso})=\frac{1}{4} }$ .

P(\text{cuori}\mid \text{asso})=\frac{1}{4}

Si calcola dividendo la probabilità dell'intersezione per la probabilità dell'evento condizionante.

P(A\mid B)=\frac{P(A\cap B)}{P(B)}

Per esempio, se $P(A\cap B)=0{,}12$ e $P(B)=0{,}3$ , allora $P(A\mid B)=0{,}4$ .

P(A\mid B)=\frac{0{,}12}{0{,}3}=0{,}4

Il teorema di Bayes, cioè la formula che permette di invertire una probabilità condizionata, esprime $P(A\mid B)$ tramite $P(B\mid A)$ , le probabilità dei due eventi e la probabilità totale di $B$ .

P(A\mid B)=\frac{P(B\mid A)\,P(A)}{P(B)}

Per esempio, se un test è positivo con probabilità $0{,}95$ quando la malattia c'è, e la malattia ha probabilità $0{,}02$ , Bayes serve a stimare la probabilità reale di malattia dato un test positivo.

P(M\mid +)=\frac{P(+\mid M)\,P(M)}{P(+)}

Due eventi sono indipendenti, cioè uno non modifica la probabilità dell'altro, quando la probabilità condizionata coincide con la probabilità semplice.

P(A\mid B)=P(A)\qquad \text{e quindi} \qquad P(A\cap B)=P(A)P(B)

Per esempio, se $P(A)=0{,}4$ e $P(A\mid B)=0{,}4$ , allora sapere che $B$ è avvenuto non cambia la probabilità di $A$ .

0{,}4=0{,}4

Si usa per trovare una probabilità inversa, cioè la probabilità della causa sapendo l'effetto osservato.

P(A\mid B)=\frac{P(B\mid A)P(A)}{P(B)}

Negli esercizi si individuano prima i casi possibili, poi si calcola $P(B)$ con la probabilità totale, e infine si applica la formula.

P(B)=\sum_i P(B\mid A_i)P(A_i)

Per esempio, nei test medici si calcola la probabilità di essere malati dopo un esito positivo, non la probabilità del test positivo sapendo la malattia. Questo passaggio è essenziale.

Si riconosce dagli indizi del testo.

\text{Indipendenza: }P(A\mid B)=P(A)\qquad \text{Bayes: }P(A\mid B)\text{ da }P(B\mid A)

Se il testo chiede una probabilità senza inversione del condizionamento, spesso basta la definizione o la formula composta. Se invece chiede la causa a partire dall'effetto, di solito serve Bayes.

P(A\cap B)=P(A\mid B)P(B)

Per esempio, un problema con due urne o con test diagnostici richiede spesso la probabilità totale e poi Bayes.

#Probabilità #Statistica 🎓 4º Scientifico 🎓 5º Scientifico 🎓 4º Classico 🎓 5º Classico 🎓 4º Linguistico 🎓 5º Linguistico

Hai trovato utile questa lezione?

Probabilità condizionata e teorema di Bayes

Calcolo di eventi condizionati

Altre opzioni

Simula interrogazione Risolutore esercizi Correggi compiti

Concetto chiave

Probabilità condizionata e teorema di Bayes

P(A\mid B)=\frac{P(A\cap B)}{P(B)}

✓Condizionata: si considera solo il caso in cui B è avvenuto.
✓Composta: $P(A\cap B)=P(A\mid B)\cdot P(B)$ .
✓Indipendenza: se A e B sono indipendenti, allora $P(A\mid B)=P(A)$ .
✓Bayes: aggiorna una probabilità alla luce di una nuova informazione.
✓Totale: si usa una partizione dello spazio campionario per calcolare probabilità complesse.

Formule e proprietà della probabilità condizionata e di Bayes

Formula/Proprietà	Significato	Condizioni/Note
$\displaystyle { P(A\mid B)=\frac{P(A\cap B)}{P(B)} }$	Probabilità che si verifichi $A$ sapendo che si è verificato $B$	Serve $P(B)>0$ ; si restringe lo spazio ai casi con $B$
$P(A\cap B)=P(A\mid B)\cdot P(B)$	Formula della probabilità composta	Vale anche scambiando i ruoli di $A$ e $B$
$P(A\cap B)=P(B\mid A)\cdot P(A)$	Stessa intersezione scritta con la probabilità condizionata opposta	Utile per confrontare i due versi della relazione
$P(A\mid B)=P(A)$	Definizione operativa di eventi indipendenti	Equivale a $P(A\cap B)=P(A)\cdot P(B)$
$P(A)=\sum_i P(A\mid B_i)\,P(B_i)$	Teorema della probabilità totale	Gli eventi $B_i$ devono formare una partizione dello spazio campionario
$\displaystyle { P(B_j\mid A)=\frac{P(A\mid B_j)\,P(B_j)}{\sum_i P(A\mid B_i)\,P(B_i)} }$	Teorema di Bayes: aggiorna la probabilità di una causa dopo l’osservazione di un effetto	Vale con partizione $\{B_i\}$ e $P(A)>0$
Test diagnostico	Bayes serve per calcolare la probabilità di malattia dato un esito positivo	Conta anche la prevalenza e i falsi positivi
Estrazioni senza reimmissione	La probabilità condizionata cambia dopo ogni estrazione	Gli eventi non sono in genere indipendenti

Probabilità condizionata e teorema di Bayes

La probabilità condizionata, cioè la probabilità di un evento sapendo che un altro evento è già avvenuto, serve quando l'informazione cambia il calcolo.

Si pensa a una situazione in cui il campione disponibile si restringe. Non si ragiona più su tutti i casi possibili, ma solo su quelli compatibili con l'informazione nota.

Questo passaggio è essenziale nei test medici, nelle estrazioni e nei problemi in cui i dati arrivano in più fasi.

P(A\mid B)=\frac{P(A\cap B)}{P(B)}\qquad \text{con }P(B)>0

Per esempio, se $P(A\cap B)=0{,}12$ e $P(B)=0{,}3$ , allora $P(A\mid B)=0{,}12/0{,}3=0{,}4$ .

Si osserva quindi una catena logica precisa: prima si restringe il contesto, poi si ricava la probabilità cercata con formule coerenti tra loro.

[IMMAGINE: Diagramma ad albero con due eventi B e non B, sottoeventi A e non A, probabilità sui rami, evidenziazione dell'intersezione A ∩ B e della condizionata P(A|B)]

Definizione di probabilità condizionata

La definizione nasce da un'idea concreta: se l'evento $B$ è già accaduto, allora lo spazio dei casi possibili diventa solo quello di $B$ .

In questo nuovo spazio, si misura quanta parte di $B$ contiene anche $A$ .

P(A\mid B)=\frac{P(A\cap B)}{P(B)}

La formula ha senso solo se $P(B)>0$ . Se $P(B)=0$ , il rapporto non è definito e l'informazione non può essere usata in questo modo.

Si tratta quindi di una normalizzazione: si prende la parte comune $A\cap B$ e la si confronta con tutto $B$ .

P(A\cap B)=P(A\mid B)\cdot P(B)

Per esempio, se $P(A\mid B)=0{,}4$ e $P(B)=0{,}3$ , allora $P(A\cap B)=0{,}4\cdot 0{,}3=0{,}12$ .

Eventi indipendenti

Due eventi sono indipendenti, cioè uno non cambia la probabilità dell'altro, quando l'informazione su uno dei due non modifica il calcolo dell'altro.

Pensala come due azioni separate. Conoscere il risultato della prima non dà vantaggi sulla seconda.

P(A\mid B)=P(A)

Per esempio, se $P(A)=0{,}2$ e si verifica anche $B$ , allora, nei casi indipendenti, resta $P(A\mid B)=0{,}2$ .

P(A\cap B)=P(A)\cdot P(B)

Per esempio, se $P(A)=0{,}2$ e $P(B)=0{,}5$ , allora $P(A\cap B)=0{,}2\cdot 0{,}5=0{,}1$ .

Le due definizioni sono equivalenti quando $P(B)>0$ .

Se vale $P(A\mid B)=P(A)$ , gli eventi sono indipendenti.
Se vale $P(A\cap B)=P(A)P(B)$ , gli eventi sono indipendenti.

Teorema della probabilità totale

Il teorema della probabilità totale serve quando un evento può avvenire tramite casi diversi e incompatibili tra loro.

Si considera una partizione, cioè una suddivisione completa e disgiunta dello spazio campionario in eventi che non si sovrappongono.

Gli eventi $H_1,\dots,H_n$ sono incompatibili a due a due.
La loro unione copre tutto lo spazio campionario.
Ogni $H_i$ ha probabilità positiva.

P(A)=\sum_{i=1}^{n}P(A\mid H_i)\,P(H_i)

Questo risultato permette di calcolare una probabilità globale partendo da scenari parziali diversi.

Teorema di Bayes

Il teorema di Bayes permette di invertire l'informazione: si parte dall'effetto osservato e si risale alla causa più probabile.

Si tratta della stessa struttura della probabilità condizionata, riscritta in modo utile quando si conosce $P(A\mid B)$ ma si cerca $P(B\mid A)$ .

P(H_i\mid A)=\frac{P(A\mid H_i)\,P(H_i)}{\sum_{j=1}^{n}P(A\mid H_j)\,P(H_j)}

Per esempio, se un test è positivo e si confrontano due ipotesi compatibili, la formula permette di aggiornare la probabilità di ciascuna ipotesi in modo rigoroso.

Nel numeratore compare l'ipotesi cercata. Nel denominatore compare la probabilità totale dell'evento osservato.

P(B\mid A)=\frac{P(A\mid B)\,P(B)}{P(A)}

Per esempio, se $P(A\mid B)=0{,}7$ , $P(B)=0{,}2$ e $P(A)=0{,}5$ , allora $P(B\mid A)=0{,}7\cdot 0{,}2/0{,}5=0{,}28$ .

Il cuore del metodo è confrontare la parte utile dell'informazione con tutta l'informazione osservata.

Applicazioni ed esercizi

Nei test diagnostici si ragiona spesso in termini di falsi positivi e falsi negativi, cioè risultati del test che non coincidono con lo stato reale.

Si distingue la sensibilità, cioè la probabilità di risultato positivo se la malattia c'è, dalla specificità, cioè la probabilità di risultato negativo se la malattia non c'è.

P(\text{malattia}\mid \text{test positivo})=\frac{P(\text{test positivo}\mid \text{malattia})\,P(\text{malattia})}{P(\text{test positivo})}

Per esempio, se la malattia ha prevalenza $0{,}01$ e il test è positivo nel $95\%$ dei malati, il valore finale può restare basso se i falsi positivi sono numerosi.

Questo spiega perché un test positivo non equivale sempre a una probabilità alta di essere malati.

Negli esercizi con estrazioni senza reimmissione si aggiorna il calcolo dopo ogni estrazione, perché la composizione dell'insieme cambia.

Per esempio, se si estraggono due carte da un mazzo senza rimetterle, la seconda probabilità dipende già dalla prima estrazione.

Esempio — Test diagnostico con Bayes

Si consideri un test con prevalenza bassa e risultato positivo.

Si calcola prima la probabilità del risultato positivo totale tramite la probabilità totale.

P(+)=P(+\mid M)P(M)+P(+\mid \overline{M})P(\overline{M})

Poi si applica Bayes per ottenere la probabilità richiesta:

P(M\mid +)=\frac{P(+\mid M)P(M)}{P(+)}

Il risultato finale può essere molto diverso da $P(+\mid M)$ perché entrano anche i falsi positivi.

In sintesi, Bayes non serve a memorizzare un trucco. Serve a leggere correttamente i dati quando l'informazione arriva in senso inverso rispetto alla causa cercata.

Formule e proprietà

La probabilità condizionata, cioè la probabilità che un evento accada sapendo che un altro evento si è verificato, si definisce con un rapporto tra probabilità.

P(A\mid B)=\frac{P(A\cap B)}{P(B)}\qquad P(B)>0

Si legge: la probabilità di $A$ dato $B$ è uguale alla probabilità dell'intersezione divisa per la probabilità di $B$ . Il simbolo $\cap$ indica che i due eventi si verificano insieme.

Esempio — Calcolo di P(A|B)

Si considerino due eventi con $P(A\cap B)=0{,}12$ e $P(B)=0{,}30$ .

P(A\mid B)=\frac{0{,}12}{0{,}30}=0{,}4

Il risultato significa che, sapendo che $B$ si è verificato, la probabilità di $A$ è pari a $0{,}4$ .

La probabilità composta, cioè la probabilità che due eventi avvengano entrambi, si ottiene moltiplicando la probabilità condizionata per la probabilità del condizionante.

P(A\cap B)=P(A\mid B)\cdot P(B)

In questa forma si usa spesso la grandezza nota e si ricava l'intersezione. Se $P(A\mid B)=0{,}4$ e $P(B)=0{,}30$ , allora $P(A\cap B)=0{,}12$ .

Esempio — Probabilità composta da dati condizionati

Si supponga che $P(A\mid B)=0{,}25$ e $P(B)=0{,}8$ .

P(A\cap B)=0{,}25\cdot 0{,}8=0{,}2

L'intersezione vale $0{,}2$ . Il dato esprime la probabilità dei casi in cui $A$ e $B$ avvengono insieme.

Due eventi sono indipendenti, cioè il verificarsi di uno non modifica la probabilità dell'altro, quando la probabilità condizionata coincide con la probabilità semplice.

P(A\mid B)=P(A)\qquad \text{e quindi}\qquad P(A\cap B)=P(A)\cdot P(B)

Se $P(A)=0{,}5$ e $P(B)=0{,}2$ , allora per indipendenza si ha $P(A\cap B)=0{,}1$ . Non si deve confondere l'indipendenza con la disgiunzione.

Si richiede $P(B)>0$ per definire $P(A\mid B)$
L'indipendenza vale in entrambe le direzioni.
Se gli eventi sono indipendenti, allora conoscere $B$ non cambia $P(A)$

P(A)=\sum_{i=1}^{n}P(A\mid B_i)\,P(B_i)

Esempio — Probabilità totale con tre casi

Si considerino tre casi con $P(B_1)=0{,}2$ , $P(B_2)=0{,}3$ e $P(B_3)=0{,}5$ .

Si abbia inoltre $P(A\mid B_1)=0{,}1$ , $P(A\mid B_2)=0{,}4$ e $P(A\mid B_3)=0{,}6$ .

P(A)=0{,}1\cdot 0{,}2+0{,}4\cdot 0{,}3+0{,}6\cdot 0{,}5=0{,}43

La probabilità dell'evento $A$ è quindi $0{,}43$ .

Il teorema di Bayes, cioè la formula che permette di invertire una probabilità condizionata, ricava la probabilità di una causa sapendo che si è osservato un effetto.

P(B_j\mid A)=\frac{P(A\mid B_j)\,P(B_j)}{\sum_{i=1}^{n}P(A\mid B_i)\,P(B_i)}

Il numeratore contiene il caso cercato. Il denominatore è la probabilità totale dell'evento osservato $A$ . Questa è la forma più utile negli esercizi con dati diagnostici o classificazioni.

Esempio — Bayes in un test diagnostico

Si consideri un test con $P(M)=0{,}02$ per la malattia, $P(+\mid M)=0{,}95$ e $P(+\mid \overline{M})=0{,}08$ .

P(M\mid +)=\frac{0{,}95\cdot 0{,}02}{0{,}95\cdot 0{,}02+0{,}08\cdot 0{,}98}

Si ottiene $P(M\mid +)\approx 0{,}195$ . Il risultato mostra che un esito positivo non coincide con certezza con la malattia. Questa distinzione è essenziale nei problemi di falsi positivi.

Negli esercizi di estrazione senza reimmissione, cioè quando un oggetto estratto non viene rimesso nell'urna, le probabilità condizionate cambiano a ogni passo.

P(A\mid B)=\frac{n(A\cap B)}{n(B)}\qquad \text{nei casi equiprobabili}

Esempi svolti

Esempio 1 — Calcolo di una probabilità condizionata

Si considerino una scatola con 5 palline rosse e 3 palline blu. Si estrae una pallina, sapendo che è blu, e si calcola la probabilità che sia la seconda pallina del gruppo blu.

Si indichino con $A$ l’evento "seconda pallina del gruppo blu" e con $B$ l’evento "la pallina estratta è blu". Si cercano i dati utili per $P(A|B)$ .

La probabilità condizionata richiede prima l’intersezione. In questo contesto, l’evento $A∩B$ coincide con l’estrazione della seconda pallina blu dopo avere saputo che la pallina è blu.

P(A|B)=\frac{P(A\cap B)}{P(B)}

P(A|B)=\frac{\frac{1}{8}}{\frac{3}{8}}=\frac{1}{3}

La probabilità cercata è $1/3$ .

Errore comune: usare il numero totale delle palline senza restringere lo spazio agli eventi compatibili con B.

Esempio 2 — Eventi indipendenti

Si lanciano due dadi equilibrati. Si considerino gli eventi: $A$ = "il primo dado mostra 6" e $B$ = "il secondo dado mostra 6".

Si verifica se i due eventi sono indipendenti, cioè se conoscere uno non cambia la probabilità dell’altro.

P(A)=\frac{1}{6},\qquad P(B)=\frac{1}{6}

L’intersezione corrisponde alla coppia $(6,6)$ . Su 36 esiti possibili, uno solo è favorevole.

P(A\cap B)=\frac{1}{36}

Si confronta il prodotto delle probabilità con la probabilità congiunta. Si ottiene $\displaystyle { \frac{1}{6}\cdot\frac{1}{6}=\frac{1}{36} }$ .

I due eventi sono indipendenti perché vale $P(A\cap B)=P(A)P(B)$ .

Errore comune: pensare che due eventi su dadi diversi siano sempre indipendenti senza verificare la condizione formale.

Esempio 3 — Teorema di Bayes in un test diagnostico

Un test diagnostico ha sensibilità del 95% e falsi positivi del 4%. La malattia ha prevalenza del 2%. Si calcola la probabilità di essere malati dato che il test è positivo.

Si definiscano $M$ = "malattia", $T$ = "test positivo". Si cerca $P(M|T)$ .

Si usi il teorema di Bayes. Serve anche la probabilità totale di $T$ .

P(M|T)=\frac{P(T|M)\,P(M)}{P(T|M)\,P(M)+P(T|\overline{M})\,P(\overline{M})}

Si sostituiscono i dati: $P(T|M)=0.95$ , $P(M)=0.02$ , $P(T|\overline{M})=0.04$ , $P(\overline{M})=0.98$ .

P(M|T)=\frac{0.95\cdot 0.02}{0.95\cdot 0.02+0.04\cdot 0.98}

P(M|T)=\frac{0.019}{0.0582}\approx 0.326

La probabilità richiesta è circa il 32.6%. Il test positivo non implica automaticamente malattia certa.

Errore comune: confondere sensibilità elevata con probabilità elevata di essere malati dopo un test positivo.

Esempio 4 — Estrazione senza reimmissione e probabilità totale

In un’urna ci sono 4 palline bianche e 6 nere. Si estraggono due palline senza reimmissione. Si calcola la probabilità che la seconda sia bianca, sapendo che la prima era nera.

Si indichino con $B_1$ l’evento "prima pallina nera" e con $W_2$ l’evento "seconda pallina bianca". Si cerca $P(W_2|B_1)$ .

Dopo una prima estrazione nera, restano 4 bianche e 5 nere. Lo spazio campionario si aggiorna.

P(W_2|B_1)=\frac{4}{9}

La probabilità condizionata si legge direttamente dai casi favorevoli e dai casi possibili rimasti. I casi favorevoli sono 4 su 9.

In alternativa, si può calcolare con la formula della probabilità composta: $P(B_1\cap W_2)=P(B_1)\,P(W_2|B_1)$ .

La probabilità richiesta è 4/9.

Errore comune: trattare la seconda estrazione come se ci fossero ancora 10 palline, ignorando l’assenza di reimmissione.

Errori comuni nella probabilità condizionata e nel teorema di Bayes

✗

Scrivere $\displaystyle { P(A\mid B)=\frac{P(A)}{P(B)} }$ .

✓

Usare $\displaystyle { P(A\mid B)=\frac{P(A\cap B)}{P(B)} }$ , con $P(B)\neq 0$ .

✗

Dimenticare che il condizionamento cambia lo spazio di riferimento.

✓

Interpretare $P(A\mid B)$ come probabilità di $A$ dentro il caso in cui $B$ è già certo.

Dopo aver imposto $B$ , si ragiona solo sui casi compatibili con $B$ . Se $B$ non si usa come nuova base, il risultato diventa incoerente.

✗

Applicare Bayes come se fosse $P(A\mid B)=P(B\mid A)$ .

✓

Usare $\displaystyle { P(A\mid B)=\frac{P(B\mid A)\,P(A)}{P(B)} }$ .

Il teorema di Bayes, cioè la formula che inverte una condizione, non scambia direttamente i ruoli di $A$ e $B$ . Serve sempre il fattore di normalizzazione $P(B)$ .

✗

Calcolare $P(B)$ senza la probabilità totale.

✓

Scrivere $P(B)=\sum_i P(B\mid A_i)P(A_i)$ se $\{A_i\}$ è una partizione.

Il teorema della probabilità totale, cioè la scomposizione di un evento in casi incompatibili, è spesso indispensabile in Bayes. L’errore nasce dal usare un denominatore incompleto.

✗

Concludere che due eventi sono indipendenti perché non sono uguali.

✓

Verificare che $P(A\mid B)=P(A)$ oppure che $P(A\cap B)=P(A)P(B)$ .

Indipendenza, cioè assenza di influenza tra eventi, non significa differenza tra eventi. Si controlla una delle due uguaglianze equivalenti.

✗

Trattare come indipendenti due estrazioni senza reimmissione.

✓

Considerare la dipendenza tra estrazioni successive e aggiornare le probabilità a ogni passo.

Senza reimmissione la composizione dell’urna cambia. Per questo le probabilità condizionate variano e Bayes può essere necessario per risalire alla causa più probabile.

Domande frequenti

La probabilità condizionata, cioè la probabilità di un evento sapendo che un altro evento è già avvenuto, misura un'informazione parziale.

P(A\mid B)=\frac{P(A\cap B)}{P(B)}\qquad P(B)>0

P(\text{cuori}\mid \text{asso})=\frac{1}{4}

Si calcola dividendo la probabilità dell'intersezione per la probabilità dell'evento condizionante.

P(A\mid B)=\frac{P(A\cap B)}{P(B)}

Per esempio, se $P(A\cap B)=0{,}12$ e $P(B)=0{,}3$ , allora $P(A\mid B)=0{,}4$ .

P(A\mid B)=\frac{0{,}12}{0{,}3}=0{,}4

P(A\mid B)=\frac{P(B\mid A)\,P(A)}{P(B)}

P(M\mid +)=\frac{P(+\mid M)\,P(M)}{P(+)}

Due eventi sono indipendenti, cioè uno non modifica la probabilità dell'altro, quando la probabilità condizionata coincide con la probabilità semplice.

P(A\mid B)=P(A)\qquad \text{e quindi} \qquad P(A\cap B)=P(A)P(B)

Per esempio, se $P(A)=0{,}4$ e $P(A\mid B)=0{,}4$ , allora sapere che $B$ è avvenuto non cambia la probabilità di $A$ .

0{,}4=0{,}4

Si usa per trovare una probabilità inversa, cioè la probabilità della causa sapendo l'effetto osservato.

P(A\mid B)=\frac{P(B\mid A)P(A)}{P(B)}

Negli esercizi si individuano prima i casi possibili, poi si calcola $P(B)$ con la probabilità totale, e infine si applica la formula.

P(B)=\sum_i P(B\mid A_i)P(A_i)

Per esempio, nei test medici si calcola la probabilità di essere malati dopo un esito positivo, non la probabilità del test positivo sapendo la malattia. Questo passaggio è essenziale.

Si riconosce dagli indizi del testo.

\text{Indipendenza: }P(A\mid B)=P(A)\qquad \text{Bayes: }P(A\mid B)\text{ da }P(B\mid A)

Se il testo chiede una probabilità senza inversione del condizionamento, spesso basta la definizione o la formula composta. Se invece chiede la causa a partire dall'effetto, di solito serve Bayes.

P(A\cap B)=P(A\mid B)P(B)

Per esempio, un problema con due urne o con test diagnostici richiede spesso la probabilità totale e poi Bayes.

#Probabilità #Statistica 🎓 4º Scientifico 🎓 5º Scientifico 🎓 4º Classico 🎓 5º Classico 🎓 4º Linguistico 🎓 5º Linguistico

Hai trovato utile questa lezione?