La probabilità condizionata misura la probabilità di un evento A sapendo che B si è verificato. Il teorema di Bayes permette di invertire questa informazione e di risalire a partendo da dati più semplici.
| Formula/Proprietà | Significato | Condizioni/Note |
|---|---|---|
| Probabilità che si verifichi sapendo che si è verificato | Serve ; si restringe lo spazio ai casi con | |
| Formula della probabilità composta | Vale anche scambiando i ruoli di e | |
| Stessa intersezione scritta con la probabilità condizionata opposta | Utile per confrontare i due versi della relazione | |
| Definizione operativa di eventi indipendenti | Equivale a | |
| Teorema della probabilità totale | Gli eventi devono formare una partizione dello spazio campionario | |
| Teorema di Bayes: aggiorna la probabilità di una causa dopo l’osservazione di un effetto | Vale con partizione e | |
| Test diagnostico | Bayes serve per calcolare la probabilità di malattia dato un esito positivo | Conta anche la prevalenza e i falsi positivi |
| Estrazioni senza reimmissione | La probabilità condizionata cambia dopo ogni estrazione | Gli eventi non sono in genere indipendenti |
La probabilità condizionata, cioè la probabilità di un evento sapendo che un altro evento è già avvenuto, serve quando l'informazione cambia il calcolo.
Si pensa a una situazione in cui il campione disponibile si restringe. Non si ragiona più su tutti i casi possibili, ma solo su quelli compatibili con l'informazione nota.
Questo passaggio è essenziale nei test medici, nelle estrazioni e nei problemi in cui i dati arrivano in più fasi.
Per esempio, se e , allora .
Il teorema di Bayes, cioè la regola che permette di invertire una probabilità condizionata, risponde alla domanda opposta: come si aggiorna la probabilità della causa, sapendo l'effetto osservato?
Si osserva quindi una catena logica precisa: prima si restringe il contesto, poi si ricava la probabilità cercata con formule coerenti tra loro.
[IMMAGINE: Diagramma ad albero con due eventi B e non B, sottoeventi A e non A, probabilità sui rami, evidenziazione dell'intersezione A ∩ B e della condizionata P(A|B)]
La definizione nasce da un'idea concreta: se l'evento è già accaduto, allora lo spazio dei casi possibili diventa solo quello di .
In questo nuovo spazio, si misura quanta parte di contiene anche .
Per esempio, se in una classe il 20% degli studenti porta gli occhiali e il 5% porta gli occhiali e il cappello, allora, sapendo che uno studente porta gli occhiali, la probabilità che porti anche il cappello è .
La formula ha senso solo se . Se , il rapporto non è definito e l'informazione non può essere usata in questo modo.
Si tratta quindi di una normalizzazione: si prende la parte comune e la si confronta con tutto .
Per esempio, se e , allora .
Due eventi sono indipendenti, cioè uno non cambia la probabilità dell'altro, quando l'informazione su uno dei due non modifica il calcolo dell'altro.
Pensala come due azioni separate. Conoscere il risultato della prima non dà vantaggi sulla seconda.
Per esempio, se e si verifica anche , allora, nei casi indipendenti, resta .
Per esempio, se e , allora .
Le due definizioni sono equivalenti quando .
Il teorema della probabilità totale serve quando un evento può avvenire tramite casi diversi e incompatibili tra loro.
Si considera una partizione, cioè una suddivisione completa e disgiunta dello spazio campionario in eventi che non si sovrappongono.
Per esempio, se ci sono due urne possibili con probabilità e , e le probabilità condizionate di estrarre una pallina rossa sono e , allora .
Questo risultato permette di calcolare una probabilità globale partendo da scenari parziali diversi.
Il teorema di Bayes permette di invertire l'informazione: si parte dall'effetto osservato e si risale alla causa più probabile.
Si tratta della stessa struttura della probabilità condizionata, riscritta in modo utile quando si conosce ma si cerca .
Per esempio, se un test è positivo e si confrontano due ipotesi compatibili, la formula permette di aggiornare la probabilità di ciascuna ipotesi in modo rigoroso.
Nel numeratore compare l'ipotesi cercata. Nel denominatore compare la probabilità totale dell'evento osservato.
Per esempio, se , e , allora .
Il cuore del metodo è confrontare la parte utile dell'informazione con tutta l'informazione osservata.
Nei test diagnostici si ragiona spesso in termini di falsi positivi e falsi negativi, cioè risultati del test che non coincidono con lo stato reale.
Si distingue la sensibilità, cioè la probabilità di risultato positivo se la malattia c'è, dalla specificità, cioè la probabilità di risultato negativo se la malattia non c'è.
Per esempio, se la malattia ha prevalenza e il test è positivo nel dei malati, il valore finale può restare basso se i falsi positivi sono numerosi.
Questo spiega perché un test positivo non equivale sempre a una probabilità alta di essere malati.
Negli esercizi con estrazioni senza reimmissione si aggiorna il calcolo dopo ogni estrazione, perché la composizione dell'insieme cambia.
Per esempio, se si estraggono due carte da un mazzo senza rimetterle, la seconda probabilità dipende già dalla prima estrazione.
Si consideri un test con prevalenza bassa e risultato positivo.
Si calcola prima la probabilità del risultato positivo totale tramite la probabilità totale.
Poi si applica Bayes per ottenere la probabilità richiesta:
Il risultato finale può essere molto diverso da perché entrano anche i falsi positivi.
In sintesi, Bayes non serve a memorizzare un trucco. Serve a leggere correttamente i dati quando l'informazione arriva in senso inverso rispetto alla causa cercata.
La probabilità condizionata, cioè la probabilità che un evento accada sapendo che un altro evento si è verificato, si definisce con un rapporto tra probabilità.
Si legge: la probabilità di dato è uguale alla probabilità dell'intersezione divisa per la probabilità di . Il simbolo indica che i due eventi si verificano insieme.
Si considerino due eventi con e .
Il risultato significa che, sapendo che si è verificato, la probabilità di è pari a .
La probabilità composta, cioè la probabilità che due eventi avvengano entrambi, si ottiene moltiplicando la probabilità condizionata per la probabilità del condizionante.
In questa forma si usa spesso la grandezza nota e si ricava l'intersezione. Se e , allora .
Si supponga che e .
L'intersezione vale . Il dato esprime la probabilità dei casi in cui e avvengono insieme.
Due eventi sono indipendenti, cioè il verificarsi di uno non modifica la probabilità dell'altro, quando la probabilità condizionata coincide con la probabilità semplice.
Se e , allora per indipendenza si ha . Non si deve confondere l'indipendenza con la disgiunzione.
Il teorema della probabilità totale, cioè la somma delle probabilità di un evento sui casi di una partizione, si applica quando lo spazio campionario è diviso in eventi incompatibili ed esaustivi.
Gli eventi devono formare una partizione, cioè essere a due a due disgiunti e coprire tutti i casi possibili. Se i casi sono tre, per esempio , e , si sommano tre contributi distinti.
Si considerino tre casi con , e .
Si abbia inoltre , e .
La probabilità dell'evento è quindi .
Il teorema di Bayes, cioè la formula che permette di invertire una probabilità condizionata, ricava la probabilità di una causa sapendo che si è osservato un effetto.
Il numeratore contiene il caso cercato. Il denominatore è la probabilità totale dell'evento osservato . Questa è la forma più utile negli esercizi con dati diagnostici o classificazioni.
Si consideri un test con per la malattia, e .
Si ottiene . Il risultato mostra che un esito positivo non coincide con certezza con la malattia. Questa distinzione è essenziale nei problemi di falsi positivi.
Negli esercizi di estrazione senza reimmissione, cioè quando un oggetto estratto non viene rimesso nell'urna, le probabilità condizionate cambiano a ogni passo.
Se l'urna contiene 5 sfere rosse e 5 blu, la probabilità di estrarre una rossa sapendo che la prima estratta era blu si calcola sul nuovo totale disponibile. Se restano 4 rosse su 9 sfere, allora la probabilità vale .
Si considerino una scatola con 5 palline rosse e 3 palline blu. Si estrae una pallina, sapendo che è blu, e si calcola la probabilità che sia la seconda pallina del gruppo blu.
Si indichino con l’evento "seconda pallina del gruppo blu" e con l’evento "la pallina estratta è blu". Si cercano i dati utili per .
La probabilità condizionata richiede prima l’intersezione. In questo contesto, l’evento coincide con l’estrazione della seconda pallina blu dopo avere saputo che la pallina è blu.
Si calcola , perché le palline blu sono 3 su 8. L’intersezione vale , perché una sola pallina soddisfa la richiesta.
La probabilità cercata è .
Errore comune: usare il numero totale delle palline senza restringere lo spazio agli eventi compatibili con B.
Si lanciano due dadi equilibrati. Si considerino gli eventi: = "il primo dado mostra 6" e = "il secondo dado mostra 6".
Si verifica se i due eventi sono indipendenti, cioè se conoscere uno non cambia la probabilità dell’altro.
L’intersezione corrisponde alla coppia . Su 36 esiti possibili, uno solo è favorevole.
Si confronta il prodotto delle probabilità con la probabilità congiunta. Si ottiene .
I due eventi sono indipendenti perché vale .
Errore comune: pensare che due eventi su dadi diversi siano sempre indipendenti senza verificare la condizione formale.
Un test diagnostico ha sensibilità del 95% e falsi positivi del 4%. La malattia ha prevalenza del 2%. Si calcola la probabilità di essere malati dato che il test è positivo.
Si definiscano = "malattia", = "test positivo". Si cerca .
Si usi il teorema di Bayes. Serve anche la probabilità totale di .
Si sostituiscono i dati: , , , .
La probabilità richiesta è circa il 32.6%. Il test positivo non implica automaticamente malattia certa.
Errore comune: confondere sensibilità elevata con probabilità elevata di essere malati dopo un test positivo.
In un’urna ci sono 4 palline bianche e 6 nere. Si estraggono due palline senza reimmissione. Si calcola la probabilità che la seconda sia bianca, sapendo che la prima era nera.
Si indichino con l’evento "prima pallina nera" e con l’evento "seconda pallina bianca". Si cerca .
Dopo una prima estrazione nera, restano 4 bianche e 5 nere. Lo spazio campionario si aggiorna.
La probabilità condizionata si legge direttamente dai casi favorevoli e dai casi possibili rimasti. I casi favorevoli sono 4 su 9.
In alternativa, si può calcolare con la formula della probabilità composta: .
La probabilità richiesta è 4/9.
Errore comune: trattare la seconda estrazione come se ci fossero ancora 10 palline, ignorando l’assenza di reimmissione.
Scrivere .
Usare , con .
La probabilità condizionata, cioè la probabilità di sapendo che è avvenuto, si calcola sull’intersezione. L’errore nasce dal confondere “sapendo che” con un semplice rapporto tra probabilità separate.
Dimenticare che il condizionamento cambia lo spazio di riferimento.
Interpretare come probabilità di dentro il caso in cui è già certo.
Dopo aver imposto , si ragiona solo sui casi compatibili con . Se non si usa come nuova base, il risultato diventa incoerente.
Applicare Bayes come se fosse .
Usare .
Il teorema di Bayes, cioè la formula che inverte una condizione, non scambia direttamente i ruoli di e . Serve sempre il fattore di normalizzazione .
Calcolare senza la probabilità totale.
Scrivere se è una partizione.
Il teorema della probabilità totale, cioè la scomposizione di un evento in casi incompatibili, è spesso indispensabile in Bayes. L’errore nasce dal usare un denominatore incompleto.
Concludere che due eventi sono indipendenti perché non sono uguali.
Verificare che oppure che .
Indipendenza, cioè assenza di influenza tra eventi, non significa differenza tra eventi. Si controlla una delle due uguaglianze equivalenti.
Trattare come indipendenti due estrazioni senza reimmissione.
Considerare la dipendenza tra estrazioni successive e aggiornare le probabilità a ogni passo.
Senza reimmissione la composizione dell’urna cambia. Per questo le probabilità condizionate variano e Bayes può essere necessario per risalire alla causa più probabile.
La probabilità condizionata, cioè la probabilità di un evento sapendo che un altro evento è già avvenuto, misura un'informazione parziale.
Per esempio, se si estraggono carte e si sa che la carta è un asso, la probabilità che sia di cuori cambia rispetto al caso totale. Se gli assi sono 4 e l'asso di cuori è 1, allora .
Si calcola dividendo la probabilità dell'intersezione per la probabilità dell'evento condizionante.
Per esempio, se e , allora .
Il teorema di Bayes, cioè la formula che permette di invertire una probabilità condizionata, esprime tramite , le probabilità dei due eventi e la probabilità totale di .
Per esempio, se un test è positivo con probabilità quando la malattia c'è, e la malattia ha probabilità , Bayes serve a stimare la probabilità reale di malattia dato un test positivo.
Due eventi sono indipendenti, cioè uno non modifica la probabilità dell'altro, quando la probabilità condizionata coincide con la probabilità semplice.
Per esempio, se e , allora sapere che è avvenuto non cambia la probabilità di .
Si usa per trovare una probabilità inversa, cioè la probabilità della causa sapendo l'effetto osservato.
Negli esercizi si individuano prima i casi possibili, poi si calcola con la probabilità totale, e infine si applica la formula.
Per esempio, nei test medici si calcola la probabilità di essere malati dopo un esito positivo, non la probabilità del test positivo sapendo la malattia. Questo passaggio è essenziale.
Si riconosce dagli indizi del testo.
Se il testo chiede una probabilità senza inversione del condizionamento, spesso basta la definizione o la formula composta. Se invece chiede la causa a partire dall'effetto, di solito serve Bayes.
Per esempio, un problema con due urne o con test diagnostici richiede spesso la probabilità totale e poi Bayes.