Una variabile aleatoria è una funzione che associa a ogni esito di un esperimento casuale un numero reale. Essa descrive quantitativamente l’incertezza e permette di studiare probabilità, media e dispersione.
| Concetto | Definizione | Formula | Nota |
|---|---|---|---|
| Variabile aleatoria discreta | Associa a ogni esito un numero reale con valori finiti o numerabili. | Si usa una funzione di massa di probabilità. | |
| Variabile aleatoria continua | Associa a ogni esito un numero reale in un intervallo. | Si usa una densità di probabilità. | |
| Valore atteso | È la media pesata dei valori assunti da . | oppure | Misura il centro della distribuzione. |
| Varianza | Misura la dispersione dei valori attorno alla media. | La deviazione standard è . | |
| Funzione di ripartizione | Dà la probabilità che sia minore o uguale a . | È crescente e compresa tra 0 e 1. | |
| Proprietà lineare del valore atteso | Trasformare con trasforma linearmente la media. | Vale per ogni variabile aleatoria per cui l’attesa esiste. | |
| Proprietà della varianza | Trasformare con moltiplica la varianza per . | Lo spostamento non cambia la dispersione. |
Si introduce una variabile aleatoria, cioè una regola che associa un numero a ogni esito incerto, quando si vuole trasformare l'incertezza in calcolo.
L'idea nasce perché molti fenomeni non si descrivono bene con un solo numero fisso. Si pensi al numero di teste in dieci lanci di moneta.
In quel caso, il risultato può cambiare ogni volta. Però si può studiare la probabilità dei possibili valori.
La variabile non descrive l'esito in modo verbale. Lo traduce in un numero, così si possono usare media, dispersione e grafici.
Per esempio, se si osserva il lancio di un dado, si può definire come il numero uscito. Se esce 4, allora .
Questa scelta non cambia il caso studiato. Cambia soltanto il modo di rappresentarlo in matematica.
Una variabile aleatoria discreta, cioè una variabile che assume un numero finito o numerabile di valori, è adatta ai conteggi.
Si pensi al numero di studenti presenti in classe, oppure al numero di successi in una serie di prove.
Ogni valore possibile ha una probabilità associata. Questa informazione si chiama distribuzione di probabilità, cioè l'elenco dei valori possibili con le rispettive probabilità.
Per esempio, se può valere 0, 1 oppure 2 con probabilità 0,2; 0,5; 0,3, allora si ha .
La somma di tutte le probabilità deve valere 1, perché uno dei casi possibili deve verificarsi.
Per esempio, 0,2 + 0,5 + 0,3 = 1. Il controllo conferma che la distribuzione è coerente.
[IMMAGINE: Tabella con tre valori discreti di X, le probabilità P(X = x_i) e una barra verticale per ciascun valore sull'asse orizzontale, con somma totale uguale a 1]
Una variabile aleatoria continua, cioè una variabile che può assumere infiniti valori in un intervallo, modella misure come tempo, peso o altezza.
In questo caso non si assegna una probabilità a un singolo valore puntuale. Si assegna invece una densità, cioè una funzione che descrive come la probabilità si distribuisce lungo l'asse.
Per esempio, se la densità è costante su un intervallo di lunghezza 2 e vale 0,5, allora l'area totale è 0,5·2 = 1.
Per una variabile continua si ha per ogni singolo valore . Conta soltanto la probabilità di intervalli.
Per esempio, se su , allora .
Il valore atteso, cioè la media teorica dei valori di una variabile aleatoria, descrive il centro della distribuzione nel lungo periodo.
Non è un valore che necessariamente si osserva in un singolo esperimento. È il risultato medio a cui si tende ripetendo molte prove.
Per esempio, se vale 0 con probabilità 0,7 e 5 con probabilità 0,3, allora .
Per esempio, se su , allora .
Il valore atteso si comporta bene con le trasformazioni lineari. Si ottiene una formula molto utile nei problemi applicati.
Per esempio, se e si considera , allora .
La varianza, cioè la misura della dispersione dei valori attorno alla media, indica quanto i dati tendono a lontanarsi dal valore atteso.
Si guarda il quadrato degli scarti, così gli scarti positivi e negativi non si annullano.
Per esempio, se vale 0 con probabilità 0,7 e 5 con probabilità 0,3, allora .
Si è già trovato . Quindi .
Per esempio, se , allora la deviazione standard vale .
Per esempio, se e si considera , allora .
La funzione di ripartizione, cioè la funzione che dà la probabilità di ottenere valori minori o uguali a un certo numero, riassume tutta la distribuzione.
Per esempio, se assume 0, 1 e 2 con probabilità 0,2; 0,5; 0,3, allora .
La funzione di ripartizione cresce in modo non decrescente. Inoltre tende a 0 a sinistra e a 1 a destra.
Per esempio, nel caso discreto precedente, se , allora . Se , allora .
Nel caso continuo, la funzione di ripartizione si ottiene integrando la densità fino a .
Per esempio, se su , allora per si ha .
[IMMAGINE: Grafico cartesiano della funzione di ripartizione: curva a gradini nel caso discreto e curva crescente continua nel caso continuo, con etichette F(x), asse x e asse y, e frecce che evidenziano il passaggio da 0 a 1]
Le proprietà lineari servono perché permettono di trasformare una variabile senza rifare tutti i calcoli da zero. Sono fondamentali nei modelli applicati.
Per esempio, se una misura viene espressa in centimetri invece che in metri, il fattore di scala modifica la varianza, ma non il significato del fenomeno.
Per esempio, se e , allora per si ottiene e .
Una variabile aleatoria, cioè una funzione che associa a ogni esito numerico di un esperimento casuale un numero reale, si descrive tramite distribuzione di probabilità.
Qui indica la variabile aleatoria, mentre è uno dei valori possibili. La quantità rappresenta la probabilità associata a quel valore.
Si consideri il lancio di un dado regolare. La variabile assume i valori da a .
Ogni esito ha probabilità . La distribuzione di probabilità è quindi uniforme.
Il valore atteso, cioè la media teorica pesata dalle probabilità, sintetizza il centro della distribuzione.
Nel caso discreto, ogni valore contribuisce in proporzione alla propria probabilità. Si osserva quindi una media di lungo periodo, non la media di un singolo esperimento.
Si consideri una variabile con valori , e con probabilità rispettive , e .
Il valore atteso è . Il risultato si legge come media pesata dei valori possibili.
Nel caso continuo, è la funzione di densità, cioè la funzione che descrive come si distribuisce la probabilità lungo l'asse reale.
L'area totale sotto la densità deve valere . La probabilità di un intervallo si ottiene come area sotto la curva.
Si consideri una densità uniforme in .
Si calcola . Il centro dell'intervallo coincide con la media teorica.
La varianza, cioè la misura della dispersione dei valori attorno al valore atteso, quantifica quanto i dati si allontanano dalla media.
La deviazione standard, cioè la radice quadrata della varianza, si scrive .
Si usi la variabile dell'esempio precedente, per cui .
Si ottiene , quindi .
La funzione di ripartizione, cioè la funzione che accumula la probabilità fino a un valore fissato, descrive completamente la distribuzione.
Per una variabile discreta, è una funzione a gradini. Per una variabile continua, risulta continua e non decrescente.
Si consideri con valori , e con probabilità , e .
La funzione cresce a salti e raggiunge in corrispondenza degli ultimi valori possibili.
Questa proprietà è detta linearità del valore atteso. Si usa per trasformazioni affini della variabile.
Si consideri il lancio di un dado equo e la variabile aleatoria , cioè la funzione che associa a ogni esito il numero uscito.
Si osserva che è discreta, cioè assume valori finiti e numerabili.
I valori possibili sono , e ciascun valore ha probabilità .
Il valore atteso si calcola con la somma pesata dei valori possibili.
Il valore atteso è .
La varianza misura la dispersione dei valori attorno alla media.
Si consideri una variabile aleatoria uniforme su , cioè una variabile continua con densità costante.
Si ricorda che una variabile continua non si descrive con probabilità puntuali, ma con una densità .
Nel caso uniforme, la densità vale costante su tutto l'intervallo.
L'area totale sotto la densità deve valere .
Il valore atteso si calcola con l'integrale della posizione pesata dalla densità.
Il valore atteso è , cioè il centro dell'intervallo.
Errore comune: assegnare una probabilità a un singolo punto in una variabile continua.
Si consideri una variabile aleatoria con e . Si definisca .
Si chiede di calcolare il valore atteso e la varianza di .
Si usa la proprietà lineare del valore atteso.
Si usa poi la formula di trasformazione della varianza.
Il valore atteso di è , e la sua varianza è .
Errore comune: moltiplicare la varianza per 2 invece che per 4.
Si consideri la variabile aleatoria discreta , con distribuzione , , .
Si chiede di costruire la funzione di ripartizione .
Si procede per intervalli, sommando le probabilità dei valori non superiori a .
Per esempio, se , allora .
La funzione di ripartizione è crescente e assume sempre valori tra e .
Errore comune: confondere la funzione di ripartizione con la densità o con la massa di probabilità.
Considerare la variabile aleatoria come un singolo numero già noto.
La variabile aleatoria è una funzione, cioè associa a ogni esito casuale un numero reale.
L’errore nasce perché si confonde l’esito dell’esperimento con il valore numerico assegnato. Si evita ricordando che la variabile aleatoria descrive i risultati possibili prima dell’osservazione.
Scrivere che il valore atteso è sempre il valore più probabile.
Il valore atteso è una media ponderata, cioè un valore medio teorico pesato dalle probabilità.
Il valore più probabile e la media possono non coincidere. Si controlla sempre la definizione: per una variabile discreta si usa .
Calcolare la varianza come .
La formula corretta è .
L’ordine dei termini è decisivo. Un segno invertito può produrre un risultato negativo, che non è possibile per una varianza.
Confondere variabile discreta e continua: usare somme per una distribuzione continua.
Per una variabile discreta si usano somme; per una continua si usa una densità, cioè una funzione da integrare.
La discreta assume valori finiti o numerabili. La continua assume infiniti valori in un intervallo, e le probabilità si ottengono con integrali, non con singole probabilità puntuali.
Pensare che la funzione di ripartizione sia la probabilità del valore esatto .
La funzione di ripartizione è .
La probabilità del singolo punto è in generale zero nel caso continuo. La funzione di ripartizione somma tutte le probabilità fino a , quindi descrive l’andamento cumulato.
Dimenticare che una trasformazione lineare cambia anche la varianza di un fattore quadrato.
Se , allora e .
L’errore avviene perché si pensa solo allo spostamento dovuto a . La varianza misura la dispersione e non cambia con le traslazioni, ma si moltiplica per con le dilatazioni.
Una variabile aleatoria, cioè una funzione che associa a ogni esito casuale un numero reale, serve a descrivere quantitativamente un fenomeno incerto.
Nel caso discreto, i valori possibili sono finiti o numerabili. In tal caso si usa la distribuzione di probabilità, cioè l'elenco delle probabilità dei singoli valori.
Il valore atteso, cioè la media teorica della variabile aleatoria, è il valore medio che si ottiene nel lungo periodo.
La varianza, cioè la misura della dispersione dei valori attorno alla media, si calcola come differenza tra il momento quadratico medio e il quadrato del valore atteso.
La deviazione standard, cioè la radice quadrata della varianza, è . Per , si ottiene .
Una variabile discreta, cioè una variabile che assume valori separati e contabili, prende un numero finito o numerabile di valori.
Una variabile continua, cioè una variabile che può assumere qualsiasi valore in un intervallo, si descrive con una densità di probabilità, cioè una funzione che distribuisce la probabilità sull'intervallo.
La funzione di ripartizione, cioè la funzione che accumula le probabilità fino a un certo valore, è la probabilità che la variabile sia minore o uguale a .
Per esempio, se , allora la probabilità che assuma un valore non superiore a 2 è 0,7.
Il valore atteso è lineare, cioè il valore atteso di una combinazione lineare si calcola combinando i valori attesi.
La varianza cambia con il quadrato del fattore di scala. La traslazione non la modifica.