quali proprietà hanno valore atteso e varianza

Il valore atteso è lineare, cioè il valore atteso di una combinazione lineare si calcola combinando i valori attesi. La varianza cambia con il quadrato del fattore di scala. La traslazione non la modifica.

Variabili aleatorie

Definizioni e calcolo base

Altre opzioni

Simula interrogazione Risolutore esercizi Correggi compiti

Concetto chiave

Variabili aleatorie

Una variabile aleatoria è una funzione che associa a ogni esito di un esperimento casuale un numero reale. Essa descrive quantitativamente l’incertezza e permette di studiare probabilità, media e dispersione.

E[X]=\sum_i x_i\,P(X=x_i)\quad\text{oppure}\quad E[X]=\int_{-\infty}^{+\infty}x\,f(x)\,dx

✓Discreta: assume valori finiti o numerabili, con funzione di massa $P(X=x_i)$ .
✓Continua: è descritta da una densità $f(x)$ e vale $\int_{-\infty}^{+\infty}f(x)\,dx=1$ .
✓Valore atteso: media teorica, cioè il valore medio pesato dai casi possibili.
✓Varianza: misura la dispersione, con $Var(X)=E[X^2]-(E[X])^2$ e $\sigma=\sqrt{Var(X)}$ .
✓Ripartizione: $F(x)=P(X\le x)$ , utile per descrivere la distribuzione cumulata.

Schema rapido delle variabili aleatorie

Concetto	Definizione	Formula	Nota
Variabile aleatoria discreta	Associa a ogni esito un numero reale con valori finiti o numerabili.	$P(X=x_i)$	Si usa una funzione di massa di probabilità.
Variabile aleatoria continua	Associa a ogni esito un numero reale in un intervallo.	$\int_{-\infty}^{+\infty} f(x)\,dx=1$	Si usa una densità di probabilità.
Valore atteso	È la media pesata dei valori assunti da $X$ .	$E[X]=\sum_i x_iP(X=x_i)$ oppure $E[X]=\int x f(x)\,dx$	Misura il centro della distribuzione.
Varianza	Misura la dispersione dei valori attorno alla media.	$\mathrm{Var}(X)=E[X^2]-(E[X])^2$	La deviazione standard è $\sigma=\sqrt{\mathrm{Var}(X)}$ .
Funzione di ripartizione	Dà la probabilità che $X$ sia minore o uguale a $x$ .	$F(x)=P(X\le x)$	È crescente e compresa tra 0 e 1.
Proprietà lineare del valore atteso	Trasformare $X$ con $aX+b$ trasforma linearmente la media.	$E[aX+b]=aE[X]+b$	Vale per ogni variabile aleatoria per cui l’attesa esiste.
Proprietà della varianza	Trasformare $X$ con $aX+b$ moltiplica la varianza per $a^2$ .	$\mathrm{Var}(aX+b)=a^2\mathrm{Var}(X)$	Lo spostamento $b$ non cambia la dispersione.

Variabili aleatorie: perché servono

Si introduce una variabile aleatoria, cioè una regola che associa un numero a ogni esito incerto, quando si vuole trasformare l'incertezza in calcolo.

L'idea nasce perché molti fenomeni non si descrivono bene con un solo numero fisso. Si pensi al numero di teste in dieci lanci di moneta.

In quel caso, il risultato può cambiare ogni volta. Però si può studiare la probabilità dei possibili valori.

La variabile non descrive l'esito in modo verbale. Lo traduce in un numero, così si possono usare media, dispersione e grafici.

X : \Omega \to \mathbb{R}

Per esempio, se si osserva il lancio di un dado, si può definire $X$ come il numero uscito. Se esce 4, allora $X=4$ .

Questa scelta non cambia il caso studiato. Cambia soltanto il modo di rappresentarlo in matematica.

Variabile aleatoria discreta

Una variabile aleatoria discreta, cioè una variabile che assume un numero finito o numerabile di valori, è adatta ai conteggi.

Si pensi al numero di studenti presenti in classe, oppure al numero di successi in una serie di prove.

Ogni valore possibile ha una probabilità associata. Questa informazione si chiama distribuzione di probabilità, cioè l'elenco dei valori possibili con le rispettive probabilità.

P(X=x_i)=p_i

Per esempio, se $X$ può valere 0, 1 oppure 2 con probabilità 0,2; 0,5; 0,3, allora si ha $P(X=1)=0,5$ .

La somma di tutte le probabilità deve valere 1, perché uno dei casi possibili deve verificarsi.

\sum_i p_i=1

Per esempio, 0,2 + 0,5 + 0,3 = 1. Il controllo conferma che la distribuzione è coerente.

[IMMAGINE: Tabella con tre valori discreti di X, le probabilità P(X = x_i) e una barra verticale per ciascun valore sull'asse orizzontale, con somma totale uguale a 1]

Variabile aleatoria continua

Una variabile aleatoria continua, cioè una variabile che può assumere infiniti valori in un intervallo, modella misure come tempo, peso o altezza.

In questo caso non si assegna una probabilità a un singolo valore puntuale. Si assegna invece una densità, cioè una funzione che descrive come la probabilità si distribuisce lungo l'asse.

\int_{-\infty}^{+\infty} f(x)\,dx=1

Per esempio, se la densità è costante su un intervallo di lunghezza 2 e vale 0,5, allora l'area totale è 0,5·2 = 1.

Per una variabile continua si ha $P(X=x)=0$ per ogni singolo valore $x$ . Conta soltanto la probabilità di intervalli.

P(a\le X\le b)=\int_a^b f(x)\,dx

Per esempio, se $\displaystyle { f(x)=\frac{1}{2} }$ su $[0,2]$ , allora $\displaystyle { P(0\le X\le 1)=\int_0^1 \frac{1}{2}\,dx=\frac{1}{2} }$ .

Valore atteso o media

Il valore atteso, cioè la media teorica dei valori di una variabile aleatoria, descrive il centro della distribuzione nel lungo periodo.

Non è un valore che necessariamente si osserva in un singolo esperimento. È il risultato medio a cui si tende ripetendo molte prove.

E[X]=\sum_i x_i\,P(X=x_i)

Per esempio, se $X$ vale 0 con probabilità 0,7 e 5 con probabilità 0,3, allora $E[X]=0\cdot 0,7+5\cdot 0,3=1,5$ .

E[X]=\int_{-\infty}^{+\infty} x\,f(x)\,dx

Per esempio, se $\displaystyle { f(x)=\frac{1}{2} }$ su $[0,2]$ , allora $\displaystyle { E[X]=\int_0^2 x\cdot \frac{1}{2}\,dx=1 }$ .

Il valore atteso si comporta bene con le trasformazioni lineari. Si ottiene una formula molto utile nei problemi applicati.

E[aX+b]=aE[X]+b

Per esempio, se $E[X]=1,5$ e si considera $Y=2X-3$ , allora $E[Y]=2\cdot 1,5-3=0$ .

Varianza e deviazione standard

La varianza, cioè la misura della dispersione dei valori attorno alla media, indica quanto i dati tendono a lontanarsi dal valore atteso.

Si guarda il quadrato degli scarti, così gli scarti positivi e negativi non si annullano.

Var(X)=E[X^2]-(E[X])^2

Per esempio, se $X$ vale 0 con probabilità 0,7 e 5 con probabilità 0,3, allora $E[X^2]=0^2\cdot 0,7+5^2\cdot 0,3=7,5$ .

Si è già trovato $E[X]=1,5$ . Quindi $Var(X)=7,5-(1,5)^2=5,25$ .

\sigma=\sqrt{Var(X)}

Per esempio, se $Var(X)=5,25$ , allora la deviazione standard vale $\sigma=\sqrt{5,25}\approx 2,29$ .

Var(aX+b)=a^2Var(X)

Per esempio, se $Var(X)=5,25$ e si considera $Y=2X-3$ , allora $Var(Y)=2^2\cdot 5,25=21$ .

Funzione di ripartizione

La funzione di ripartizione, cioè la funzione che dà la probabilità di ottenere valori minori o uguali a un certo numero, riassume tutta la distribuzione.

F(x)=P(X\le x)

Per esempio, se $X$ assume 0, 1 e 2 con probabilità 0,2; 0,5; 0,3, allora $F(1)=P(X\le 1)=0,2+0,5=0,7$ .

La funzione di ripartizione cresce in modo non decrescente. Inoltre tende a 0 a sinistra e a 1 a destra.

\lim_{x\to -\infty}F(x)=0 \qquad \lim_{x\to +\infty}F(x)=1

Per esempio, nel caso discreto precedente, se $x=-1$ , allora $F(-1)=0$ . Se $x=3$ , allora $F(3)=1$ .

Nel caso continuo, la funzione di ripartizione si ottiene integrando la densità fino a $x$ .

F(x)=\int_{-\infty}^{x} f(t)\,dt

Per esempio, se $\displaystyle { f(t)=\frac{1}{2} }$ su $[0,2]$ , allora per $0\le x\le 2$ si ha $\displaystyle { F(x)=\int_0^x \frac{1}{2}\,dt=\frac{x}{2} }$ .

[IMMAGINE: Grafico cartesiano della funzione di ripartizione: curva a gradini nel caso discreto e curva crescente continua nel caso continuo, con etichette F(x), asse x e asse y, e frecce che evidenziano il passaggio da 0 a 1]

Proprietà lineari e collegamenti finali

Le proprietà lineari servono perché permettono di trasformare una variabile senza rifare tutti i calcoli da zero. Sono fondamentali nei modelli applicati.

Se $Y=aX+b$ , allora il valore atteso cambia in modo lineare.
Se $Y=aX+b$ , allora la varianza si moltiplica per $a^2$ .
Se la varianza è piccola, i valori sono concentrati attorno alla media.

Per esempio, se una misura viene espressa in centimetri invece che in metri, il fattore di scala modifica la varianza, ma non il significato del fenomeno.

E[aX+b]=aE[X]+b \qquad Var(aX+b)=a^2Var(X)

Per esempio, se $E[X]=4$ e $Var(X)=2$ , allora per $Y=3X+1$ si ottiene $E[Y]=13$ e $Var(Y)=18$ .

Formule e proprietà

Una variabile aleatoria, cioè una funzione che associa a ogni esito numerico di un esperimento casuale un numero reale, si descrive tramite distribuzione di probabilità.

P(X=x_i)=p_i

Qui $X$ indica la variabile aleatoria, mentre $x_i$ è uno dei valori possibili. La quantità $p_i$ rappresenta la probabilità associata a quel valore.

I valori $x_i$ sono finiti o numerabili.
Si ha $p_i\ge 0$ per ogni indice.
La somma totale vale $\sum_i p_i=1$ .

Esempio — Distribuzione discreta di un dado equilibrato

Si consideri il lancio di un dado regolare. La variabile $X$ assume i valori da $1$ a $6$ .

P(X=k)=\frac{1}{6}\qquad k=1,2,3,4,5,6

Ogni esito ha probabilità $\displaystyle { \frac{1}{6} }$ . La distribuzione di probabilità è quindi uniforme.

E[X]=\sum_i x_i\,P(X=x_i)

Il valore atteso, cioè la media teorica pesata dalle probabilità, sintetizza il centro della distribuzione.

Nel caso discreto, ogni valore contribuisce in proporzione alla propria probabilità. Si osserva quindi una media di lungo periodo, non la media di un singolo esperimento.

Esempio — Valore atteso di una variabile discreta

Si consideri una variabile $X$ con valori $0$ , $1$ e $2$ con probabilità rispettive $0{,}2$ , $0{,}5$ e $0{,}3$ .

E[X]=0\cdot 0{,}2+1\cdot 0{,}5+2\cdot 0{,}3=1{,}1

Il valore atteso è $1{,}1$ . Il risultato si legge come media pesata dei valori possibili.

E[X]=\int_{-\infty}^{+\infty} x\,f(x)\,dx

Nel caso continuo, $f(x)$ è la funzione di densità, cioè la funzione che descrive come si distribuisce la probabilità lungo l'asse reale.

L'area totale sotto la densità deve valere $1$ . La probabilità di un intervallo si ottiene come area sotto la curva.

Esempio — Valore atteso di una densità continua

Si consideri una densità uniforme in $[0,2]$ .

f(x)=\frac{1}{2}\quad \text{per }0\le x\le 2

Si calcola $E[X]=1$ . Il centro dell'intervallo coincide con la media teorica.

\operatorname{Var}(X)=E[X^2]-\bigl(E[X]\bigr)^2

La varianza, cioè la misura della dispersione dei valori attorno al valore atteso, quantifica quanto i dati si allontanano dalla media.

La deviazione standard, cioè la radice quadrata della varianza, si scrive $\sigma=\sqrt{\operatorname{Var}(X)}$ .

Esempio — Varianza e deviazione standard

Si usi la variabile dell'esempio precedente, per cui $E[X]=1{,}1$ .

E[X^2]=0^2\cdot 0{,}2+1^2\cdot 0{,}5+2^2\cdot 0{,}3=1{,}7

Si ottiene $\operatorname{Var}(X)=1{,}7-(1{,}1)^2=0{,}49$ , quindi $\sigma=0{,}7$ .

F(x)=P(X\le x)

La funzione di ripartizione, cioè la funzione che accumula la probabilità fino a un valore fissato, descrive completamente la distribuzione.

Per una variabile discreta, $F(x)$ è una funzione a gradini. Per una variabile continua, risulta continua e non decrescente.

Esempio — Funzione di ripartizione in un caso discreto

Si consideri $X$ con valori $1$ , $2$ e $3$ con probabilità $0{,}2$ , $0{,}5$ e $0{,}3$ .

F(x)=\begin{cases}0 & x<1\\0{,}2 & 1\le x<2\\0{,}7 & 2\le x<3\\1 & x\ge 3\end{cases}

La funzione cresce a salti e raggiunge $1$ in corrispondenza degli ultimi valori possibili.

E[aX+b]=aE[X]+b

Questa proprietà è detta linearità del valore atteso. Si usa per trasformazioni affini della variabile.

Esempi svolti

Esempio 1 — Variabile aleatoria discreta: dado equo

Si consideri il lancio di un dado equo e la variabile aleatoria $X$ , cioè la funzione che associa a ogni esito il numero uscito.

Si osserva che $X$ è discreta, cioè assume valori finiti e numerabili.

I valori possibili sono $1,2,3,4,5,6$ , e ciascun valore ha probabilità $\displaystyle { \frac{1}{6} }$ .

P(X=x_i)=\frac{1}{6}\qquad i=1,\dots,6

Il valore atteso si calcola con la somma pesata dei valori possibili.

E[X]=\sum_{i=1}^{6} x_i\,P(X=x_i)=\frac{1+2+3+4+5+6}{6}=\frac{21}{6}=3.5

Il valore atteso è $3.5$ .

La varianza misura la dispersione dei valori attorno alla media.

E[X^2]=\frac{1^2+2^2+3^2+4^2+5^2+6^2}{6}=\frac{91}{6}

\operatorname{Var}(X)=E[X^2]-(E[X])^2=\frac{91}{6}-\left(3.5\right)^2=\frac{35}{12}

Esempio 2 — Variabile continua: densità uniforme su [0,2]

Si consideri una variabile aleatoria $X$ uniforme su $[0,2]$ , cioè una variabile continua con densità costante.

Si ricorda che una variabile continua non si descrive con probabilità puntuali, ma con una densità $f(x)$ .

Nel caso uniforme, la densità vale costante su tutto l'intervallo.

f(x)=\begin{cases}\frac{1}{2} & \text{se } 0\le x\le 2\\0 & \text{altrove}\end{cases}

L'area totale sotto la densità deve valere $1$ .

\int_{-\infty}^{+\infty} f(x)\,dx=\int_0^2 \frac{1}{2}\,dx=1

Il valore atteso si calcola con l'integrale della posizione pesata dalla densità.

E[X]=\int_0^2 x\cdot \frac{1}{2}\,dx=\left[\frac{x^2}{4}\right]_0^2=1

Il valore atteso è $1$ , cioè il centro dell'intervallo.

Errore comune: assegnare una probabilità a un singolo punto in una variabile continua.

Esempio 3 — Trasformazione lineare della variabile aleatoria

Si consideri una variabile aleatoria $X$ con $E[X]=4$ e $Var(X)=9$ . Si definisca $Y=2X-3$ .

Si chiede di calcolare il valore atteso e la varianza di $Y$ .

Si usa la proprietà lineare del valore atteso.

E[Y]=E[2X-3]=2E[X]-3=2\cdot 4-3=5

Si usa poi la formula di trasformazione della varianza.

\operatorname{Var}(Y)=\operatorname{Var}(2X-3)=2^2\operatorname{Var}(X)=4\cdot 9=36

Il valore atteso di $Y$ è $5$ , e la sua varianza è $36$ .

Errore comune: moltiplicare la varianza per 2 invece che per 4.

Esempio 4 — Funzione di ripartizione di una variabile discreta

Si consideri la variabile aleatoria discreta $X$ , con distribuzione $\displaystyle { P(X=0)=\frac{1}{4} }$ , $\displaystyle { P(X=1)=\frac{1}{2} }$ , $\displaystyle { P(X=2)=\frac{1}{4} }$ .

Si chiede di costruire la funzione di ripartizione $F(x)=P(X\le x)$ .

Si procede per intervalli, sommando le probabilità dei valori non superiori a $x$ .

F(x)=\begin{cases}0 & x<0\\\frac{1}{4} & 0\le x<1\\\frac{3}{4} & 1\le x<2\\1 & x\ge 2\end{cases}

Per esempio, se $x=1.5$ , allora $\displaystyle { F(1.5)=\frac{3}{4} }$ .

La funzione di ripartizione è crescente e assume sempre valori tra $0$ e $1$ .

Errore comune: confondere la funzione di ripartizione con la densità o con la massa di probabilità.

Errori comuni

✗

Considerare la variabile aleatoria come un singolo numero già noto.

✓

La variabile aleatoria è una funzione, cioè associa a ogni esito casuale un numero reale.

L’errore nasce perché si confonde l’esito dell’esperimento con il valore numerico assegnato. Si evita ricordando che la variabile aleatoria descrive i risultati possibili prima dell’osservazione.

✗

Scrivere che il valore atteso è sempre il valore più probabile.

✓

Il valore atteso è una media ponderata, cioè un valore medio teorico pesato dalle probabilità.

Il valore più probabile e la media possono non coincidere. Si controlla sempre la definizione: per una variabile discreta si usa $E[X]=\sum x_iP(X=x_i)$ .

✗

Calcolare la varianza come $E[X]^2-E[X^2]$ .

✓

La formula corretta è $Var(X)=E[X^2]-(E[X])^2$ .

L’ordine dei termini è decisivo. Un segno invertito può produrre un risultato negativo, che non è possibile per una varianza.

✗

Confondere variabile discreta e continua: usare somme per una distribuzione continua.

✓

Per una variabile discreta si usano somme; per una continua si usa una densità, cioè una funzione da integrare.

La discreta assume valori finiti o numerabili. La continua assume infiniti valori in un intervallo, e le probabilità si ottengono con integrali, non con singole probabilità puntuali.

✗

Pensare che la funzione di ripartizione sia la probabilità del valore esatto $X=x$ .

✓

La funzione di ripartizione è $F(x)=P(X\le x)$ .

La probabilità del singolo punto è in generale zero nel caso continuo. La funzione di ripartizione somma tutte le probabilità fino a $x$ , quindi descrive l’andamento cumulato.

✗

Dimenticare che una trasformazione lineare cambia anche la varianza di un fattore quadrato.

✓

Se $Y=aX+b$ , allora $E[Y]=aE[X]+b$ e $Var(Y)=a^2Var(X)$ .

L’errore avviene perché si pensa solo allo spostamento dovuto a $b$ . La varianza misura la dispersione e non cambia con le traslazioni, ma si moltiplica per $a^2$ con le dilatazioni.

Domande frequenti

Una variabile aleatoria, cioè una funzione che associa a ogni esito casuale un numero reale, serve a descrivere quantitativamente un fenomeno incerto.

Nel caso discreto, i valori possibili sono finiti o numerabili. In tal caso si usa la distribuzione di probabilità, cioè l'elenco delle probabilità dei singoli valori.

P(X=x_i)

Il valore atteso, cioè la media teorica della variabile aleatoria, è il valore medio che si ottiene nel lungo periodo.

E[X]=\sum_i x_i\,P(X=x_i)\qquad \text{oppure} \qquad E[X]=\int_{-\infty}^{+\infty} x\,f(x)\,dx

La varianza, cioè la misura della dispersione dei valori attorno alla media, si calcola come differenza tra il momento quadratico medio e il quadrato del valore atteso.

\operatorname{Var}(X)=E[X^2]-(E[X])^2

La deviazione standard, cioè la radice quadrata della varianza, è $\sigma$ . Per $\operatorname{Var}(X)=9$ , si ottiene $\sigma=3$ .

Una variabile discreta, cioè una variabile che assume valori separati e contabili, prende un numero finito o numerabile di valori.

Una variabile continua, cioè una variabile che può assumere qualsiasi valore in un intervallo, si descrive con una densità di probabilità, cioè una funzione che distribuisce la probabilità sull'intervallo.

\int_{-\infty}^{+\infty} f(x)\,dx=1

La funzione di ripartizione, cioè la funzione che accumula le probabilità fino a un certo valore, è la probabilità che la variabile sia minore o uguale a $x$ .

F(x)=P(X\le x)

Per esempio, se $F(2)=0{,}7$ , allora la probabilità che $X$ assuma un valore non superiore a 2 è 0,7.

Il valore atteso è lineare, cioè il valore atteso di una combinazione lineare si calcola combinando i valori attesi.

E[aX+b]=aE[X]+b

La varianza cambia con il quadrato del fattore di scala. La traslazione non la modifica.

\operatorname{Var}(aX+b)=a^2\operatorname{Var}(X)

#Probabilità #Statistica 🎓 4º Scientifico 🎓 5º Scientifico 🎓 4º Classico 🎓 5º Classico

Hai trovato utile questa lezione?

Variabili aleatorie

Definizioni e calcolo base

Altre opzioni

Simula interrogazione Risolutore esercizi Correggi compiti

Concetto chiave

Variabili aleatorie

E[X]=\sum_i x_i\,P(X=x_i)\quad\text{oppure}\quad E[X]=\int_{-\infty}^{+\infty}x\,f(x)\,dx

✓Discreta: assume valori finiti o numerabili, con funzione di massa $P(X=x_i)$ .
✓Continua: è descritta da una densità $f(x)$ e vale $\int_{-\infty}^{+\infty}f(x)\,dx=1$ .
✓Valore atteso: media teorica, cioè il valore medio pesato dai casi possibili.
✓Varianza: misura la dispersione, con $Var(X)=E[X^2]-(E[X])^2$ e $\sigma=\sqrt{Var(X)}$ .
✓Ripartizione: $F(x)=P(X\le x)$ , utile per descrivere la distribuzione cumulata.

Schema rapido delle variabili aleatorie

Concetto	Definizione	Formula	Nota
Variabile aleatoria discreta	Associa a ogni esito un numero reale con valori finiti o numerabili.	$P(X=x_i)$	Si usa una funzione di massa di probabilità.
Variabile aleatoria continua	Associa a ogni esito un numero reale in un intervallo.	$\int_{-\infty}^{+\infty} f(x)\,dx=1$	Si usa una densità di probabilità.
Valore atteso	È la media pesata dei valori assunti da $X$ .	$E[X]=\sum_i x_iP(X=x_i)$ oppure $E[X]=\int x f(x)\,dx$	Misura il centro della distribuzione.
Varianza	Misura la dispersione dei valori attorno alla media.	$\mathrm{Var}(X)=E[X^2]-(E[X])^2$	La deviazione standard è $\sigma=\sqrt{\mathrm{Var}(X)}$ .
Funzione di ripartizione	Dà la probabilità che $X$ sia minore o uguale a $x$ .	$F(x)=P(X\le x)$	È crescente e compresa tra 0 e 1.
Proprietà lineare del valore atteso	Trasformare $X$ con $aX+b$ trasforma linearmente la media.	$E[aX+b]=aE[X]+b$	Vale per ogni variabile aleatoria per cui l’attesa esiste.
Proprietà della varianza	Trasformare $X$ con $aX+b$ moltiplica la varianza per $a^2$ .	$\mathrm{Var}(aX+b)=a^2\mathrm{Var}(X)$	Lo spostamento $b$ non cambia la dispersione.

Variabili aleatorie: perché servono

Si introduce una variabile aleatoria, cioè una regola che associa un numero a ogni esito incerto, quando si vuole trasformare l'incertezza in calcolo.

L'idea nasce perché molti fenomeni non si descrivono bene con un solo numero fisso. Si pensi al numero di teste in dieci lanci di moneta.

In quel caso, il risultato può cambiare ogni volta. Però si può studiare la probabilità dei possibili valori.

La variabile non descrive l'esito in modo verbale. Lo traduce in un numero, così si possono usare media, dispersione e grafici.

X : \Omega \to \mathbb{R}

Per esempio, se si osserva il lancio di un dado, si può definire $X$ come il numero uscito. Se esce 4, allora $X=4$ .

Questa scelta non cambia il caso studiato. Cambia soltanto il modo di rappresentarlo in matematica.

Variabile aleatoria discreta

Una variabile aleatoria discreta, cioè una variabile che assume un numero finito o numerabile di valori, è adatta ai conteggi.

Si pensi al numero di studenti presenti in classe, oppure al numero di successi in una serie di prove.

Ogni valore possibile ha una probabilità associata. Questa informazione si chiama distribuzione di probabilità, cioè l'elenco dei valori possibili con le rispettive probabilità.

P(X=x_i)=p_i

Per esempio, se $X$ può valere 0, 1 oppure 2 con probabilità 0,2; 0,5; 0,3, allora si ha $P(X=1)=0,5$ .

La somma di tutte le probabilità deve valere 1, perché uno dei casi possibili deve verificarsi.

\sum_i p_i=1

Per esempio, 0,2 + 0,5 + 0,3 = 1. Il controllo conferma che la distribuzione è coerente.

[IMMAGINE: Tabella con tre valori discreti di X, le probabilità P(X = x_i) e una barra verticale per ciascun valore sull'asse orizzontale, con somma totale uguale a 1]

Variabile aleatoria continua

Una variabile aleatoria continua, cioè una variabile che può assumere infiniti valori in un intervallo, modella misure come tempo, peso o altezza.

In questo caso non si assegna una probabilità a un singolo valore puntuale. Si assegna invece una densità, cioè una funzione che descrive come la probabilità si distribuisce lungo l'asse.

\int_{-\infty}^{+\infty} f(x)\,dx=1

Per esempio, se la densità è costante su un intervallo di lunghezza 2 e vale 0,5, allora l'area totale è 0,5·2 = 1.

Per una variabile continua si ha $P(X=x)=0$ per ogni singolo valore $x$ . Conta soltanto la probabilità di intervalli.

P(a\le X\le b)=\int_a^b f(x)\,dx

Per esempio, se $\displaystyle { f(x)=\frac{1}{2} }$ su $[0,2]$ , allora $\displaystyle { P(0\le X\le 1)=\int_0^1 \frac{1}{2}\,dx=\frac{1}{2} }$ .

Valore atteso o media

Il valore atteso, cioè la media teorica dei valori di una variabile aleatoria, descrive il centro della distribuzione nel lungo periodo.

Non è un valore che necessariamente si osserva in un singolo esperimento. È il risultato medio a cui si tende ripetendo molte prove.

E[X]=\sum_i x_i\,P(X=x_i)

Per esempio, se $X$ vale 0 con probabilità 0,7 e 5 con probabilità 0,3, allora $E[X]=0\cdot 0,7+5\cdot 0,3=1,5$ .

E[X]=\int_{-\infty}^{+\infty} x\,f(x)\,dx

Per esempio, se $\displaystyle { f(x)=\frac{1}{2} }$ su $[0,2]$ , allora $\displaystyle { E[X]=\int_0^2 x\cdot \frac{1}{2}\,dx=1 }$ .

Il valore atteso si comporta bene con le trasformazioni lineari. Si ottiene una formula molto utile nei problemi applicati.

E[aX+b]=aE[X]+b

Per esempio, se $E[X]=1,5$ e si considera $Y=2X-3$ , allora $E[Y]=2\cdot 1,5-3=0$ .

Varianza e deviazione standard

La varianza, cioè la misura della dispersione dei valori attorno alla media, indica quanto i dati tendono a lontanarsi dal valore atteso.

Si guarda il quadrato degli scarti, così gli scarti positivi e negativi non si annullano.

Var(X)=E[X^2]-(E[X])^2

Per esempio, se $X$ vale 0 con probabilità 0,7 e 5 con probabilità 0,3, allora $E[X^2]=0^2\cdot 0,7+5^2\cdot 0,3=7,5$ .

Si è già trovato $E[X]=1,5$ . Quindi $Var(X)=7,5-(1,5)^2=5,25$ .

\sigma=\sqrt{Var(X)}

Per esempio, se $Var(X)=5,25$ , allora la deviazione standard vale $\sigma=\sqrt{5,25}\approx 2,29$ .

Var(aX+b)=a^2Var(X)

Per esempio, se $Var(X)=5,25$ e si considera $Y=2X-3$ , allora $Var(Y)=2^2\cdot 5,25=21$ .

Funzione di ripartizione

La funzione di ripartizione, cioè la funzione che dà la probabilità di ottenere valori minori o uguali a un certo numero, riassume tutta la distribuzione.

F(x)=P(X\le x)

Per esempio, se $X$ assume 0, 1 e 2 con probabilità 0,2; 0,5; 0,3, allora $F(1)=P(X\le 1)=0,2+0,5=0,7$ .

La funzione di ripartizione cresce in modo non decrescente. Inoltre tende a 0 a sinistra e a 1 a destra.

\lim_{x\to -\infty}F(x)=0 \qquad \lim_{x\to +\infty}F(x)=1

Per esempio, nel caso discreto precedente, se $x=-1$ , allora $F(-1)=0$ . Se $x=3$ , allora $F(3)=1$ .

Nel caso continuo, la funzione di ripartizione si ottiene integrando la densità fino a $x$ .

F(x)=\int_{-\infty}^{x} f(t)\,dt

Per esempio, se $\displaystyle { f(t)=\frac{1}{2} }$ su $[0,2]$ , allora per $0\le x\le 2$ si ha $\displaystyle { F(x)=\int_0^x \frac{1}{2}\,dt=\frac{x}{2} }$ .

Proprietà lineari e collegamenti finali

Le proprietà lineari servono perché permettono di trasformare una variabile senza rifare tutti i calcoli da zero. Sono fondamentali nei modelli applicati.

Se $Y=aX+b$ , allora il valore atteso cambia in modo lineare.
Se $Y=aX+b$ , allora la varianza si moltiplica per $a^2$ .
Se la varianza è piccola, i valori sono concentrati attorno alla media.

Per esempio, se una misura viene espressa in centimetri invece che in metri, il fattore di scala modifica la varianza, ma non il significato del fenomeno.

E[aX+b]=aE[X]+b \qquad Var(aX+b)=a^2Var(X)

Per esempio, se $E[X]=4$ e $Var(X)=2$ , allora per $Y=3X+1$ si ottiene $E[Y]=13$ e $Var(Y)=18$ .

Formule e proprietà

Una variabile aleatoria, cioè una funzione che associa a ogni esito numerico di un esperimento casuale un numero reale, si descrive tramite distribuzione di probabilità.

P(X=x_i)=p_i

Qui $X$ indica la variabile aleatoria, mentre $x_i$ è uno dei valori possibili. La quantità $p_i$ rappresenta la probabilità associata a quel valore.

I valori $x_i$ sono finiti o numerabili.
Si ha $p_i\ge 0$ per ogni indice.
La somma totale vale $\sum_i p_i=1$ .

Esempio — Distribuzione discreta di un dado equilibrato

Si consideri il lancio di un dado regolare. La variabile $X$ assume i valori da $1$ a $6$ .

P(X=k)=\frac{1}{6}\qquad k=1,2,3,4,5,6

Ogni esito ha probabilità $\displaystyle { \frac{1}{6} }$ . La distribuzione di probabilità è quindi uniforme.

E[X]=\sum_i x_i\,P(X=x_i)

Il valore atteso, cioè la media teorica pesata dalle probabilità, sintetizza il centro della distribuzione.

Nel caso discreto, ogni valore contribuisce in proporzione alla propria probabilità. Si osserva quindi una media di lungo periodo, non la media di un singolo esperimento.

Esempio — Valore atteso di una variabile discreta

Si consideri una variabile $X$ con valori $0$ , $1$ e $2$ con probabilità rispettive $0{,}2$ , $0{,}5$ e $0{,}3$ .

E[X]=0\cdot 0{,}2+1\cdot 0{,}5+2\cdot 0{,}3=1{,}1

Il valore atteso è $1{,}1$ . Il risultato si legge come media pesata dei valori possibili.

E[X]=\int_{-\infty}^{+\infty} x\,f(x)\,dx

Nel caso continuo, $f(x)$ è la funzione di densità, cioè la funzione che descrive come si distribuisce la probabilità lungo l'asse reale.

L'area totale sotto la densità deve valere $1$ . La probabilità di un intervallo si ottiene come area sotto la curva.

Esempio — Valore atteso di una densità continua

Si consideri una densità uniforme in $[0,2]$ .

f(x)=\frac{1}{2}\quad \text{per }0\le x\le 2

Si calcola $E[X]=1$ . Il centro dell'intervallo coincide con la media teorica.

\operatorname{Var}(X)=E[X^2]-\bigl(E[X]\bigr)^2

La varianza, cioè la misura della dispersione dei valori attorno al valore atteso, quantifica quanto i dati si allontanano dalla media.

La deviazione standard, cioè la radice quadrata della varianza, si scrive $\sigma=\sqrt{\operatorname{Var}(X)}$ .

Esempio — Varianza e deviazione standard

Si usi la variabile dell'esempio precedente, per cui $E[X]=1{,}1$ .

E[X^2]=0^2\cdot 0{,}2+1^2\cdot 0{,}5+2^2\cdot 0{,}3=1{,}7

Si ottiene $\operatorname{Var}(X)=1{,}7-(1{,}1)^2=0{,}49$ , quindi $\sigma=0{,}7$ .

F(x)=P(X\le x)

La funzione di ripartizione, cioè la funzione che accumula la probabilità fino a un valore fissato, descrive completamente la distribuzione.

Per una variabile discreta, $F(x)$ è una funzione a gradini. Per una variabile continua, risulta continua e non decrescente.

Esempio — Funzione di ripartizione in un caso discreto

Si consideri $X$ con valori $1$ , $2$ e $3$ con probabilità $0{,}2$ , $0{,}5$ e $0{,}3$ .

F(x)=\begin{cases}0 & x<1\\0{,}2 & 1\le x<2\\0{,}7 & 2\le x<3\\1 & x\ge 3\end{cases}

La funzione cresce a salti e raggiunge $1$ in corrispondenza degli ultimi valori possibili.

E[aX+b]=aE[X]+b

Questa proprietà è detta linearità del valore atteso. Si usa per trasformazioni affini della variabile.

Esempi svolti

Esempio 1 — Variabile aleatoria discreta: dado equo

Si consideri il lancio di un dado equo e la variabile aleatoria $X$ , cioè la funzione che associa a ogni esito il numero uscito.

Si osserva che $X$ è discreta, cioè assume valori finiti e numerabili.

I valori possibili sono $1,2,3,4,5,6$ , e ciascun valore ha probabilità $\displaystyle { \frac{1}{6} }$ .

P(X=x_i)=\frac{1}{6}\qquad i=1,\dots,6

Il valore atteso si calcola con la somma pesata dei valori possibili.

E[X]=\sum_{i=1}^{6} x_i\,P(X=x_i)=\frac{1+2+3+4+5+6}{6}=\frac{21}{6}=3.5

Il valore atteso è $3.5$ .

La varianza misura la dispersione dei valori attorno alla media.

E[X^2]=\frac{1^2+2^2+3^2+4^2+5^2+6^2}{6}=\frac{91}{6}

\operatorname{Var}(X)=E[X^2]-(E[X])^2=\frac{91}{6}-\left(3.5\right)^2=\frac{35}{12}

Esempio 2 — Variabile continua: densità uniforme su [0,2]

Si consideri una variabile aleatoria $X$ uniforme su $[0,2]$ , cioè una variabile continua con densità costante.

Si ricorda che una variabile continua non si descrive con probabilità puntuali, ma con una densità $f(x)$ .

Nel caso uniforme, la densità vale costante su tutto l'intervallo.

f(x)=\begin{cases}\frac{1}{2} & \text{se } 0\le x\le 2\\0 & \text{altrove}\end{cases}

L'area totale sotto la densità deve valere $1$ .

\int_{-\infty}^{+\infty} f(x)\,dx=\int_0^2 \frac{1}{2}\,dx=1

Il valore atteso si calcola con l'integrale della posizione pesata dalla densità.

E[X]=\int_0^2 x\cdot \frac{1}{2}\,dx=\left[\frac{x^2}{4}\right]_0^2=1

Il valore atteso è $1$ , cioè il centro dell'intervallo.

Errore comune: assegnare una probabilità a un singolo punto in una variabile continua.

Esempio 3 — Trasformazione lineare della variabile aleatoria

Si consideri una variabile aleatoria $X$ con $E[X]=4$ e $Var(X)=9$ . Si definisca $Y=2X-3$ .

Si chiede di calcolare il valore atteso e la varianza di $Y$ .

Si usa la proprietà lineare del valore atteso.

E[Y]=E[2X-3]=2E[X]-3=2\cdot 4-3=5

Si usa poi la formula di trasformazione della varianza.

\operatorname{Var}(Y)=\operatorname{Var}(2X-3)=2^2\operatorname{Var}(X)=4\cdot 9=36

Il valore atteso di $Y$ è $5$ , e la sua varianza è $36$ .

Errore comune: moltiplicare la varianza per 2 invece che per 4.

Esempio 4 — Funzione di ripartizione di una variabile discreta

Si consideri la variabile aleatoria discreta $X$ , con distribuzione $\displaystyle { P(X=0)=\frac{1}{4} }$ , $\displaystyle { P(X=1)=\frac{1}{2} }$ , $\displaystyle { P(X=2)=\frac{1}{4} }$ .

Si chiede di costruire la funzione di ripartizione $F(x)=P(X\le x)$ .

Si procede per intervalli, sommando le probabilità dei valori non superiori a $x$ .

F(x)=\begin{cases}0 & x<0\\\frac{1}{4} & 0\le x<1\\\frac{3}{4} & 1\le x<2\\1 & x\ge 2\end{cases}

Per esempio, se $x=1.5$ , allora $\displaystyle { F(1.5)=\frac{3}{4} }$ .

La funzione di ripartizione è crescente e assume sempre valori tra $0$ e $1$ .

Errore comune: confondere la funzione di ripartizione con la densità o con la massa di probabilità.

Errori comuni

✗

Considerare la variabile aleatoria come un singolo numero già noto.

✓

La variabile aleatoria è una funzione, cioè associa a ogni esito casuale un numero reale.

✗

Scrivere che il valore atteso è sempre il valore più probabile.

✓

Il valore atteso è una media ponderata, cioè un valore medio teorico pesato dalle probabilità.

Il valore più probabile e la media possono non coincidere. Si controlla sempre la definizione: per una variabile discreta si usa $E[X]=\sum x_iP(X=x_i)$ .

✗

Calcolare la varianza come $E[X]^2-E[X^2]$ .

✓

La formula corretta è $Var(X)=E[X^2]-(E[X])^2$ .

L’ordine dei termini è decisivo. Un segno invertito può produrre un risultato negativo, che non è possibile per una varianza.

✗

Confondere variabile discreta e continua: usare somme per una distribuzione continua.

✓

Per una variabile discreta si usano somme; per una continua si usa una densità, cioè una funzione da integrare.

La discreta assume valori finiti o numerabili. La continua assume infiniti valori in un intervallo, e le probabilità si ottengono con integrali, non con singole probabilità puntuali.

✗

Pensare che la funzione di ripartizione sia la probabilità del valore esatto $X=x$ .

✓

La funzione di ripartizione è $F(x)=P(X\le x)$ .

La probabilità del singolo punto è in generale zero nel caso continuo. La funzione di ripartizione somma tutte le probabilità fino a $x$ , quindi descrive l’andamento cumulato.

✗

Dimenticare che una trasformazione lineare cambia anche la varianza di un fattore quadrato.

✓

Se $Y=aX+b$ , allora $E[Y]=aE[X]+b$ e $Var(Y)=a^2Var(X)$ .

L’errore avviene perché si pensa solo allo spostamento dovuto a $b$ . La varianza misura la dispersione e non cambia con le traslazioni, ma si moltiplica per $a^2$ con le dilatazioni.

Domande frequenti

Una variabile aleatoria, cioè una funzione che associa a ogni esito casuale un numero reale, serve a descrivere quantitativamente un fenomeno incerto.

Nel caso discreto, i valori possibili sono finiti o numerabili. In tal caso si usa la distribuzione di probabilità, cioè l'elenco delle probabilità dei singoli valori.

P(X=x_i)

Il valore atteso, cioè la media teorica della variabile aleatoria, è il valore medio che si ottiene nel lungo periodo.

E[X]=\sum_i x_i\,P(X=x_i)\qquad \text{oppure} \qquad E[X]=\int_{-\infty}^{+\infty} x\,f(x)\,dx

La varianza, cioè la misura della dispersione dei valori attorno alla media, si calcola come differenza tra il momento quadratico medio e il quadrato del valore atteso.

\operatorname{Var}(X)=E[X^2]-(E[X])^2

La deviazione standard, cioè la radice quadrata della varianza, è $\sigma$ . Per $\operatorname{Var}(X)=9$ , si ottiene $\sigma=3$ .

Una variabile discreta, cioè una variabile che assume valori separati e contabili, prende un numero finito o numerabile di valori.

\int_{-\infty}^{+\infty} f(x)\,dx=1

La funzione di ripartizione, cioè la funzione che accumula le probabilità fino a un certo valore, è la probabilità che la variabile sia minore o uguale a $x$ .

F(x)=P(X\le x)

Per esempio, se $F(2)=0{,}7$ , allora la probabilità che $X$ assuma un valore non superiore a 2 è 0,7.

Il valore atteso è lineare, cioè il valore atteso di una combinazione lineare si calcola combinando i valori attesi.

E[aX+b]=aE[X]+b

La varianza cambia con il quadrato del fattore di scala. La traslazione non la modifica.

\operatorname{Var}(aX+b)=a^2\operatorname{Var}(X)

#Probabilità #Statistica 🎓 4º Scientifico 🎓 5º Scientifico 🎓 4º Classico 🎓 5º Classico

Hai trovato utile questa lezione?