Esercizi Svolti Di Statistica E Calcolo Delle Probabilità

Guida Completa agli Esercizi Svolti di Statistica e Calcolo delle Probabilità

La statistica e il calcolo delle probabilità sono discipline fondamentali in numerosi campi, dalla ricerca scientifica all’economia, dall’ingegneria alle scienze sociali. Questa guida approfondita ti fornirà gli strumenti necessari per comprendere e risolvere esercizi pratici, con esempi concreti e spiegazioni dettagliate.

1. Fondamenti di Probabilità

La probabilità misura la possibilità che un evento si verifichi. Si esprime come un numero compreso tra 0 (evento impossibile) e 1 (evento certo).

1.1 Definizioni Chiave

Spazio campionario (S): Insieme di tutti i possibili risultati di un esperimento
Evento (E): Sottoinsieme dello spazio campionario
Probabilità classica: P(E) = Numero casi favorevoli / Numero casi possibili
Probabilità frequentista: Limite della frequenza relativa al tendere all’infinito del numero di prove
Probabilità soggettiva: Grado di fiducia che un individuo attribuisce al verificarsi di un evento

1.2 Teoremi Fondamentali

Teorema della somma: P(A ∪ B) = P(A) + P(B) – P(A ∩ B)
Teorema del prodotto: P(A ∩ B) = P(A) × P(B|A)
Teorema di Bayes: P(A|B) = [P(B|A) × P(A)] / P(B)
Legge del complemento: P(A) + P(Ā) = 1

2. Variabili Aleatorie e Distribuzioni di Probabilità

Una variabile aleatoria (o casuale) è una funzione che associa a ogni evento dello spazio campionario un numero reale. Le variabili aleatorie possono essere discrete o continue.

2.1 Variabili Aleatorie Discrete

Assumono un numero finito o infinito numerabile di valori. Esempi comuni:

Distribuzione di Bernoulli: Modella esperimenti con due possibili esiti (successo/fallimento)
Distribuzione Binomiale: Modella il numero di successi in n prove indipendenti
Distribuzione di Poisson: Modella il numero di eventi che si verificano in un intervallo fisso di tempo o spazio
Distribuzione Geometrica: Modella il numero di prove necessarie per ottenere il primo successo

2.2 Variabili Aleatorie Continue

Assumono valori in un intervallo continuo. Le più importanti:

Distribuzione Normale (Gaussiana): Simmetrica a forma di campana, definita da media (μ) e deviazione standard (σ)
Distribuzione Uniforme: Tutti i valori nell’intervallo [a,b] hanno uguale probabilità
Distribuzione Esponenziale: Modella il tempo tra eventi in un processo di Poisson
Distribuzione Chi-quadrato: Usata nei test di ipotesi e stima della varianza

3. Statistica Descrittiva

La statistica descrittiva si occupa di raccogliere, organizzare, sintetizzare e presentare i dati. Gli strumenti principali sono:

3.1 Misure di Tendenza Centrale

Misura	Formula	Quando Usarla	Sensibilità ai Valori Estremi
Media Aritmetica	μ = (Σx_i) / N	Dati quantitativi con distribuzione simmetrica	Alta
Mediana	Valore centrale (N dispari) o media dei due centrali (N pari)	Dati quantitativi con distribuzione asimmetrica	Bassa
Moda	Valore più frequente	Dati qualitativi o quantitativi discreti	Nessuna

3.2 Misure di Dispersione

Varianza: σ² = Σ(x_i – μ)² / N (popolazione) o Σ(x_i – x̄)² / (n-1) (campione)
Deviazione Standard: σ = √σ²
Range: Differenza tra valore massimo e minimo
Coefficienti di Variazione: CV = (σ / μ) × 100
Scarti Interquartili: Q3 – Q1

4. Inferenza Statistica

L’inferenza statistica permette di trarre conclusioni su una popolazione a partire da un campione. I due principali approcci sono:

4.1 Stima Puntuale e Intervallare

Stima puntuale: Fornisce un singolo valore come stima del parametro (es. media campionaria x̄ come stima di μ).

Stima intervallare: Fornisce un intervallo di valori plausibili per il parametro, con un certo livello di confidenza (tipicamente 90%, 95% o 99%).

L’intervallo di confidenza per la media (con σ noto) è dato da:

x̄ ± z_(α/2) × (σ/√n)

Dove z_(α/2) è il valore critico della distribuzione normale standard per il livello di confidenza desiderato.

4.2 Test di Ipotesi

Procedure per verificare affermazioni su parametri di popolazione. I passaggi fondamentali sono:

Formulare ipotesi nulla (H₀) e alternativa (H₁)
Scegliere il livello di significatività (α, tipicamente 0.05)
Calcolare la statistica test dal campione
Determinare la regione di rifiuto
Prendere una decisione (rifiutare o non rifiutare H₀)
Calcolare il p-value (probabilità di osservare un risultato almeno così estremo quanto quello osservato, assumendo H₀ vera)

Tipo di Test	Ipotesi Nulla (H₀)	Ipotesi Alternativa (H₁)	Statistica Test
Test z per la media (σ noto)	μ = μ₀	μ ≠ μ₀ (bilaterale) μ > μ₀ (unilaterale dx) μ < μ₀ (unilaterale sx)	z = (x̄ – μ₀) / (σ/√n)
Test t per la media (σ ignoto)	μ = μ₀	μ ≠ μ₀ (bilaterale)	t = (x̄ – μ₀) / (s/√n)
Test per la proporzione	p = p₀	p ≠ p₀	z = (p̂ – p₀) / √[p₀(1-p₀)/n]
Test Chi-quadrato per la bontà di adattamento	La distribuzione osservata segue la distribuzione attesa	La distribuzione osservata non segue la distribuzione attesa	χ² = Σ[(O_i – E_i)² / E_i]

5. Esercizi Pratici Risolti

5.1 Problema sulla Distribuzione Normale

Testo: In un esame universitario, i voti seguono una distribuzione normale con media μ = 72 e deviazione standard σ = 8. Qual è la probabilità che uno studente scelto a caso abbia un voto:

Superiore a 80?
Compreso tra 65 e 80?
Inferiore a 60?

Soluzione:

Standardizziamo i valori usando Z = (X – μ) / σ

P(X > 80) = P(Z > (80-72)/8) = P(Z > 1) = 1 – Φ(1) ≈ 1 – 0.8413 = 0.1587 (15.87%)
P(65 < X < 80) = P((65-72)/8 < Z < (80-72)/8) = P(-0.875 < Z < 1) = Φ(1) - Φ(-0.875) ≈ 0.8413 - 0.1908 = 0.6505 (65.05%)
P(X < 60) = P(Z < (60-72)/8) = P(Z < -1.5) = Φ(-1.5) ≈ 0.0668 (6.68%)

5.2 Problema sulla Distribuzione Binomiale

Testo: Un’azienda sa che il 5% dei suoi prodotti ha un difetto. Se vengono prelevati 20 prodotti a caso, qual è la probabilità che:

Esattamente 2 prodotti siano difettosi?
Al massimo 1 prodotto sia difettoso?
Almeno 3 prodotti siano difettosi?

Soluzione: Usiamo la distribuzione binomiale B(n=20, p=0.05)

P(X=2) = C(20,2) × (0.05)² × (0.95)¹⁸ ≈ 0.1887 (18.87%)
P(X≤1) = P(X=0) + P(X=1) ≈ (0.95)²⁰ + 20×0.05×(0.95)¹⁹ ≈ 0.3585 + 0.3774 = 0.7359 (73.59%)
P(X≥3) = 1 – P(X≤2) ≈ 1 – [P(X=0) + P(X=1) + P(X=2)] ≈ 1 – 0.9186 = 0.0814 (8.14%)

5.3 Problema sulla Distribuzione di Poisson

Testo: In un centrale telefonica arrivano in media 12 chiamate al minuto. Qual è la probabilità che:

Arrivino esattamente 10 chiamate in un minuto?
Arrivino meno di 8 chiamate in un minuto?
Arrivino più di 15 chiamate in un minuto?

Soluzione: Usiamo la distribuzione di Poisson con λ = 12

P(X=10) = (e⁻¹² × 12¹⁰) / 10! ≈ 0.1048 (10.48%)
P(X<8) = Σₖ₌₀⁷ (e⁻¹² × 12ᵏ) / k! ≈ 0.1906 (19.06%)
P(X>15) = 1 – P(X≤15) ≈ 1 – 0.8806 = 0.1194 (11.94%)

6. Errori Comuni da Evitare

Confondere probabilità e statistica: La probabilità studia eventi futuri basandosi su modelli teorici, mentre la statistica analizza dati passati per fare inferenze.
Ignorare le condizioni di applicabilità: Ad esempio, usare il test z quando la deviazione standard della popolazione è ignota e il campione è piccolo (n < 30).
Trascurare la normalità dei dati: Molti test parametrici (come il test t) richiedono che i dati seguano una distribuzione normale.
Confondere correlazione e causalità: Una forte correlazione tra due variabili non implica necessariamente un rapporto di causa-effetto.
Errori nei gradi di libertà: Nel calcolo degli intervalli di confidenza o nei test di ipotesi, è cruciale usare i corretti gradi di libertà.
Interpretazione errata dei p-value: Un p-value basso non prova che H₀ sia falsa, ma solo che i dati sono incompatibili con H₀ assumendo che sia vera.
Campioni non rappresentativi: I risultati dell’inferenza statistica sono validi solo se il campione è rappresentativo della popolazione.

7. Applicazioni Pratiche

La statistica e il calcolo delle probabilità trovano applicazione in numerosi campi:

7.1 In Medicina

Studio dell’efficacia dei farmaci (saggi clinici)
Analisi della sopravvivenza (curve di Kaplan-Meier)
Diagnosi medica (teorema di Bayes)
Epidemiologia (studio della diffusione delle malattie)

7.2 In Economia e Finanza

Analisi di rischio e rendimento degli investimenti
Modelli predittivi per i mercati azionari
Valutazione delle opzioni (modello Black-Scholes)
Analisi delle serie temporali (modelli ARIMA)

7.3 Nell’Ingegneria

Controllo qualità (carte di controllo)
Affidabilità dei sistemi (distribuzione esponenziale)
Ottimizzazione dei processi (design of experiments)
Analisi dei dati sensoriali (Internet of Things)

7.4 Nelle Scienze Sociali

Analisi dei dati demografici
Studio delle tendenze elettorali
Ricerca di mercato
Analisi dei social media

8. Strumenti e Software per la Statistica

Esistono numerosi strumenti software che facilitano l’analisi statistica:

R: Linguaggio di programmazione specifico per l’analisi statistica e la visualizzazione dei dati. Open source e altamente personalizzabile.
Python (con librerie come NumPy, SciPy, Pandas, StatsModels): Sempre più popolare per l’analisi dati grazie alla sua versatilità.
SPSS: Software commerciale ampiamente usato nelle scienze sociali e nella ricerca di mercato.
SAS: Potente strumento per l’analisi statistica avanzata, molto usato in ambito aziendale e medico.
Excel: Nonostante le limitazioni, offre funzioni statistiche di base utili per analisi semplici.
Minitab: Software specializzato nel controllo statistico di qualità e nell’analisi dei processi.
JMP: Strumento interattivo per l’esplorazione e l’analisi dei dati.

Per esercizi e calcoli rapidi, strumenti online come il calcolatore presente in questa pagina possono essere estremamente utili per verificare i risultati ottenuti manualmente.