Calcolatore X² 2 (Chi-Quadrato)
Calcola il valore critico e il p-value per test di indipendenza o bontà di adattamento con distribuzione chi-quadrato (χ²).
Guida Completa al Calcolo del Chi-Quadrato (χ²)
Il test chi-quadrato (χ²) è uno degli strumenti statistici più utilizzati per valutare l’indipendenza tra variabili categoriche o la bontà di adattamento di un modello. Questa guida approfondita copre tutti gli aspetti fondamentali, dalle basi matematiche alle applicazioni pratiche.
1. Cos’è il Test Chi-Quadrato?
Il test χ² è un test non parametrico utilizzato per:
- Test di indipendenza: Verificare se esiste una relazione tra due variabili categoriche (es. genere e preferenza politica)
- Test di bontà di adattamento: Confrontare una distribuzione osservata con una distribuzione attesa (es. verificare se un dado è bilanciato)
- Test di omogeneità: Determinare se più campioni provengono dalla stessa popolazione
2. Formula del Chi-Quadrato
La statistica test χ² si calcola con la formula:
χ² = Σ [(Oᵢ – Eᵢ)² / Eᵢ]
Dove:
- Oᵢ = Frequenza osservata nella categoria i
- Eᵢ = Frequenza attesa nella categoria i
- Σ = Sommatoria su tutte le categorie
3. Gradi di Libertà
I gradi di libertà (df) determinano la forma della distribuzione χ²:
- Test di indipendenza: df = (r-1)(c-1) dove r = righe, c = colonne
- Test di bontà di adattamento: df = k-1-p dove k = categorie, p = parametri stimati
| Gradi di libertà (df) | Valore critico (α=0.05) | Valore critico (α=0.01) |
|---|---|---|
| 1 | 3.841 | 6.635 |
| 2 | 5.991 | 9.210 |
| 3 | 7.815 | 11.345 |
| 4 | 9.488 | 13.277 |
| 5 | 11.070 | 15.086 |
| 10 | 18.307 | 23.209 |
| 20 | 31.410 | 37.566 |
4. Interpretazione dei Risultati
Per interpretare correttamente i risultati:
- Confronta χ² calcolato con χ² critico:
- Se χ² calcolato > χ² critico → Rifiuta H₀ (risultato significativo)
- Se χ² calcolato ≤ χ² critico → Non rifiutare H₀
- Valuta il p-value:
- p-value < α → Risultato significativo
- p-value ≥ α → Risultato non significativo
- Considera la dimensione dell’effetto:
- V di Cramer per tabelle >2×2
- Phi per tabelle 2×2
5. Assunzioni del Test Chi-Quadrato
Per risultati validi, devono essere soddisfatte queste condizioni:
- Indipendenza delle osservazioni: Ogni soggetto deve contribuire a una sola cella
- Dimensione campionaria:
- Tutte le frequenze attese dovrebbero essere ≥5 (regola empirica)
- Massimo 20% delle celle con frequenze attese <5
- Variabili categoriche: Le variabili devono essere nominali o ordinali
Se le frequenze attese sono troppo basse, considerare:
- Unire categorie adiacenti
- Utilizzare il test esatto di Fisher per tabelle 2×2
- Aumentare la dimensione campionaria
6. Esempio Pratico: Test di Indipendenza
Supponiamo di voler testare se c’è una relazione tra genere (M/F) e preferenza per un prodotto (A/B):
| Prodotto A | Prodotto B | Totale | |
|---|---|---|---|
| Maschi | 45 (40) | 35 (40) | 80 |
| Femmine | 35 (40) | 45 (40) | 80 |
| Totale | 80 | 80 | 160 |
Dove i numeri tra parentesi sono le frequenze attese.
Calcolo χ²:
χ² = (45-40)²/40 + (35-40)²/40 + (35-40)²/40 + (45-40)²/40 = 2.5
Con df=1 e α=0.05, χ² critico=3.841. Poiché 2.5 < 3.841, non rifiutiamo H₀ (nessuna relazione significativa).
7. Errori Comuni da Evitare
- Ignorare le frequenze attese basse: Può invalidare i risultati
- Confondere test di indipendenza con bontà di adattamento: Hanno df diversi
- Interpretare erroneamente il p-value:
- p=0.04 non significa “4% di probabilità che H₀ sia vera”
- Significa “4% di probabilità di osservare questi dati (o più estremi) se H₀ fosse vera”
- Usare il test con variabili continue: Richiede categorizzazione (con perdita di informazione)
- Trascurare la dimensione dell’effetto: La significatività non implica rilevanza pratica
8. Alternative al Test Chi-Quadrato
| Situazione | Test Alternativo | Quando Usarlo |
|---|---|---|
| Tabelle 2×2 con frequenze <5 | Test esatto di Fisher | Campioni piccoli |
| Variabili ordinali | Test di Mann-Whitney o Kruskal-Wallis | Quando l’ordine delle categorie è importante |
| Dati appaiati | Test di McNemar | Campioni dipendenti (es. prima/dopo) |
| Più di 2 variabili | Analisi log-lineare | Relazioni complesse tra variabili categoriche |
9. Applicazioni Reali del Test Chi-Quadrato
- Marketing:
- Testare se segmenti demografici rispondono diversamente a campagne
- Valutare associazioni tra comportamento d’acquisto e caratteristiche socio-demografiche
- Medicina:
- Studiare l’associazione tra fattori di rischio (es. fumo) e malattie
- Valutare l’efficacia di trattamenti in studi clinici
- Scienze sociali:
- Analizzare relazioni tra atteggiamenti politici e livello di istruzione
- Studiare pattern di mobilità sociale
- Controllo qualità:
- Verificare se i difetti di produzione sono distribuiti casualmente
- Testare l’omogeneità tra lotti di produzione
10. Limiti del Test Chi-Quadrato
- Sensibilità alla dimensione campionaria:
- Con campioni molto grandi, anche differenze minime risultano significative
- Con campioni piccoli, anche differenze importanti possono non essere rilevate
- Perde informazioni:
- Tratta variabili ordinali come nominali
- Non considera la direzione della relazione
- Assunzione di indipendenza:
- Dati appaiati o clusterizzati violano l’assunzione
- Richiede correzioni (es. Rao-Scott per dati cluster)
- Solo per conteggi:
- Non adatto per variabili continue
- La categorizzazione artificiale riduce il potere statistico