Calcolatore Chi-Quadro (χ²)
Calcola il test chi-quadro per valutare l’indipendenza tra variabili categoriche con precisione statistica
Risultati del Test Chi-Quadro
Guida Completa al Test Chi-Quadro (χ²): Calcolo, Interpretazione e Applicazioni Pratiche
Il test chi-quadro (χ²) è uno degli strumenti statistici più importanti per analizzare la relazione tra variabili categoriche. Questo metodo non parametrico viene utilizzato per determinare se esiste una associazione significativa tra due variabili o se la distribuzione osservata differisce da quella attesa.
Cos’è il Test Chi-Quadro?
Il test chi-quadro di Pearson, sviluppato da Karl Pearson nel 1900, è un test statistico che confronta le frequenze osservate in una tabella di contingenza con le frequenze attese sotto l’ipotesi nulla di indipendenza tra le variabili.
- Ipotesi nulla (H₀): Le variabili sono indipendenti (non c’è associazione)
- Ipotesi alternativa (H₁): Le variabili sono dipendenti (c’è associazione)
Quando Utilizzare il Test Chi-Quadro
Il test χ² è appropriato quando:
- Si hanno due variabili categoriche (nominali o ordinali)
- I dati possono essere organizzati in una tabella di contingenza
- Le frequenze attese in ogni cella sono ≥5 (per tabelle 2×2) o ≥1 (per tabelle più grandi)
- I campioni sono indipendenti
Formula del Chi-Quadro
La statistica test χ² viene calcolata come:
χ² = Σ [(Oᵢ – Eᵢ)² / Eᵢ]
Dove:
- Oᵢ = frequenza osservata in ogni cella
- Eᵢ = frequenza attesa in ogni cella (calcolata come (totale riga × totale colonna) / totale generale)
Gradi di Libertà
I gradi di libertà (df) per una tabella di contingenza sono calcolati come:
df = (r – 1) × (c – 1)
Dove r = numero di righe e c = numero di colonne.
Correzione di Yates per la Continuità
Per tabelle 2×2 con frequenze attese <5, si applica la correzione di Yates:
χ² = Σ [(|Oᵢ – Eᵢ| – 0.5)² / Eᵢ]
Interpretazione dei Risultati
| p-value | Livello di significatività (α) | Decisione | Interpretazione |
|---|---|---|---|
| p ≤ 0.01 | 1% | Rifiuta H₀ | Evidenza molto forte contro H₀ |
| 0.01 < p ≤ 0.05 | 5% | Rifiuta H₀ | Evidenza moderata contro H₀ |
| 0.05 < p ≤ 0.10 | 10% | Rifiuta H₀ (debolmente) | Evidenza debole contro H₀ |
| p > 0.10 | – | Non rifiuta H₀ | Nessuna evidenza contro H₀ |
Esempio Pratico
Supponiamo di voler testare se c’è associazione tra fumo (sì/no) e malattia polmonare (sì/no) in un campione di 200 persone:
| Malattia Polmonare | No Malattia | Totale | |
|---|---|---|---|
| Fumatori | 45 | 55 | 100 |
| Non Fumatori | 20 | 80 | 100 |
| Totale | 65 | 135 | 200 |
Calcolando χ² otteniamo 11.76 con df=1. Il p-value è 0.0006, quindi rifiutiamo H₀ al livello 0.05, concludendo che c’è una associazione significativa tra fumo e malattia polmonare.
Applicazioni del Test Chi-Quadro
- Ricerca medica: Studio dell’associazione tra fattori di rischio e malattie
- Marketing: Analisi delle preferenze dei consumatori per diversi prodotti
- Studio delle relazioni tra variabili demografiche e comportamentali
- Controllo qualità: Verifica se la distribuzione dei difetti segue uno schema atteso
- Genetica: Test di ipotesi su rapporti fenotipici (es. 3:1 in incroci mendeliani)
Limitazioni del Test Chi-Quadro
- Dipendenza dalle frequenze attese: Non è affidabile se più del 20% delle celle ha frequenze attese <5
- Sensibilità alla dimensione campionaria: Con campioni molto grandi, anche differenze minime risultano significative
- Solo per variabili categoriche: Non può essere usato per variabili continue
- Non indica la forza dell’associazione: Solo se esiste, non quanto è forte
Alternative al Test Chi-Quadro
| Situazione | Test Alternativo | Quando Usarlo |
|---|---|---|
| Frequenze attese <5 in >20% delle celle | Test esatto di Fisher | Per tabelle 2×2 con campioni piccoli |
| Variabili ordinali | Test di Mann-Whitney o Kruskal-Wallis | Quando l’ordine delle categorie è importante |
| Campioni appaiati | Test di McNemar | Per dati appaiati in tabelle 2×2 |
| Più di due variabili | Analisi log-lineare | Per tabelle multi-dimensionali |
Domande Frequenti sul Test Chi-Quadro
1. Qual è la differenza tra test chi-quadro di bontà dell’adattamento e test di indipendenza?
Il test di bontà dell’adattamento confronta una distribuzione osservata con una distribuzione teorica (es. uniforme, normale). Il test di indipendenza valuta se due variabili categoriche sono associate in una tabella di contingenza.
2. Quando devo applicare la correzione di Yates?
La correzione di Yates dovrebbe essere applicata solo per tabelle 2×2 quando le frequenze attese sono piccole (generalmente <5). Per tabelle più grandi o frequenze attese sufficienti, la correzione tende a essere troppo conservativa e non è necessaria.
3. Come interpreto un p-value di 0.04 con α=0.05?
Un p-value di 0.04 è inferiore al livello di significatività 0.05, quindi rifiuti l’ipotesi nulla. Questo indica che c’è una evidenza statistica sufficientemente forte (al livello 5%) per concludere che esiste un’associazione tra le variabili.
4. Il test chi-quadro può essere usato per variabili continue?
No, il test chi-quadro è specifico per variabili categoriche. Per variabili continue, dovresti usare test come il t-test, ANOVA o correlazione di Pearson, a seconda della situazione.
5. Cosa significa se il chi-quadro è 0?
Un valore χ² = 0 indica che le frequenze osservate sono esattamente uguali alle frequenze attese. Questo suggerisce una perfetta aderenza all’ipotesi nulla (nessuna differenza tra osservato e atteso).
6. Come calcolo le frequenze attese manualmente?
Per ogni cella, la frequenza attesa Eᵢ = (Totale Riga × Totale Colonna) / Totale Generale. Ad esempio, in una tabella 2×2 con totali di riga (R₁, R₂), totali di colonna (C₁, C₂) e totale generale N, la frequenza attesa per la cella (1,1) è (R₁ × C₁)/N.
7. Qual è la relazione tra chi-quadro e il coefficiente di contingenza?
Il coefficiente di contingenza (C) è una misura dell’intensità dell’associazione basata sul χ², calcolato come C = √(χ²/(χ² + n)). Tuttavia, C non raggiunge mai 1, quindi per confrontare associazioni tra tabelle di dimensioni diverse si usa spesso il V di Cramer.