Calcolatore Chi-Quadro (χ²)

Calcola facilmente il test del chi-quadro per verificare l’indipendenza tra variabili categoriche. Inserisci i tuoi dati osservati e attesi per ottenere il valore χ², i gradi di libertà e il p-value.

Numero di righe (categorie)

Numero di colonne (categorie)

Tabella dei dati osservati

	Colonna 1	Colonna 2	Colonna 3
Riga 1
Riga 2
Riga 3

Livello di significatività (α)

Risultati del Test Chi-Quadro

Valore Chi-Quadro (χ²): 0.00

Gradi di libertà (df): 0

p-value: 0.0000

Decisione: Inserisci i dati per calcolare

Come si Calcola il Chi-Quadro: Guida Completa al Test χ²

Il test del chi-quadro (χ²) è uno degli strumenti statistici più importanti per analizzare la relazione tra variabili categoriche. Questo test non parametrico viene utilizzato per determinare se esiste una differenza significativa tra le frequenze osservate e quelle attese in una o più categorie.

Cos’è il Test Chi-Quadro?

Il test chi-quadro di Pearson, sviluppato da Karl Pearson nel 1900, è un metodo statistico utilizzato per:

Verificare l’indipendenza tra due variabili categoriche (test di indipendenza)
Confrontare la distribuzione osservata con una distribuzione attesa (test di bontà dell’adattamento)
Analizzare tabelle di contingenza in studi epidemiologici e sociali

Quando Utilizzare il Test Chi-Quadro

Il test χ² è appropriato quando:

I dati sono categorici (nominali o ordinali)
Le osservazioni sono indipendenti
Le frequenze attese in ogni cella sono ≥5 (per tabelle 2×2) o ≥1 (per tabelle più grandi con la correzione di Yates)
Il campione è sufficientemente grande (generalmente n>40)

Linee Guida Ufficiali

Secondo le linee guida del NIST/SEMATECH (National Institute of Standards and Technology), il test chi-quadro dovrebbe essere utilizzato quando:

Si vuole testare l’ipotesi nulla che non esiste associazione tra le variabili
Le frequenze attese non sono troppo basse (evitare celle con frequenze attese <1)
Non più del 20% delle celle ha frequenze attese <5

Formula del Chi-Quadro

La formula generale per calcolare il chi-quadro è:

χ² = Σ [(Oᵢ – Eᵢ)² / Eᵢ]

Dove:

Oᵢ = frequenza osservata nella cella i
Eᵢ = frequenza attesa nella cella i
Σ = sommatoria su tutte le celle

Calcolo delle Frequenze Attese

Per tabelle di contingenza, le frequenze attese si calcolano come:

Eᵢⱼ = (Totale riga i × Totale colonna j) / Totale generale

Gradi di Libertà

I gradi di libertà (df) per una tabella di contingenza si calcolano come:

df = (numero righe – 1) × (numero colonne – 1)

Per un test di bontà dell’adattamento:

df = numero categorie – 1 – numero parametri stimati

Interpretazione dei Risultati

Dopo aver calcolato il valore χ², si confronta con:

Il valore critico dalla tabella chi-quadro in base ai gradi di libertà e al livello α
Il p-value associato

Valori critici chi-quadro per α=0.05
Gradi di libertà (df)	Valore critico	Gradi di libertà (df)	Valore critico
1	3.841	6	12.592
2	5.991	7	14.067
3	7.815	8	15.507
4	9.488	9	16.919
5	11.070	10	18.307

Regola decisionale:

Se χ² > valore critico → rifiuti H₀ (c’è associazione significativa)
Se p-value < α → rifiuti H₀
Se χ² ≤ valore critico → non rifiuti H₀ (nessuna associazione significativa)
Se p-value ≥ α → non rifiuti H₀

Esempio Pratico di Calcolo

Consideriamo un esempio con i seguenti dati osservati su 200 pazienti:

Distribuzione di pazienti per trattamento e esito
	Guarito	Non guarito	Totale
Trattamento A	60	40	100
Trattamento B	50	50	100
Totale	110	90	200

Passo 1: Calcolo frequenze attese

Per la cella “Trattamento A, Guarito”:

E = (100 × 110) / 200 = 55

Frequenze attese
	Guarito	Non guarito
Trattamento A	55	45
Trattamento B	55	45

Passo 2: Applicazione della formula χ²

Calcoliamo per ogni cella:

Calcoli intermedi
Cella	O	E	(O-E)²/E
A, Guarito	60	55	0.4545
A, Non guarito	40	45	0.5556
B, Guarito	50	55	0.4545
B, Non guarito	50	45	0.5556
Totale χ²			2.0202

Passo 3: Determinazione gradi di libertà

df = (2-1) × (2-1) = 1

Passo 4: Confronto con valore critico

Per df=1 e α=0.05, il valore critico è 3.841.

Poiché 2.0202 < 3.841, non rifiutiamo H₀.

Conclusione: Non c’è evidenza statistica di una differenza significativa tra i due trattamenti (p > 0.05).

Limiti del Test Chi-Quadro

Nonostante la sua utilità, il test χ² presenta alcuni limiti:

Dipendenza dalla dimensione del campione: Con campioni molto grandi, anche differenze minime possono risultare significative
Sensibilità alle frequenze basse: Celle con frequenze attese <5 possono distorcere i risultati
Solo per dati categorici: Non adatto per variabili continue
Non indica la forza dell’associazione: Solo la sua significatività statistica

Raccomandazioni dell’Università di Yale

Secondo il Dipartimento di Statistica di Yale, quando le frequenze attese sono basse:

Combinare categorie adiacenti se appropriato
Utilizzare il test esatto di Fisher per tabelle 2×2 con frequenze <5
Applicare la correzione di Yates per la continuità in tabelle 2×2
Considerare metodi alternativi come il test G di likelihood ratio

Alternative al Test Chi-Quadro

Confronto tra test per dati categorici
Test	Quando usarlo	Vantaggi	Limitazioni
Chi-Quadro	Frequenze attese ≥5, campioni grandi	Semplice, versatile, ampiamente compreso	Sensibile a frequenze basse e campioni grandi
Test Esatto di Fisher	Tabelle 2×2 con frequenze <5	Preciso per piccoli campioni	Computazionalmente intensivo, solo per 2×2
Test G	Alternative al χ² per tabelle di contingenza	Meno sensibile a frequenze basse	Risultati simili al χ² per campioni grandi
Test di McNemar	Dati appaiati (stesso soggetto in due condizioni)	Ideale per studi pre-post	Solo per tabelle 2×2

Applicazioni Pratiche del Chi-Quadro

Il test χ² trova applicazione in numerosi campi:

Medicina:
- Valutazione dell’efficacia di trattamenti
- Studio dell’associazione tra fattori di rischio e malattie
- Analisi di dati epidemiologici
Marketing:
- Test A/B su preferenze dei consumatori
- Analisi della segmentazione di mercato
- Studio dell’associazione tra demografia e comportamenti d’acquisto
Scienze Sociali:
- Studio delle relazioni tra variabili socio-demografiche
- Analisi dei dati dei sondaggi
- Ricerca sulle differenze culturali
Controllo Qualità:
- Analisi dei difetti di produzione
- Confronti tra lotti di produzione
- Studio della distribuzione dei difetti

Errori Comuni da Evitare

Quando si utilizza il test chi-quadro, è importante evitare questi errori:

Ignorare le frequenze attese basse: Sempre verificare che non più del 20% delle celle abbia frequenze attese <5
Usare dati continui: Il χ² è solo per dati categorici; per dati continui usare t-test o ANOVA
Interpretare erroneamente il p-value: Un p-value basso indica solo che c’è un’associazione, non la sua forza o direzione
Dimenticare di verificare le ipotesi: Sempre controllare l’indipendenza delle osservazioni e la dimensione del campione
Usare il test per campioni molto piccoli: Con n<40 i risultati possono essere inaffidabili
Non riportare gli effect size: Oltre al χ², riportare misure come il V di Cramer o il phi per quantificare l’associazione

Software per il Calcolo del Chi-Quadro

Il test χ² può essere calcolato con numerosi software statistici:

Excel: Con la funzione CHISQ.TEST() o CHISQ.INV()
R: Utilizzando chisq.test()
Python: Con scipy.stats.chi2_contingency()
SPSS: Attraverso Analyze → Descriptive Statistics → Crosstabs
Stata: Con il comando tabulate con opzione chi2
Calcolatrici online: Come quella fornita in questa pagina

Conclusione

Il test del chi-quadro rimane uno degli strumenti fondamentali nell’analisi statistica dei dati categorici. La sua semplicità concettuale e versatilità lo rendono accessibile sia a ricercatori esperti che a studenti alle prime armi con la statistica. Tuttavia, è cruciale comprendere appieno le sue ipotesi, limiti e corretta interpretazione per evitare conclusioni errate.

Ricorda sempre che:

Il χ² test verifica solo l’esistenza di un’associazione, non la causalità
Un risultato significativo non implica necessariamente un’associazione forte
La significatività statistica dipende dalla dimensione del campione
È sempre buona pratica riportare oltre al p-value anche misure di effect size

Per approfondimenti teorici, si consiglia la consultazione di testi classici come “Statistical Methods for the Social Sciences” di Alan Agresti o “Introductory Statistics” di OpenStax, disponibile gratuitamente sul sito della Rice University.

Come Si Calcola Il Chi Quadro