Calcolatore Chi-Quadro (χ²)

Calcola il test chi-quadro per valutare l’indipendenza tra variabili categoriche con precisione statistica

Numero di righe

Numero di colonne

Livello di significatività (α)

Correzione di Yates

Tabella delle frequenze osservate

Risultati del Test Chi-Quadro

χ² = 0.000

Gradi di libertà (df): 0

p-value: 0.000

Decisione: –

Interpretazione: –

Guida Completa al Test Chi-Quadro (χ²): Calcolo, Interpretazione e Applicazioni Pratiche

Il test chi-quadro (χ²) è uno degli strumenti statistici più importanti per analizzare la relazione tra variabili categoriche. Questo metodo non parametrico viene utilizzato per determinare se esiste una associazione significativa tra due variabili o se la distribuzione osservata differisce da quella attesa.

Cos’è il Test Chi-Quadro?

Il test chi-quadro di Pearson, sviluppato da Karl Pearson nel 1900, è un test statistico che confronta le frequenze osservate in una tabella di contingenza con le frequenze attese sotto l’ipotesi nulla di indipendenza tra le variabili.

Ipotesi nulla (H₀): Le variabili sono indipendenti (non c’è associazione)
Ipotesi alternativa (H₁): Le variabili sono dipendenti (c’è associazione)

Quando Utilizzare il Test Chi-Quadro

Il test χ² è appropriato quando:

Si hanno due variabili categoriche (nominali o ordinali)
I dati possono essere organizzati in una tabella di contingenza
Le frequenze attese in ogni cella sono ≥5 (per tabelle 2×2) o ≥1 (per tabelle più grandi)
I campioni sono indipendenti

Formula del Chi-Quadro

La statistica test χ² viene calcolata come:

χ² = Σ [(Oᵢ – Eᵢ)² / Eᵢ]

Dove:

Oᵢ = frequenza osservata in ogni cella
Eᵢ = frequenza attesa in ogni cella (calcolata come (totale riga × totale colonna) / totale generale)

Gradi di Libertà

I gradi di libertà (df) per una tabella di contingenza sono calcolati come:

df = (r – 1) × (c – 1)

Dove r = numero di righe e c = numero di colonne.

Correzione di Yates per la Continuità

Per tabelle 2×2 con frequenze attese <5, si applica la correzione di Yates:

χ² = Σ [(|Oᵢ – Eᵢ| – 0.5)² / Eᵢ]

Interpretazione dei Risultati

p-value	Livello di significatività (α)	Decisione	Interpretazione
p ≤ 0.01	1%	Rifiuta H₀	Evidenza molto forte contro H₀
0.01 < p ≤ 0.05	5%	Rifiuta H₀	Evidenza moderata contro H₀
0.05 < p ≤ 0.10	10%	Rifiuta H₀ (debolmente)	Evidenza debole contro H₀
p > 0.10	–	Non rifiuta H₀	Nessuna evidenza contro H₀

Esempio Pratico

Supponiamo di voler testare se c’è associazione tra fumo (sì/no) e malattia polmonare (sì/no) in un campione di 200 persone:

	Malattia Polmonare	No Malattia	Totale
Fumatori	45	55	100
Non Fumatori	20	80	100
Totale	65	135	200

Calcolando χ² otteniamo 11.76 con df=1. Il p-value è 0.0006, quindi rifiutiamo H₀ al livello 0.05, concludendo che c’è una associazione significativa tra fumo e malattia polmonare.

Applicazioni del Test Chi-Quadro

Ricerca medica: Studio dell’associazione tra fattori di rischio e malattie
Marketing: Analisi delle preferenze dei consumatori per diversi prodotti
Studio delle relazioni tra variabili demografiche e comportamentali
Controllo qualità: Verifica se la distribuzione dei difetti segue uno schema atteso
Genetica: Test di ipotesi su rapporti fenotipici (es. 3:1 in incroci mendeliani)

Limitazioni del Test Chi-Quadro

Dipendenza dalle frequenze attese: Non è affidabile se più del 20% delle celle ha frequenze attese <5
Sensibilità alla dimensione campionaria: Con campioni molto grandi, anche differenze minime risultano significative
Solo per variabili categoriche: Non può essere usato per variabili continue
Non indica la forza dell’associazione: Solo se esiste, non quanto è forte

Alternative al Test Chi-Quadro

Situazione	Test Alternativo	Quando Usarlo
Frequenze attese <5 in >20% delle celle	Test esatto di Fisher	Per tabelle 2×2 con campioni piccoli
Variabili ordinali	Test di Mann-Whitney o Kruskal-Wallis	Quando l’ordine delle categorie è importante
Campioni appaiati	Test di McNemar	Per dati appaiati in tabelle 2×2
Più di due variabili	Analisi log-lineare	Per tabelle multi-dimensionali

Fonti Autorevoli:

Domande Frequenti sul Test Chi-Quadro

1. Qual è la differenza tra test chi-quadro di bontà dell’adattamento e test di indipendenza?

Il test di bontà dell’adattamento confronta una distribuzione osservata con una distribuzione teorica (es. uniforme, normale). Il test di indipendenza valuta se due variabili categoriche sono associate in una tabella di contingenza.

2. Quando devo applicare la correzione di Yates?

La correzione di Yates dovrebbe essere applicata solo per tabelle 2×2 quando le frequenze attese sono piccole (generalmente <5). Per tabelle più grandi o frequenze attese sufficienti, la correzione tende a essere troppo conservativa e non è necessaria.

3. Come interpreto un p-value di 0.04 con α=0.05?

Un p-value di 0.04 è inferiore al livello di significatività 0.05, quindi rifiuti l’ipotesi nulla. Questo indica che c’è una evidenza statistica sufficientemente forte (al livello 5%) per concludere che esiste un’associazione tra le variabili.

4. Il test chi-quadro può essere usato per variabili continue?

No, il test chi-quadro è specifico per variabili categoriche. Per variabili continue, dovresti usare test come il t-test, ANOVA o correlazione di Pearson, a seconda della situazione.

5. Cosa significa se il chi-quadro è 0?

Un valore χ² = 0 indica che le frequenze osservate sono esattamente uguali alle frequenze attese. Questo suggerisce una perfetta aderenza all’ipotesi nulla (nessuna differenza tra osservato e atteso).

6. Come calcolo le frequenze attese manualmente?

Per ogni cella, la frequenza attesa Eᵢ = (Totale Riga × Totale Colonna) / Totale Generale. Ad esempio, in una tabella 2×2 con totali di riga (R₁, R₂), totali di colonna (C₁, C₂) e totale generale N, la frequenza attesa per la cella (1,1) è (R₁ × C₁)/N.

7. Qual è la relazione tra chi-quadro e il coefficiente di contingenza?

Il coefficiente di contingenza (C) è una misura dell’intensità dell’associazione basata sul χ², calcolato come C = √(χ²/(χ² + n)). Tuttavia, C non raggiunge mai 1, quindi per confrontare associazioni tra tabelle di dimensioni diverse si usa spesso il V di Cramer.

Chi Quadro Foglio Di Calcolo