Calcolare La Statistica Chi Quadro

Calcolatore Statistica Chi-Quadro (χ²)

Inserisci i dati della tua tabella di contingenza per calcolare la statistica chi-quadro e verificare l’indipendenza tra variabili categoriche.

Colonne
Righe Colonna 1 Colonna 2
Riga 1
Riga 2

Guida Completa al Test Chi-Quadro (χ²): Quando e Come Utilizzarlo

Il test chi-quadro (χ²) è uno dei metodi statistici più utilizzati per analizzare la relazione tra variabili categoriche. Questo test non parametrico valuta se esiste una associazione significativa tra due variabili categoriche in una tabella di contingenza.

Cosa è il Test Chi-Quadro?

Il test chi-quadro di Pearson, sviluppato da Karl Pearson nel 1900, confronta le frequenze osservate in una tabella di contingenza con le frequenze attese sotto l’ipotesi nulla di indipendenza tra le variabili. La statistica test χ² misura lo scostamento tra valori osservati e attesi:

χ² = Σ [(Oᵢ – Eᵢ)² / Eᵢ]

Dove:

  • Oᵢ = frequenza osservata nella cella i
  • Eᵢ = frequenza attesa nella cella i (calcolata come (totale riga × totale colonna) / totale generale)

Quando Utilizzare il Test Chi-Quadro

Il test χ² è appropriato quando:

  1. Si hanno due variabili categoriche (nominali o ordinali)
  2. Si vuole testare l’indipendenza tra le variabili
  3. I dati sono rappresentati in una tabella di contingenza
  4. Le frequenze attese in ogni cella sono ≥5 (per tabelle 2×2) o ≥1 con ≤20% delle celle <5 (per tabelle più grandi)

Ipotesi del Test Chi-Quadro

Ipotesi Nulla (H₀) Ipotesi Alternativa (H₁)
Le due variabili sono indipendenti (non c’è associazione) Le due variabili sono dipendenti (c’è associazione)

Gradi di Libertà e Distribuzione Chi-Quadro

I gradi di libertà (df) per una tabella di contingenza R×C sono calcolati come:

df = (R – 1) × (C – 1)

Dove R = numero di righe e C = numero di colonne. La statistica χ² segue una distribuzione chi-quadro con df gradi di libertà sotto H₀.

Interpretazione dei Risultati

Per interpretare i risultati:

  1. Confronta il p-value con il livello di significatività α (tipicamente 0.05)
  2. Se p-value < α, rifiuti H₀ (c’è evidenza di associazione)
  3. Se p-value ≥ α, non rifiuti H₀ (nessuna evidenza sufficiente di associazione)
p-value Livello α = 0.05 Decisione Conclusione
p < 0.05 Significativo Rifiuta H₀ C’è associazione significativa
p ≥ 0.05 Non significativo Non rifiuta H₀ Nessuna evidenza di associazione

Esempio Pratico

Supponiamo di voler testare se c’è associazione tra sesso (M/F) e preferenza per un prodotto (Sì/No). I dati osservati sono:

Preferisce Sì Preferisce No Totale
Maschi 45 25 70
Femmine 30 40 70
Totale 75 65 140

Calcoliamo le frequenze attese:

  • Maschi che preferiscono Sì: (70 × 75)/140 = 37.5
  • Maschi che preferiscono No: (70 × 65)/140 = 32.5
  • Femmine che preferiscono Sì: (70 × 75)/140 = 37.5
  • Femmine che preferiscono No: (70 × 65)/140 = 32.5

La statistica χ² sarà:

χ² = (45-37.5)²/37.5 + (25-32.5)²/32.5 + (30-37.5)²/37.5 + (40-32.5)²/32.5 ≈ 6.17

Con df = (2-1)×(2-1) = 1, il p-value è ≈ 0.013. Poiché 0.013 < 0.05, rifiutiamo H₀ e concludiamo che c'è una associazione significativa tra sesso e preferenza per il prodotto.

Assunzioni e Limitazioni

Il test χ² ha alcune assunzioni importanti:

  • Indipendenza delle osservazioni: Ogni soggetto deve contribuire a una sola cella
  • Frequenze attese sufficienti: Nessuna cella dovrebbe avere frequenza attesa <1, e ≤20% delle celle con frequenza <5
  • Dati categorici: Le variabili devono essere categoriche (non continue)

Se le frequenze attese sono troppo basse, considerare:

  • Unire categorie adiacenti
  • Utilizzare il test esatto di Fisher per tabelle 2×2
  • Aumentare il campione

Alternative al Test Chi-Quadro

Test Quando Usarlo Vantaggi
Test Esatto di Fisher Tabelle 2×2 con frequenze attese <5 Preciso per campioni piccoli
Test G di Likelihood Ratio Alternative al χ² per tabelle grandi Meno sensibile a frequenze attese basse
Test di McNemar Dati appaiati (stesso soggetto in due condizioni) Ideale per studi pre/post trattamento

Errori Comuni da Evitare

  1. Ignorare le frequenze attese basse: Può invalidare i risultati
  2. Usare il χ² per dati continui: Richiede categorizzazione (con perdita di informazione)
  3. Interpretare il χ² come misura di forza dell’associazione: Usare invece V di Cramer o phi
  4. Non correggere per test multipli: Aumenta il rischio di errori di Tipo I

Calcolo Manual vs. Software

Mentre il calcolo manuale è possibile per tabelle piccole, per analisi reali si consiglia l’uso di software statistico come:

  • R: chisq.test()
  • Python: scipy.stats.chi2_contingency
  • SPSS: Analisi → Statistiche descrittive → Tabelle incrociate
  • Excel: =CHISQ.TEST(intervallo_osservato, intervallo_atteso)

Applicazioni Pratiche del Test Chi-Quadro

Il test χ² trova applicazione in numerosi campi:

  • Marketing: Testare se preferenze per un prodotto differiscono tra gruppi demografici
  • Medicina: Valutare l’associazione tra fattori di rischio e malattie
  • Scienze sociali: Analizzare relazioni tra variabili socio-economiche
  • Controllo qualità: Verificare se difetti di produzione sono indipendenti dal turno di lavoro
  • Genetica: Testare ratios fenotipici in incroci mendeliani

Estensioni del Test Chi-Quadro

Esistono varianti del test χ² per situazioni specifiche:

  • Test χ² per bontà di adattamento: Confronta distribuzioni osservate con distribuzioni teoriche
  • Test χ² per omogeneità: Verifica se più popolazioni hanno la stessa distribuzione
  • Test χ² per trend: Analizza trend in tabelle 2×C o R×2
  • Test di Mantel-Haenszel: Per dati stratificati

Interpretazione della Forza dell’Associazione

Il test χ² indica solo se c’è associazione, non la sua forza. Per misurare l’entità dell’associazione:

Misura Intervallo Interpretazione Quando Usarla
Phi (φ) 0 a 1 0.1=debole, 0.3=moderata, 0.5=forte Tabelle 2×2
V di Cramer 0 a 1 0.1=debole, 0.3=moderata, 0.5=forte Tabelle R×C
Lambda 0 a 1 Miglioramento predittivo Variabili nominali
Coefficiente di Contingenza 0 a 1 Non raggiunge 1 per tabelle >2×2 Tabelle quadrate

Casi Studio Reali

Studio 1: Fumo e Cancro ai Polmoni (Doll & Hill, 1950)

Uno dei primi studi che dimostrò l’associazione tra fumo e cancro ai polmoni utilizzò il test χ² per analizzare dati di 1,465 pazienti:

Cancro ai Polmoni No Cancro
Fumatori 1,350 1,350
Non Fumatori 7 62

Il χ² risultante fu estremamente significativo (p < 0.001), fornendo evidenza dell'associazione.

Studio 2: Sesso e Sopravvivenza sul Titanic

Analisi dei dati del Titanic mostrano una forte associazione tra sesso e sopravvivenza:

Sopravvissuto Non Sopravvissuto
Donne 316 109
Uomini 338 1,352

Il test χ² mostra χ² ≈ 300, df=1, p < 0.001, confermando che il sesso era fortemente associato alla probabilità di sopravvivenza.

Leave a Reply

Your email address will not be published. Required fields are marked *