Calcolatore Chi-Quadro dalla Distribuzione

Calcola il valore chi-quadro e visualizza la distribuzione teorica vs osservata con grafico interattivo. Inserisci i dati osservati e attesi per ottenere risultati precisi con interpretazione statistica.

Dati Osservati (separati da virgola)

Dati Attesi (separati da virgola)

Livello di Significatività (α)

Risultati del Test Chi-Quadro

0.00

Valore Chi-Quadro calcolato

Gradi di Libertà (df)

0.0000

P-Value

Interpretazione: Inserisci i dati per vedere i risultati

Guida Completa al Calcolo del Chi-Quadro dalla Distribuzione

Il test chi-quadro (χ²) è uno degli strumenti statistici più utilizzati per valutare se c’è una differenza significativa tra le frequenze osservate e quelle attese in una o più categorie. Questa guida approfondita ti condurrà attraverso:

I fondamenti teorici del test chi-quadro
Quando e perché utilizzare questo test
Passo-passo per il calcolo manuale
Interpretazione dei risultati con esempi pratici
Errori comuni da evitare
Applicazioni reali in diversi campi (biologia, marketing, scienze sociali)

1. Basi Teoriche del Test Chi-Quadro

Il test chi-quadro di Pearson, sviluppato da Karl Pearson nel 1900, si basa sul confronto tra:

Frequenze osservate (O): I dati effettivamente raccolti nella tua ricerca
Frequenze attese (E): I valori che ti aspetteresti se l’ipotesi nulla fosse vera

La statistica test χ² viene calcolata con la formula:

χ² = Σ [(Oᵢ – Eᵢ)² / Eᵢ]

Dove:

Oᵢ = frequenza osservata per la categoria i
Eᵢ = frequenza attesa per la categoria i
Σ = sommatoria per tutte le categorie

2. Quando Utilizzare il Test Chi-Quadro

Il test chi-quadro è appropriato quando:

Condizione	Descrizione	Esempio
Dati categorici	Le variabili sono divise in categorie discrete	Preferenze di marca (A, B, C)
Campioni indipendenti	Le osservazioni non si influenzano reciprocamente	Risposte di diversi intervistati
Frequenze sufficienti	Almeno l’80% delle celle attese hanno E ≥ 5	In un table 2×2, tutte le E ≥ 5
Conteggi, non percentuali	Dati grezzi, non proporzioni	45 sì, 55 no (non 45%)

Attenzione: Se più del 20% delle celle attese hanno valori < 5, considera:

Unire categorie adiacenti
Utilizzare il test esatto di Fisher per tabelle 2×2
Aumentare la dimensione del campione

3. Passaggi per il Calcolo Manuale

Segui questa procedura dettagliata per calcolare χ² senza software:

Organizza i dati: Crea una tabella con frequenze osservate (O) e attese (E).

Categoria	Osservato (O)	Atteso (E)
A	42	35
B	28	35

Calcola (O – E) per ogni categoria:
- A: 42 – 35 = 7
- B: 28 – 35 = -7
Eleva al quadrato le differenze:
- A: 7² = 49
- B: (-7)² = 49
Dividi per le frequenze attese:
- A: 49 / 35 ≈ 1.40
- B: 49 / 35 ≈ 1.40
Somma tutti i valori: 1.40 + 1.40 = 2.80
Questo è il tuo valore χ² calcolato.

4. Gradi di Libertà e Tabella Chi-Quadro

I gradi di libertà (df) determinano come interpretare il tuo valore χ²:

Formula per df:

df = (r – 1) × (c – 1)

Dove:

r = numero di righe
c = numero di colonne

Per una tabella di contingenza:

Tabella 2×2: df = 1
Tabella 3×2: df = 2
Tabella 3×3: df = 4

Per un test di bontà dell’adattamento:

df = k – 1 – p
k = numero di categorie
p = numero di parametri stimati

Valori Critici della Distribuzione Chi-Quadro (estratto)
df	α = 0.01	α = 0.05	α = 0.10
1	6.63	3.84	2.71
2	9.21	5.99	4.61
3	11.34	7.81	6.25
4	13.28	9.49	7.78
5	15.09	11.07	9.24

Fonte: Tabella chi-quadro completa

5. Interpretazione dei Risultati

Per interpretare correttamente il test chi-quadro:

Confronta χ² calcolato con χ² critico:
- Se χ² calcolato > χ² critico → Rifiuta H₀ (differenza significativa)
- Se χ² calcolato ≤ χ² critico → Non rifiutare H₀
Utilizza il p-value:
- p-value < α → Risultato significativo
- p-value ≥ α → Risultato non significativo
Formula le conclusioni:
Esempio con α = 0.05:
- “C’è una differenza significativa (χ²(2) = 8.45, p = 0.014) nelle preferenze di marca tra i gruppi”
- “Non c’è evidenza sufficienti per affermare una differenza (χ²(3) = 2.11, p = 0.549)”

6. Esempio Pratico Completo

Scenario: Un ricercatore vuole verificare se c’è associazione tra il genere (M/F) e la preferenza per tre tipi di film (Azione, Commedia, Drammatico).

Dati Osservati
	Azione	Commedia	Drammatico	Totale
Maschi	45	20	15	80
Femmine	25	30	25	80
Totale	70	50	40	160

Passo 1: Calcola le frequenze attese per ogni cella usando la formula:

E = (Totale Riga × Totale Colonna) / Totale Generale

Esempio per Maschi/Azione: (80 × 70) / 160 = 35

Dati Attesi
	Azione	Commedia	Drammatico
Maschi	35	25	20
Femmine	35	25	20

Passo 2: Applica la formula χ² a ogni cella:

Calcoli Intermedi
Categoria	O	E	(O-E)²/E
Maschi/Azione	45	35	(10)²/35 = 2.86
Maschi/Commedia	20	25	(-5)²/25 = 1.00
Maschi/Drammatico	15	20	(-5)²/20 = 1.25
Femmine/Azione	25	35	(-10)²/35 = 2.86
Femmine/Commedia	30	25	(5)²/25 = 1.00
Femmine/Drammatico	25	20	(5)²/20 = 1.25
χ² totale:			10.22

Passo 3: Determina i gradi di libertà:

df = (r – 1) × (c – 1) = (2 – 1) × (3 – 1) = 2

Passo 4: Confronta con il valore critico:

χ² calcolato = 10.22
χ² critico (df=2, α=0.05) = 5.99
10.22 > 5.99 → Rifiuta H₀

Conclusione: C’è una associazione significativa tra genere e preferenza cinematografica (χ²(2) = 10.22, p < 0.05).

7. Errori Comuni e Come Evitarli

Utilizzare percentuali invece di conteggi:
Il chi-quadro richiede frequenze assolute, non proporzioni. Converti sempre le percentuali in numeri reali.
Ignorare le celle con frequenze attese < 5:
Se più del 20% delle celle hanno E < 5:
- Unisci categorie adiacenti (es: “18-25” e “26-30” → “18-30”)
- Raccogli più dati per aumentare le frequenze
- Considera il test esatto di Fisher per tabelle 2×2
Applicare il test a dati continui:
Il chi-quadro è per dati categorici. Per variabili continue usa:
- Test t di Student (2 gruppi)
- ANOVA (3+ gruppi)
- Correlazione di Pearson
Interpretare erroneamente il p-value:
Un p-value basso (es: 0.03) non indica:
- La forza dell’associazione (usa V di Cramer)
- La direzione della relazione
- L’importanza pratica (può essere statisticamente significativo ma irrilevante)
Dimenticare di verificare le assunzioni:
Prima di applicare il test, assicurati che:
- Le osservazioni siano indipendenti
- Almeno l’80% delle celle abbiano E ≥ 5
- I dati siano conteggi, non misure

8. Applicazioni Pratiche del Test Chi-Quadro

Il test chi-quadro trova applicazione in numerosi campi:

Biologia e Medicina

Verificare l’associazione tra genotipi e malattie
Testare l’efficacia di trattamenti (tabelle di contingenza)
Analizzare la distribuzione di specie in diversi habitat

Marketing

Confrontare preferenze di prodotto tra gruppi demografici
Valutare l’efficacia di campagne pubblicitarie
Analizzare i pattern di acquisto per segmenti di clientela

Scienze Sociali

Studiare la relazione tra livello di istruzione e opinioni politiche
Analizzare le differenze di genere nelle scelte accademiche
Valutare l’impatto di interventi sociali

9. Alternative al Test Chi-Quadro

In alcune situazioni, altri test possono essere più appropriati:

Test	Quando Usarlo	Vantaggi
Test Esatto di Fisher	Tabelle 2×2 con celle < 5	Preciso per campioni piccoli
Test di McNemar	Dati appaiati (es: prima/dopo)	Ideale per studi longitudinali
Test di Cochran-Mantel-Haenszel	Dati stratificati	Controlla variabili confondenti
V di Cramer	Misurare la forza dell’associazione	Valori tra 0 (nessuna) e 1 (perfetta)

10. Risorse per Approfondire

Per una comprensione più avanzata del test chi-quadro:

Libri consigliati:
- “Statistical Methods for the Social Sciences” – Alan Agresti
- “Introductory Statistics” – OpenStax (gratuito)
- “The Analysis of Contingency Tables” – B.S. Everitt
Risorse online autorevoli:
Software per l’analisi:
- R (funzione chisq.test())
- Python (libreria scipy.stats.chi2_contingency)
- SPSS (Analyze → Descriptive Statistics → Crosstabs)
- Excel (funzione TEST.CHI)

Domande Frequenti sul Test Chi-Quadro

Posso usare il chi-quadro per confrontare medie?

No, il chi-quadro è per dati categorici. Per confrontare medie tra gruppi usa:

Test t di Student (2 gruppi)
ANOVA (3+ gruppi)

Cosa fare se ho più del 20% di celle con E < 5?

Opzioni disponibili:

Unisci categorie adiacenti (se teoricamente giustificato)
Usa il test esatto di Fisher (per tabelle 2×2)
Aumenta la dimensione del campione
Considera metodi di correzione come la correzione di Yates (controversa)

Come calcolare i gradi di libertà per un test di bontà dell’adattamento?

Formula: df = k – 1 – p

k = numero di categorie
p = numero di parametri stimati dai dati

Esempio: Testare se un dado è bilanciato (6 facce, nessun parametro stimato):

df = 6 – 1 – 0 = 5

Qual è la differenza tra chi-quadro di Pearson e il test G?

Entrambi confrontano frequenze osservate e attese, ma:

Caratteristica	Chi-Quadro	Test G
Base matematica	Differenze quadrate	Logaritmi (likelihood ratio)
Sensibilità a piccole frequenze	Meno robusto	Più robusto
Interpretazione	Differenze assolute	Rapporti di verosimiglianza

Per campioni grandi, i risultati sono simili. Il test G è generalmente preferito per dati con molte categorie.

Calcolare Chi Quadro Dalla Sua Distribuzione