Calcolatore Gradi di Libertà Chi-Quadro

Calcola i gradi di libertà per il test chi-quadro in base alla tua tabella di contingenza

Numero di righe (r)

Numero di colonne (c)

Tipo di test chi-quadro

Test di indipendenza

Test di bontà dell’adattamento

Parametri stimati (solo per bontà dell’adattamento) Inserisci 0 se non hai stimato parametri dalla distribuzione osservata

Risultati

Formula utilizzata:

Gradi di libertà (df):

Interpretazione:

Guida Completa al Calcolo dei Gradi di Libertà nel Test Chi-Quadro

Il test chi-quadro (χ²) è uno dei test statistici più utilizzati per valutare l’indipendenza tra variabili categoriche o la bontà dell’adattamento di una distribuzione osservata rispetto a una distribuzione attesa. Un elemento fondamentale di questo test è il calcolo dei gradi di libertà, che determinano la forma della distribuzione chi-quadro e influenzano direttamente il valore critico e il p-value.

Cosa sono i gradi di libertà?

I gradi di libertà (df, degrees of freedom) rappresentano il numero di valori che possono variare liberamente nella tabella di contingenza una volta fissati i totali marginali. In altre parole, sono il numero di informazioni indipendenti disponibili per stimare la variabilità dei dati.

Formula per il test di indipendenza

Per una tabella di contingenza con r righe e c colonne, i gradi di libertà si calcolano come:

df = (r – 1) × (c – 1)

Dove:

r = numero di righe (categorie per la prima variabile)
c = numero di colonne (categorie per la seconda variabile)

Formula per il test di bontà dell’adattamento

Per verificare se una distribuzione osservata si adatta a una distribuzione attesa, i gradi di libertà sono:

df = k – 1 – p

Dove:

k = numero di categorie
p = numero di parametri stimati dalla distribuzione osservata

Esempi pratici

Vediamo alcuni esempi concreti per comprendere meglio:

Scenario	Tipo di test	Dimensione tabella	Parametri stimati	Gradi di libertà
Indipendenza tra sesso (M/F) e preferenza politica (3 partiti)	Indipendenza	2×3	N/A	(2-1)×(3-1) = 2
Adattamento di un dado a 6 facce	Bontà dell’adattamento	1×6	0	6-1-0 = 5
Distribuzione normale con media e varianza stimate	Bontà dell’adattamento	1×10	2	10-1-2 = 7
Indipendenza tra livello di istruzione (4 livelli) e stato occupazionale (3 categorie)	Indipendenza	4×3	N/A	(4-1)×(3-1) = 6

Perché i gradi di libertà sono importanti?

Determinano la distribuzione chi-quadro: Ogni valore di df corrisponde a una specifica distribuzione chi-quadro, che viene utilizzata per calcolare il p-value.
Influenzano il valore critico: A parità di livello di significatività (α), un df maggiore comporta un valore critico più alto.
Affettano la potenza del test: Un numero eccessivo di categorie (e quindi di df) può ridurre la potenza statistica se il campione è piccolo.
Validano le assunzioni: Alcune regole empiriche (come l’attesa minima di 5 osservazioni per cella) dipendono dai df.

Errori comuni nel calcolo dei gradi di libertà

Errore	Conseguenza	Come evitarlo
Usare r×c invece di (r-1)×(c-1)	Sovrastima dei df → p-value errato	Ricordare che i totali marginali vincolano 1 df per riga e 1 per colonna
Dimenticare di sottrarre i parametri stimati nel test di bontà	Sottostima dei df → test troppo conservativo	Contare sempre quanti parametri sono stati stimati dai dati
Unire categorie dopo aver calcolato i df	df non corrispondono più alla tabella effettiva	Ricalcolare i df dopo ogni modifica alla tabella
Usare df sbagliati per tabelle con totali fissi	Test non valido (es. tabelle 2×2 con marginali fissi hanno df=1)	Verificare se i totali sono fissi per design sperimentale

Relazione tra gradi di libertà e dimensione del campione

Sebbene i gradi di libertà dipendano dalla struttura della tabella piuttosto che dalla numerosità campionaria, esiste una relazione indiretta:

Campioni piccoli: Con pochi dati, tabelle con molti df (es. 5×5) possono avere celle con attese <5, violando le assunzioni del test. In questi casi si usa il test esatto di Fisher.
Campioni grandi: Anche con molti df, un campione ampio garantisce attese sufficienti in tutte le celle, rendendo il test chi-quadro appropriato.
Regola del 5: Almeno l’80% delle celle dovrebbe avere attese ≥5, e nessuna cella dovrebbe avere attesa <1. Se questa regola non è soddisfatta, considerare di unire categorie o usare un test alternativo.

Applicazioni avanzate

Oltre ai casi standard, i gradi di libertà giocano un ruolo cruciale in:

Test chi-quadro per trend: Quando si analizza un trend lineare in tabelle RxC, df=1.
Test di McNemar: Per dati appaiati 2×2, df=1.
Analisi di tabelle multi-strato: In tabelle a più dimensioni (es. 2×3×4), il calcolo dei df diventa più complesso e spesso richiede modelli log-lineari.
Test di omogeneità: Simile al test di indipendenza, ma con df=(r-1)×(c-1) solo se i campioni sono indipendenti.

Limiti del test chi-quadro legati ai gradi di libertà

Alcune situazioni in cui i df influenzano l’applicabilità del test:

df = 0: Impossibile eseguire il test (es. tabella 1×2 o 2×1 con totali fissi).
df = 1: Il test diventa molto sensibile a piccole deviazioni, soprattutto con campioni grandi.
df > 30: La distribuzione chi-quadro si approssima a una normale, ma il test può diventare troppo conservativo.
Tabelle sparse: Con molti df e poche osservazioni, il test può dare risultati fuorvianti.

Domande frequenti

1. Cosa succede se calcolo male i gradi di libertà?

Un errore nei df porta a:

Selezionare il valore critico sbagliato dalle tavole chi-quadro
Calcolare un p-value incorretto
Possibili conclusioni errate sul rifiuto/accettazione dell’ipotesi nulla

Ad esempio, con df=4 invece di df=2, il valore critico per α=0.05 passa da 5.99 a 9.49, cambiando completamente l’esito del test.

2. Posso avere gradi di libertà non interi?

No, i df per il test chi-quadro sono sempre numeri interi. Se ottenete un valore decimale, c’è sicuramente un errore nel calcolo. L’unica eccezione sono alcuni test avanzati (come il test di portmanteau in serie temporali) che possono usare df non interi, ma non nel contesto classico del chi-quadro.

3. Come gestire tabelle con celle vuote o attese <1?

Le opzioni includono:

Unire categorie adiacenti: Riduce i df ma preserva l’interpretabilità.
Aumentare la dimensione campionaria: Se possibile, raccogliere più dati.
Usare il test esatto di Fisher: Non richiede approssimazioni ma è computazionalmente intensivo per tabelle grandi.
Applicare la correzione di Yates: Per tabelle 2×2, anche se controversa.

Ricordate che ogni modifica alla tabella originale richiede un ricalcolo dei df!

4. Qual è la relazione tra df e il p-value?

A parità di statistica chi-quadro:

Maggiori df → p-value più grande (test meno sensibile)
Minori df → p-value più piccolo (test più sensibile)

Questo perché con più df la distribuzione chi-quadro si “allarga”, rendendo meno probabili valori estremi.

5. Posso usare il test chi-quadro con df=1?

Sì, ma con cautela:

Vantaggio: Massima potenza statistica per rilevare differenze.
Rischio: Anche piccole deviazioni dalle attese possono risultare significative, soprattutto con campioni grandi.
Consiglio: Verificare sempre le attese per cella e considerare la significatività pratica oltre a quella statistica.

Fonti autorevoli:

NIST/SEMATECH e-Handbook of Statistical Methods – Chi-Square Test UC Berkeley – Chi-Square Tests (con spiegazione dettagliata sui df) CDC – Principles of Epidemiology: Chi-Square Analysis

Calcolo Gradi Di Libertà Chi-Quadro