Calcolatore d di Cohen in R
Risultati
Guida Completa al Calcolo del d di Cohen in R
Il d di Cohen è una misura dell’effetto standardizzato ampiamente utilizzata in statistica per quantificare la differenza tra due medie. A differenza dei test di significatività (come il t-test), che indicano solo se esiste una differenza statistica, il d di Cohen fornisce una stima della dimensione dell’effetto, permettendo di valutare l’importanza pratica dei risultati.
In questa guida, esploreremo:
- La formula matematica del d di Cohen e la sua interpretazione
- Come calcolarlo manualmente e con R
- Linee guida per interpretare i valori ottenuti
- Esempi pratici con dataset reali
- Errori comuni da evitare
1. Formula del d di Cohen
La formula base per il d di Cohen tra due gruppi è:
d = (M₁ – M₂) / scombinata
Dove:
- M₁ e M₂: medie dei due gruppi
- scombinata: devianza standard combinata, calcolata come:
scombinata = √[(s₁²(n₁-1) + s₂²(n₂-1)) / (n₁ + n₂ - 2)]
doves₁es₂sono le devianze standard dei gruppi,n₁en₂le dimensioni campionarie.
2. Interpretazione del d di Cohen
Jacob Cohen (1988) ha proposto le seguenti linee guida per interpretare la grandezza dell’effetto:
| Valore di d | Interpretazione | Descrizione |
|---|---|---|
| 0.00 – 0.19 | Trascurabile | Differenza minima o assente |
| 0.20 – 0.49 | Piccolo | Differenza modesta, spesso difficile da rilevare ad occhio nudo |
| 0.50 – 0.79 | Medio | Differenza visibile e potenzialmente significativa |
| ≥ 0.80 | Grande | Differenza sostanziale, chiaramente osservabile |
Nota: Queste soglie sono indicative. L’interpretazione dovrebbe sempre considerare il contesto specifico della ricerca.
3. Calcolo del d di Cohen in R
In R, il d di Cohen può essere calcolato utilizzando diverse librerie. Le più comuni sono:
- Pacco
effsize: Fornisce la funzionecohen.d()per calcoli diretti. - Pacco
lsr: Include funzioni per l’analisi della dimensione dell’effetto. - Calcolo manuale: Utilizzando le formule base con operatori R.
Esempio con effsize
# Installazione (se necessario)
install.packages("effsize")
# Caricamento della libreria
library(effsize)
# Dati di esempio: punteggi di due gruppi
gruppo1 <- c(23, 25, 28, 22, 30)
gruppo2 <- c(18, 20, 19, 17, 22)
# Calcolo del d di Cohen
cohen.d(gruppo1, gruppo2)
Output:
Cohen's d
d estimate: 1.534592 (large)
95 percent confidence interval:
lower upper
0.4023032 2.6668808
Calcolo Manuale in R
# Funzione personalizzata per il d di Cohen
cohen_d <- function(gruppo1, gruppo2) {
n1 <- length(gruppo1)
n2 <- length(gruppo2)
m1 <- mean(gruppo1)
m2 <- mean(gruppo2)
var1 <- var(gruppo1)
var2 <- var(gruppo2)
# Devianza standard combinata
pooled_sd <- sqrt(((n1 - 1) * var1 + (n2 - 1) * var2) / (n1 + n2 - 2))
# d di Cohen
d <- (m1 - m2) / pooled_sd
return(d)
}
# Utilizzo
cohen_d(gruppo1, gruppo2)
4. Confronto con Altri Indicatori di Dimensione dell’Effetto
Il d di Cohen non è l’unico indicatore di dimensione dell’effetto. Altri comuni includono:
| Indicatore | Uso Tipico | Interpretazione | Vantaggi |
|---|---|---|---|
| d di Cohen | Differenze tra medie (t-test) | 0.2=piccolo, 0.5=medio, 0.8=grande | Intuitivo, ampiamente utilizzato |
| η² (Eta quadrato) | ANOVA | 0.01=piccolo, 0.06=medio, 0.14=grande | Misura la proporzione di varianza spiegata |
| r (Correlazione) | Relazioni lineari | 0.1=debole, 0.3=modesto, 0.5=forte | Standardizzato tra -1 e 1 |
| Odds Ratio | Dati categorici (logistic regression) | 1=nessun effetto, >1 o <1 indica effetto | Utile per studi epidemiologici |
5. Errori Comuni nel Calcolo del d di Cohen
- Usare la devianza standard sbagliata: È cruciale utilizzare la devianza standard combinata (pooled), non quella di uno solo dei gruppi.
- Ignorare la direzione: Il segno di d indica la direzione (M₁ > M₂ se positivo). Non considerarlo può portare a interpretazioni errate.
- Confondere d con altre misure: Il d di Cohen non è uguale al t di Student o al p-value. Misura l’effetto, non la significatività.
- Interpretazione rigida: Le soglie di Cohen (0.2, 0.5, 0.8) sono generiche. In alcuni campi (es. psicologia clinica), anche d=0.3 può essere rilevante.
- Trascurare gli intervalli di confidenza: Sempre riportare gli IC al 95% per d, ad esempio: “d = 0.65 [IC 95%: 0.30, 1.00]”.
6. Applicazioni Pratiche del d di Cohen
Il d di Cohen è utilizzato in numerosi contesti:
- Ricerca medica: Per valutare l’efficacia di un farmaco vs placebo (es. d=0.5 per un antidepressivo).
- Psicologia: Confronto tra gruppi sperimentali e di controllo in studi su terapie (es. d=0.8 per la terapia cognitivo-comportamentale vs lista d’attesa).
- Educazione: Valutazione dell’impatto di nuovi metodi didattici (es. d=0.3 per l’apprendimento basato su problemi vs lezioni frontali).
- Marketing: Analisi delle differenze tra gruppi demografici nelle preferenze di prodotto (es. d=0.4 tra uomini e donne nella propensione all’acquisto online).
7. Limiti del d di Cohen
Nonostante la sua utilità, il d di Cohen presenta alcuni limiti:
- Sensibilità alla variabilità: Se la devianza standard è molto alta, d sarà piccolo anche con differenze assolute rilevanti.
- Assunzione di normalità: Il d di Cohen assume distribuzioni normali. Per dati non normali, considerare alternative come il r di biserial-point.
- Dipendenza dal campionamento: In campioni piccoli, d può essere instabile. Usare sempre intervalli di confidenza.
- Non lineari: Non cattura relazioni non lineari tra variabili.
8. Alternative al d di Cohen
In alcuni casi, altre misure possono essere più appropriate:
- Hedges’ g: Una versione corretta del d di Cohen per campioni piccoli (n < 20), che applica una correzione per il bias.
- Glass’ Δ: Utilizza la devianza standard del gruppo di controllo, utile quando le varianze dei gruppi differiscono notevolmente.
- Cliff’s δ: Misura non parametrica per dati ordinali o non normali.
- η² parziale: Per disegni ANOVA con più di due gruppi.
9. Esempio Reale: Studio sull’Efficacia di un Programma di Allenamento
Supponiamo di voler valutare l’effetto di un programma di allenamento di 8 settimane sulla forza muscolare. Abbiamo due gruppi:
- Gruppo sperimentale (n=30): M=120 kg, SD=15
- Gruppo controllo (n=30): M=100 kg, SD=14
Calcolo:
- Differenza tra medie: 120 – 100 = 20 kg
- Devianza standard combinata:
scombinata = √[(15²(29) + 14²(29)) / (30 + 30 - 2)] ≈ 14.5 - d di Cohen: 20 / 14.5 ≈ 1.38 (effetto molto grande)
Interpretazione: Il programma di allenamento ha un effetto sostanziale sulla forza muscolare, con una dimensione dell’effetto classificabile come “molto grande” secondo Cohen.
10. Come Reportare il d di Cohen in un Articolo Scientifico
Quando si riporta il d di Cohen in una pubblicazione, seguire queste linee guida:
- Sempre includere:
- Il valore di d (arrotondato a 2 decimali)
- L’intervallo di confidenza al 95%
- La direzione (es. “favorevole al gruppo sperimentale”)
- Esempio di reporting:
“Il gruppo sperimentale ha mostrato una forza muscolare significativamente maggiore rispetto al gruppo di controllo (d = 1.38 [IC 95%: 0.92, 1.84], favorevole all’allenamento).”
- Includere sempre anche le statistiche descrittive (medie, DS) e i risultati dei test di significatività (es. t-test).
Risorse Autorevoli
Per approfondire il calcolo e l’interpretazione del d di Cohen, consultare le seguenti risorse:
- Cohen, J. (1988). Statistical Power Analysis for the Behavioral Sciences (2nd ed.). Routledge. – Testo fondamentale sulla dimensione dell’effetto.
- Laerd Statistics: Effect Size Guide – Guida pratica con esempi.
- Documentazione del pacchetto R
effsize– Manuali e funzioni per R.
Domande Frequenti
D: Qual è la differenza tra d di Cohen e t di Student?
R: Il t di Student valuta se esiste una differenza statisticamente significativa tra due medie, mentre il d di Cohen misura la grandezza di quella differenza, indipendentemente dalla significatività. Un t-test può dare p < 0.05 (significativo) anche con un d piccolo (effetto trascurabile), soprattutto in campioni grandi.
D: Posso usare il d di Cohen per più di due gruppi?
R: No. Per confronti tra più di due gruppi, utilizzare misure come η² (eta quadrato) o ω² (omega quadrato) nell’ANOVA. Il d di Cohen è specifico per confronti a coppie.
D: Come calcolo il d di Cohen per dati appaiati?
R: Per disegni within-subject (misure ripetute), usa la formula per dati appaiati:
d = Mdiff / SDdiff
Dove Mdiff è la media delle differenze e SDdiff è la devianza standard delle differenze. In R, puoi usare:
# Dati appaiati
pre <- c(10, 12, 15, 14, 18)
post <- c(12, 14, 18, 16, 20)
# Calcolo manuale
diff <- post - pre
mean(diff) / sd(diff) # d per dati appaiati
D: Il d di Cohen è influenzato dalla dimensione campionaria?
R: No, il d di Cohen è una misura standardizzata e non dipende direttamente dalla dimensione campionaria. Tuttavia, in campioni molto piccoli (n < 20), la stima di d può essere instabile. In questi casi, è preferibile usare Hedges’ g, che applica una correzione per il bias.