Calcolatore dell’Indice di Determinazione Lineare (R²)
Inserisci i tuoi dati statistici per calcolare il coefficiente di determinazione lineare (R quadrato) che misura la bontà di adattamento di un modello di regressione lineare ai dati osservati.
Guida Completa al Calcolo dell’Indice di Determinazione Lineare (R²)
L’indice di determinazione lineare, comunemente indicato come R² (R quadrato), è una misura statistica che quantifica la proporzione della varianza nella variabile dipendente che è prevedibile dalla variabile indipendente in un modello di regressione lineare. Questo valore varia tra 0 e 1, dove:
- R² = 0: Il modello non spiega alcuna varianza della variabile dipendente
- R² = 1: Il modello spiega perfettamente tutta la varianza della variabile dipendente
- 0 < R² < 1: Il modello spiega una parte della varianza
Formula Matematica per il Calcolo di R²
La formula per calcolare R² è:
R² = 1 – (SSres / SStot)
Dove:
- SSres: Somma dei quadrati dei residui (differenze tra valori osservati e valori previsti dal modello)
- SStot: Somma totale dei quadrati (differenze tra valori osservati e media dei valori osservati)
Passaggi per il Calcolo Manuale di R²
- Calcolare la media dei valori osservati (ȳ): Sommare tutti i valori y e dividerli per il numero di osservazioni
- Calcolare SStot: Σ(yi – ȳ)² per ogni osservazione
- Eseguire la regressione lineare per ottenere i valori previsti (ŷi)
- Calcolare SSres: Σ(yi – ŷi)² per ogni osservazione
- Applicare la formula: R² = 1 – (SSres/SStot)
Interpretazione dei Valori di R²
| Intervallo di R² | Interpretazione | Esempio di Contesto |
|---|---|---|
| 0.90 – 1.00 | Adattamento eccellente | Leggi fisiche fondamentali (es. legge di gravità) |
| 0.70 – 0.89 | Adattamento buono | Modelli econometrici complessi |
| 0.50 – 0.69 | Adattamento moderato | Studi sociali con molte variabili |
| 0.30 – 0.49 | Adattamento debole | Comportamenti umani complessi |
| 0.00 – 0.29 | Nessun adattamento | Variabili non correlate |
Limitazioni di R²
Sebbene R² sia una metrica utile, presenta alcune limitazioni importanti:
- Non indica causalità: Un alto R² non implica che x causi y
- Sensibile ai valori anomali: Pochi punti estremi possono distorcere significativamente il valore
- Aumenta con più variabili: Aggiungere variabili indipendenti aumenta sempre R² (R² aggiustato corregge questo)
- Non valuta l’adeguatezza del modello: Un modello potrebbe avere un buon R² ma essere specificato in modo errato
R² vs R² Aggiustato
L’R² aggiustato è una versione modificata che tiene conto del numero di predittori nel modello:
R²aggiustato = 1 – [(1 – R²)(n – 1)/(n – k – 1)]
Dove:
- n: numero di osservazioni
- k: numero di variabili indipendenti
| Metrica | Formula | Vantaggi | Svantaggi |
|---|---|---|---|
| R² | 1 – (SSres/SStot) | Facile da interpretare Standard in regressione |
Aumenta con più variabili Non penalizza modelli complessi |
| R² aggiustato | 1 – [(1-R²)(n-1)/(n-k-1)] | Penalizza variabili non informative Migliore per confronto modelli |
Meno intuitivo Può essere negativo |
Applicazioni Pratiche di R²
Finanza
Nei modelli di valutazione degli asset (come CAPM), R² misura quanto la variabilità dei rendimenti di un titolo è spiegata dal mercato.
Medicina
Nello sviluppo di equazioni predittive per parametri fisiologici (es. VO₂ max), R² valuta l’accuratezza delle stime.
Marketing
Nei modelli di previsione delle vendite, R² aiuta a valutare l’efficacia delle variabili promozionali nel prevedere i ricavi.
Errori Comuni nell’Interpretazione di R²
- Confondere correlazione con causalità: Un R² alto non prova che x causi y, solo che esiste una relazione lineare
- Ignorare l’intervallo dei dati: R² può essere fuorviante se i dati sono raccolti in un intervallo ristretto
- Trascurare la significatività: Anche con R² alto, i coefficienti potrebbero non essere statisticamente significativi
- Usare R² per dati non lineari: R² misura solo la bontà di adattamento per relazioni lineari
Alternative a R² per Diversi Contesti
- RMSE (Root Mean Square Error): Misura l’errore medio in unità originali
- MAE (Mean Absolute Error): Errore medio assoluto, meno sensibile ai valori anomali
- AIC/BIC: Criteri di informazione per confronto modelli
- Pseudo-R²: Per modelli non lineari (es. regressione logistica)
Fonti Autorevoli
Per approfondimenti accademici sull’indice di determinazione:
- NIST/SEMATECH e-Handbook of Statistical Methods – Guida completa sulla regressione lineare e metriche di bontà di adattamento
- UC Berkeley Department of Statistics – Risorse accademiche su analisi di regressione
- U.S. Census Bureau – X-13ARIMA-SEATS – Software per analisi di serie temporali con metriche di adattamento
Domande Frequenti su R²
D: È possibile avere R² negativo?
R: No, R² standard varia tra 0 e 1. Tuttavia, R² aggiustato può essere negativo se il modello è peggiore di un modello con solo l’intercetta.
D: Qual è un buon valore di R²?
R: Dipende dal campo. In fisica >0.9 può essere atteso, mentre in scienze sociali 0.3-0.5 può essere considerato buono.
D: R² può essere maggiore di 1?
R: No, tranne in casi di errori di calcolo o quando il modello è stato adattato ai dati (overfitting).
D: Come si calcola R² in Excel?
R: Usa la funzione =RSQ(known_y’s, known_x’s) per regressione lineare semplice.