Calcolatore dell’Indice di Determinazione Lineare (R²)

Inserisci i tuoi dati statistici per calcolare il coefficiente di determinazione lineare (R quadrato) che misura la bontà di adattamento di un modello di regressione lineare ai dati osservati.

Inserisci i punti dati (coppie x,y) Formato: ogni riga deve contenere una coppia x,y separata da virgola

Cifre decimali

Guida Completa al Calcolo dell’Indice di Determinazione Lineare (R²)

L’indice di determinazione lineare, comunemente indicato come R² (R quadrato), è una misura statistica che quantifica la proporzione della varianza nella variabile dipendente che è prevedibile dalla variabile indipendente in un modello di regressione lineare. Questo valore varia tra 0 e 1, dove:

R² = 0: Il modello non spiega alcuna varianza della variabile dipendente
R² = 1: Il modello spiega perfettamente tutta la varianza della variabile dipendente
0 < R² < 1: Il modello spiega una parte della varianza

Formula Matematica per il Calcolo di R²

La formula per calcolare R² è:

R² = 1 – (SS_res / SS_tot)

Dove:

SS_res: Somma dei quadrati dei residui (differenze tra valori osservati e valori previsti dal modello)
SS_tot: Somma totale dei quadrati (differenze tra valori osservati e media dei valori osservati)

Passaggi per il Calcolo Manuale di R²

Calcolare la media dei valori osservati (ȳ): Sommare tutti i valori y e dividerli per il numero di osservazioni
Calcolare SS_tot: Σ(y_i – ȳ)² per ogni osservazione
Eseguire la regressione lineare per ottenere i valori previsti (ŷ_i)
Calcolare SS_res: Σ(y_i – ŷ_i)² per ogni osservazione
Applicare la formula: R² = 1 – (SS_res/SS_tot)

Interpretazione dei Valori di R²

Intervallo di R²	Interpretazione	Esempio di Contesto
0.90 – 1.00	Adattamento eccellente	Leggi fisiche fondamentali (es. legge di gravità)
0.70 – 0.89	Adattamento buono	Modelli econometrici complessi
0.50 – 0.69	Adattamento moderato	Studi sociali con molte variabili
0.30 – 0.49	Adattamento debole	Comportamenti umani complessi
0.00 – 0.29	Nessun adattamento	Variabili non correlate

Limitazioni di R²

Sebbene R² sia una metrica utile, presenta alcune limitazioni importanti:

Non indica causalità: Un alto R² non implica che x causi y
Sensibile ai valori anomali: Pochi punti estremi possono distorcere significativamente il valore
Aumenta con più variabili: Aggiungere variabili indipendenti aumenta sempre R² (R² aggiustato corregge questo)
Non valuta l’adeguatezza del modello: Un modello potrebbe avere un buon R² ma essere specificato in modo errato

R² vs R² Aggiustato

L’R² aggiustato è una versione modificata che tiene conto del numero di predittori nel modello:

R²_aggiustato = 1 – [(1 – R²)(n – 1)/(n – k – 1)]

Dove:

n: numero di osservazioni
k: numero di variabili indipendenti

Metrica	Formula	Vantaggi	Svantaggi
R²	1 – (SS_res/SS_tot)	Facile da interpretare Standard in regressione	Aumenta con più variabili Non penalizza modelli complessi
R² aggiustato	1 – [(1-R²)(n-1)/(n-k-1)]	Penalizza variabili non informative Migliore per confronto modelli	Meno intuitivo Può essere negativo

Applicazioni Pratiche di R²

Finanza

Nei modelli di valutazione degli asset (come CAPM), R² misura quanto la variabilità dei rendimenti di un titolo è spiegata dal mercato.

Medicina

Nello sviluppo di equazioni predittive per parametri fisiologici (es. VO₂ max), R² valuta l’accuratezza delle stime.

Marketing

Nei modelli di previsione delle vendite, R² aiuta a valutare l’efficacia delle variabili promozionali nel prevedere i ricavi.

Errori Comuni nell’Interpretazione di R²

Confondere correlazione con causalità: Un R² alto non prova che x causi y, solo che esiste una relazione lineare
Ignorare l’intervallo dei dati: R² può essere fuorviante se i dati sono raccolti in un intervallo ristretto
Trascurare la significatività: Anche con R² alto, i coefficienti potrebbero non essere statisticamente significativi
Usare R² per dati non lineari: R² misura solo la bontà di adattamento per relazioni lineari

Alternative a R² per Diversi Contesti

RMSE (Root Mean Square Error): Misura l’errore medio in unità originali
MAE (Mean Absolute Error): Errore medio assoluto, meno sensibile ai valori anomali
AIC/BIC: Criteri di informazione per confronto modelli
Pseudo-R²: Per modelli non lineari (es. regressione logistica)

Fonti Autorevoli

Per approfondimenti accademici sull’indice di determinazione:

NIST/SEMATECH e-Handbook of Statistical Methods – Guida completa sulla regressione lineare e metriche di bontà di adattamento
UC Berkeley Department of Statistics – Risorse accademiche su analisi di regressione
U.S. Census Bureau – X-13ARIMA-SEATS – Software per analisi di serie temporali con metriche di adattamento

Domande Frequenti su R²

D: È possibile avere R² negativo?

R: No, R² standard varia tra 0 e 1. Tuttavia, R² aggiustato può essere negativo se il modello è peggiore di un modello con solo l’intercetta.

D: Qual è un buon valore di R²?

R: Dipende dal campo. In fisica >0.9 può essere atteso, mentre in scienze sociali 0.3-0.5 può essere considerato buono.

D: R² può essere maggiore di 1?

R: No, tranne in casi di errori di calcolo o quando il modello è stato adattato ai dati (overfitting).

D: Come si calcola R² in Excel?

R: Usa la funzione =RSQ(known_y’s, known_x’s) per regressione lineare semplice.

C Si Calcoli L’Indice Di Determinazione Lineare