C Si Calcoli L’Indice Di Determinazione Lineare

Calcolatore dell’Indice di Determinazione Lineare (R²)

Inserisci i tuoi dati statistici per calcolare il coefficiente di determinazione lineare (R quadrato) che misura la bontà di adattamento di un modello di regressione lineare ai dati osservati.

Formato: ogni riga deve contenere una coppia x,y separata da virgola

Guida Completa al Calcolo dell’Indice di Determinazione Lineare (R²)

L’indice di determinazione lineare, comunemente indicato come R² (R quadrato), è una misura statistica che quantifica la proporzione della varianza nella variabile dipendente che è prevedibile dalla variabile indipendente in un modello di regressione lineare. Questo valore varia tra 0 e 1, dove:

  • R² = 0: Il modello non spiega alcuna varianza della variabile dipendente
  • R² = 1: Il modello spiega perfettamente tutta la varianza della variabile dipendente
  • 0 < R² < 1: Il modello spiega una parte della varianza

Formula Matematica per il Calcolo di R²

La formula per calcolare R² è:

R² = 1 – (SSres / SStot)

Dove:

  • SSres: Somma dei quadrati dei residui (differenze tra valori osservati e valori previsti dal modello)
  • SStot: Somma totale dei quadrati (differenze tra valori osservati e media dei valori osservati)

Passaggi per il Calcolo Manuale di R²

  1. Calcolare la media dei valori osservati (ȳ): Sommare tutti i valori y e dividerli per il numero di osservazioni
  2. Calcolare SStot: Σ(yi – ȳ)² per ogni osservazione
  3. Eseguire la regressione lineare per ottenere i valori previsti (ŷi)
  4. Calcolare SSres: Σ(yi – ŷi)² per ogni osservazione
  5. Applicare la formula: R² = 1 – (SSres/SStot)

Interpretazione dei Valori di R²

Intervallo di R² Interpretazione Esempio di Contesto
0.90 – 1.00 Adattamento eccellente Leggi fisiche fondamentali (es. legge di gravità)
0.70 – 0.89 Adattamento buono Modelli econometrici complessi
0.50 – 0.69 Adattamento moderato Studi sociali con molte variabili
0.30 – 0.49 Adattamento debole Comportamenti umani complessi
0.00 – 0.29 Nessun adattamento Variabili non correlate

Limitazioni di R²

Sebbene R² sia una metrica utile, presenta alcune limitazioni importanti:

  • Non indica causalità: Un alto R² non implica che x causi y
  • Sensibile ai valori anomali: Pochi punti estremi possono distorcere significativamente il valore
  • Aumenta con più variabili: Aggiungere variabili indipendenti aumenta sempre R² (R² aggiustato corregge questo)
  • Non valuta l’adeguatezza del modello: Un modello potrebbe avere un buon R² ma essere specificato in modo errato

R² vs R² Aggiustato

L’R² aggiustato è una versione modificata che tiene conto del numero di predittori nel modello:

aggiustato = 1 – [(1 – R²)(n – 1)/(n – k – 1)]

Dove:

  • n: numero di osservazioni
  • k: numero di variabili indipendenti
Metrica Formula Vantaggi Svantaggi
1 – (SSres/SStot) Facile da interpretare
Standard in regressione
Aumenta con più variabili
Non penalizza modelli complessi
R² aggiustato 1 – [(1-R²)(n-1)/(n-k-1)] Penalizza variabili non informative
Migliore per confronto modelli
Meno intuitivo
Può essere negativo

Applicazioni Pratiche di R²

Finanza

Nei modelli di valutazione degli asset (come CAPM), R² misura quanto la variabilità dei rendimenti di un titolo è spiegata dal mercato.

Medicina

Nello sviluppo di equazioni predittive per parametri fisiologici (es. VO₂ max), R² valuta l’accuratezza delle stime.

Marketing

Nei modelli di previsione delle vendite, R² aiuta a valutare l’efficacia delle variabili promozionali nel prevedere i ricavi.

Errori Comuni nell’Interpretazione di R²

  1. Confondere correlazione con causalità: Un R² alto non prova che x causi y, solo che esiste una relazione lineare
  2. Ignorare l’intervallo dei dati: R² può essere fuorviante se i dati sono raccolti in un intervallo ristretto
  3. Trascurare la significatività: Anche con R² alto, i coefficienti potrebbero non essere statisticamente significativi
  4. Usare R² per dati non lineari: R² misura solo la bontà di adattamento per relazioni lineari

Alternative a R² per Diversi Contesti

  • RMSE (Root Mean Square Error): Misura l’errore medio in unità originali
  • MAE (Mean Absolute Error): Errore medio assoluto, meno sensibile ai valori anomali
  • AIC/BIC: Criteri di informazione per confronto modelli
  • Pseudo-R²: Per modelli non lineari (es. regressione logistica)

Fonti Autorevoli

Per approfondimenti accademici sull’indice di determinazione:

Domande Frequenti su R²

D: È possibile avere R² negativo?

R: No, R² standard varia tra 0 e 1. Tuttavia, R² aggiustato può essere negativo se il modello è peggiore di un modello con solo l’intercetta.

D: Qual è un buon valore di R²?

R: Dipende dal campo. In fisica >0.9 può essere atteso, mentre in scienze sociali 0.3-0.5 può essere considerato buono.

D: R² può essere maggiore di 1?

R: No, tranne in casi di errori di calcolo o quando il modello è stato adattato ai dati (overfitting).

D: Come si calcola R² in Excel?

R: Usa la funzione =RSQ(known_y’s, known_x’s) per regressione lineare semplice.

Leave a Reply

Your email address will not be published. Required fields are marked *