Calcolare B1 Retta Regressione Lineare Con R

Calcolatore B₁ Retta di Regressione Lineare con R

Inserisci i tuoi dati per calcolare il coefficiente angolare (b₁) e visualizzare la retta di regressione con correlazione (r).

Risultati

Coefficiente angolare (b₁):
Intercetta (b₀):
Coefficiente di correlazione (r):
R-quadro (R²):
Equazione della retta:

Guida Completa: Come Calcolare b₁ nella Retta di Regressione Lineare con r

La regressione lineare è uno degli strumenti statistici più potenti per analizzare la relazione tra due variabili continue. In questa guida approfondita, esploreremo come calcolare il coefficiente angolare (b₁) della retta di regressione, interpretare il coefficiente di correlazione (r) e valutare la bontà del modello.

1. Fondamenti della Regressione Lineare Semplice

La regressione lineare semplice modella la relazione tra:

  • Variabile indipendente (X): la variabile predittiva
  • Variabile dipendente (Y): la variabile di outcome

L’equazione della retta di regressione è:

Ŷ = b₀ + b₁X

Dove:

  • Ŷ = valore predetto di Y
  • b₀ = intercetta (valore di Y quando X=0)
  • b₁ = coefficiente angolare (pendenza della retta)
  • X = valore della variabile indipendente

2. Formula per il Calcolo di b₁

Il coefficiente angolare b₁ viene calcolato con la formula:

b₁ = Σ[(Xᵢ – X̄)(Yᵢ – Ȳ)] / Σ(Xᵢ – X̄)²

Dove:

  • Xᵢ = valori individuali di X
  • Yᵢ = valori individuali di Y
  • X̄ = media di X
  • Ȳ = media di Y

3. Passaggi per il Calcolo Manuale

  1. Calcolare le medie: Trova X̄ e Ȳ
  2. Calcolare le devianze: (Xᵢ – X̄) e (Yᵢ – Ȳ) per ogni coppia
  3. Prodotti delle devianze: Moltiplica (Xᵢ – X̄) × (Yᵢ – Ȳ)
  4. Somma dei prodotti: Σ[(Xᵢ – X̄)(Yᵢ – Ȳ)]
  5. Somma quadrati X: Σ(Xᵢ – X̄)²
  6. Calcolare b₁: Dividi la somma dei prodotti per la somma dei quadrati

4. Interpretazione del Coefficiente di Correlazione (r)

Il coefficiente di correlazione lineare di Pearson (r) misura la forza e la direzione della relazione lineare tra X e Y. Il suo valore varia tra -1 e +1:

Valore di r Interpretazione Forza della Relazione
0.9 ≤ |r| ≤ 1.0 Correlazione molto forte Fortissima
0.7 ≤ |r| < 0.9 Correlazione forte Forte
0.5 ≤ |r| < 0.7 Correlazione moderata Moderata
0.3 ≤ |r| < 0.5 Correlazione debole Debole
0 ≤ |r| < 0.3 Correlazione trascurabile Molto debole/assente

Il segno di r indica la direzione:

  • r > 0: Relazione lineare positiva (all’aumentare di X aumenta Y)
  • r < 0: Relazione lineare negativa (all’aumentare di X diminuisce Y)
  • r = 0: Nessuna relazione lineare

5. Relazione tra b₁ e r

Esiste una relazione matematica diretta tra il coefficiente angolare (b₁) e il coefficiente di correlazione (r):

b₁ = r × (sₐ / sₓ)

Dove:

  • sₐ = devianza standard di Y
  • sₓ = devianza standard di X

6. Valutazione della Bontà del Modello: R²

Il coefficiente di determinazione (R²) indica la proporzione di varianza in Y spiegata dal modello:

R² = r² = (1 – SSE/SST)

Dove:

  • SSE = Somma degli errori al quadrato
  • SST = Somma totale dei quadrati
Valore R² Interpretazione Esempio Pratico
0.9 ≤ R² ≤ 1.0 Modello eccellente Previsto il 90-100% della varianza
0.7 ≤ R² < 0.9 Modello buono Previsto il 70-90% della varianza
0.5 ≤ R² < 0.7 Modello moderato Previsto il 50-70% della varianza
0.2 ≤ R² < 0.5 Modello debole Previsto il 20-50% della varianza
0 ≤ R² < 0.2 Modello non significativo Previsto meno del 20% della varianza

7. Applicazioni Pratiche della Regressione Lineare

  • Economia: Previsione della domanda in base al reddito
  • Medicina: Relazione tra dose di farmaco ed effetto terapeutico
  • Marketing: Impatto della spesa pubblicitaria sulle vendite
  • Scienze Sociali: Correlazione tra livello di istruzione e reddito
  • Ingegneria: Relazione tra temperatura e resistenza dei materiali

8. Errori Comuni da Evitare

  1. Estrapolazione: Usare il modello al di fuori dell’intervallo dei dati originali
  2. Causalità: Confondere correlazione con causalità (r ≠ causazione)
  3. Outliers: Ignorare valori anomali che possono distorcere la retta
  4. Multicollinearità: Includere variabili indipendenti correlate tra loro
  5. Eteroschedasticità: Varianza non costante degli errori

9. Software e Strumenti per la Regressione

Oltre al nostro calcolatore, ecco alcuni strumenti professionali:

  • R: lm(y ~ x, data)
  • Python: scipy.stats.linregress() o sklearn.linear_model.LinearRegression()
  • Excel: Funzione =REGR.LIN() o Grafico di dispersione con linea di tendenza
  • SPSS: Analisi → Regressione → Lineare
  • Minitab: Stat → Regression → Regression

10. Risorse Accademiche Approfondite

Per approfondire la teoria statistica dietro la regressione lineare:

Leave a Reply

Your email address will not be published. Required fields are marked *