Chapter 13 Module XII

13.1 Inferences for Correlation and Simple Linear Regression

Nuevamente retomamos el tema de regresión lineal. Recordamos el comando lm para estimar una regresión e imprimimos los coeficientes.

model <- lm(mpg ~ hp+cyl, data=datos)
coef(model)
## (Intercept)          hp         cyl 
##     36.9083     -0.0191     -2.2647

Como ya habíamos visto, podemos realizar resumenes estadísticos con el comando summary y el comando summary de mosaic

summary(model)
## 
## Call:
## lm(formula = mpg ~ hp + cyl, data = datos)
## 
## Residuals:
##    Min     1Q Median     3Q    Max 
## -4.495 -2.490 -0.183  1.978  7.293 
## 
## Coefficients:
##             Estimate Std. Error t value             Pr(>|t|)    
## (Intercept)  36.9083     2.1908   16.85 < 0.0000000000000002 ***
## hp           -0.0191     0.0150   -1.27              0.21253    
## cyl          -2.2647     0.5759   -3.93              0.00048 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.17 on 29 degrees of freedom
## Multiple R-squared:  0.741,  Adjusted R-squared:  0.723 
## F-statistic: 41.4 on 2 and 29 DF,  p-value: 0.00000000316
msummary(model)
##             Estimate Std. Error t value             Pr(>|t|)    
## (Intercept)  36.9083     2.1908   16.85 < 0.0000000000000002 ***
## hp           -0.0191     0.0150   -1.27              0.21253    
## cyl          -2.2647     0.5759   -3.93              0.00048 ***
## 
## Residual standard error: 3.17 on 29 degrees of freedom
## Multiple R-squared:  0.741,  Adjusted R-squared:  0.723 
## F-statistic: 41.4 on 2 and 29 DF,  p-value: 0.00000000316
confint(model)
##               2.5 %  97.5 %
## (Intercept) 32.4276 41.3890
## hp          -0.0498  0.0116
## cyl         -3.4425 -1.0869
rsquared(model)
## [1] 0.741

En estos casos notemos dos partes: en primer lugar, la significancia individual de cada variable que evalua simplemente si con el intervalo de confianza el valor del parámetro está alrededor o no del cero; en segundo lugar, el valor p y los estadísticos F que se refieren a la prueba de hipótesis sobre significancia del modelo, es decir, se evalua a la combinación de todas las variables.

\[H_o: \beta_i=0\]

\[H_a: \beta_i \neq 0\]