Chapter 13 Module XII
13.1 Inferences for Correlation and Simple Linear Regression
Nuevamente retomamos el tema de regresión lineal. Recordamos el comando lm para estimar una regresión e imprimimos los coeficientes.
<- lm(mpg ~ hp+cyl, data=datos)
model coef(model)
## (Intercept) hp cyl
## 36.9083 -0.0191 -2.2647
Como ya habíamos visto, podemos realizar resumenes estadísticos con el comando summary y el comando summary de mosaic
summary(model)
##
## Call:
## lm(formula = mpg ~ hp + cyl, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -4.495 -2.490 -0.183 1.978 7.293
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 36.9083 2.1908 16.85 < 0.0000000000000002 ***
## hp -0.0191 0.0150 -1.27 0.21253
## cyl -2.2647 0.5759 -3.93 0.00048 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.17 on 29 degrees of freedom
## Multiple R-squared: 0.741, Adjusted R-squared: 0.723
## F-statistic: 41.4 on 2 and 29 DF, p-value: 0.00000000316
msummary(model)
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 36.9083 2.1908 16.85 < 0.0000000000000002 ***
## hp -0.0191 0.0150 -1.27 0.21253
## cyl -2.2647 0.5759 -3.93 0.00048 ***
##
## Residual standard error: 3.17 on 29 degrees of freedom
## Multiple R-squared: 0.741, Adjusted R-squared: 0.723
## F-statistic: 41.4 on 2 and 29 DF, p-value: 0.00000000316
confint(model)
## 2.5 % 97.5 %
## (Intercept) 32.4276 41.3890
## hp -0.0498 0.0116
## cyl -3.4425 -1.0869
rsquared(model)
## [1] 0.741
En estos casos notemos dos partes: en primer lugar, la significancia individual de cada variable que evalua simplemente si con el intervalo de confianza el valor del parámetro está alrededor o no del cero; en segundo lugar, el valor p y los estadísticos F que se refieren a la prueba de hipótesis sobre significancia del modelo, es decir, se evalua a la combinación de todas las variables.
\[H_o: \beta_i=0\]
\[H_a: \beta_i \neq 0\]