Chapter 7 Module V

7.1 Análisis de correlación

En variables númericas podemos darnos una intuición de la relación con un scatterplot.

plot(mpg ~ hp, data=datos)

xyplot(mpg ~ hp, type=c("p","smooth"), pch=1,
   cex=0.6, lwd=3, data=datos)

En los comandos de ggplot, como todo lo de tidiverse, se trata de concatenar acciones. En este sentido, a partir del comando inicial podemos decirle que nos haga cualquier tipo de gráfica con el signo +.

library(ggplot2)

ggplot(datos, aes(x=hp, y=mpg)) + geom_point()

Para más información sobre visualización visitar: https://www.r-graph-gallery.com/

7.2 Comandos de correlación

Asimismo podemos calcular la correlacion de dos o más variables con el comando cor

cor(datos$mpg,datos$hp)
## [1] -0.776

Finalmente podemos obtener la matriz de correlación

cor(datos)
##         mpg    cyl   disp     hp    drat     wt    qsec     vs      am   gear
## mpg   1.000 -0.852 -0.848 -0.776  0.6812 -0.868  0.4187  0.664  0.5998  0.480
## cyl  -0.852  1.000  0.902  0.832 -0.6999  0.782 -0.5912 -0.811 -0.5226 -0.493
## disp -0.848  0.902  1.000  0.791 -0.7102  0.888 -0.4337 -0.710 -0.5912 -0.556
## hp   -0.776  0.832  0.791  1.000 -0.4488  0.659 -0.7082 -0.723 -0.2432 -0.126
## drat  0.681 -0.700 -0.710 -0.449  1.0000 -0.712  0.0912  0.440  0.7127  0.700
## wt   -0.868  0.782  0.888  0.659 -0.7124  1.000 -0.1747 -0.555 -0.6925 -0.583
## qsec  0.419 -0.591 -0.434 -0.708  0.0912 -0.175  1.0000  0.745 -0.2299 -0.213
## vs    0.664 -0.811 -0.710 -0.723  0.4403 -0.555  0.7445  1.000  0.1683  0.206
## am    0.600 -0.523 -0.591 -0.243  0.7127 -0.692 -0.2299  0.168  1.0000  0.794
## gear  0.480 -0.493 -0.556 -0.126  0.6996 -0.583 -0.2127  0.206  0.7941  1.000
## carb -0.551  0.527  0.395  0.750 -0.0908  0.428 -0.6562 -0.570  0.0575  0.274
##         carb
## mpg  -0.5509
## cyl   0.5270
## disp  0.3950
## hp    0.7498
## drat -0.0908
## wt    0.4276
## qsec -0.6562
## vs   -0.5696
## am    0.0575
## gear  0.2741
## carb  1.0000