Chapter 7 Module V
7.1 Análisis de correlación
En variables númericas podemos darnos una intuición de la relación con un scatterplot.
plot(mpg ~ hp, data=datos)
xyplot(mpg ~ hp, type=c("p","smooth"), pch=1,
cex=0.6, lwd=3, data=datos)
En los comandos de ggplot, como todo lo de tidiverse, se trata de concatenar acciones. En este sentido, a partir del comando inicial podemos decirle que nos haga cualquier tipo de gráfica con el signo +.
library(ggplot2)
ggplot(datos, aes(x=hp, y=mpg)) + geom_point()
Para más información sobre visualización visitar: https://www.r-graph-gallery.com/
7.2 Comandos de correlación
Asimismo podemos calcular la correlacion de dos o más variables con el comando cor
cor(datos$mpg,datos$hp)
## [1] -0.776
Finalmente podemos obtener la matriz de correlación
cor(datos)
## mpg cyl disp hp drat wt qsec vs am gear
## mpg 1.000 -0.852 -0.848 -0.776 0.6812 -0.868 0.4187 0.664 0.5998 0.480
## cyl -0.852 1.000 0.902 0.832 -0.6999 0.782 -0.5912 -0.811 -0.5226 -0.493
## disp -0.848 0.902 1.000 0.791 -0.7102 0.888 -0.4337 -0.710 -0.5912 -0.556
## hp -0.776 0.832 0.791 1.000 -0.4488 0.659 -0.7082 -0.723 -0.2432 -0.126
## drat 0.681 -0.700 -0.710 -0.449 1.0000 -0.712 0.0912 0.440 0.7127 0.700
## wt -0.868 0.782 0.888 0.659 -0.7124 1.000 -0.1747 -0.555 -0.6925 -0.583
## qsec 0.419 -0.591 -0.434 -0.708 0.0912 -0.175 1.0000 0.745 -0.2299 -0.213
## vs 0.664 -0.811 -0.710 -0.723 0.4403 -0.555 0.7445 1.000 0.1683 0.206
## am 0.600 -0.523 -0.591 -0.243 0.7127 -0.692 -0.2299 0.168 1.0000 0.794
## gear 0.480 -0.493 -0.556 -0.126 0.6996 -0.583 -0.2127 0.206 0.7941 1.000
## carb -0.551 0.527 0.395 0.750 -0.0908 0.428 -0.6562 -0.570 0.0575 0.274
## carb
## mpg -0.5509
## cyl 0.5270
## disp 0.3950
## hp 0.7498
## drat -0.0908
## wt 0.4276
## qsec -0.6562
## vs -0.5696
## am 0.0575
## gear 0.2741
## carb 1.0000