Graficamos
AL momento de graficarlo se nos mostrara en grafico de barras el numero de veces que se repite cada genero
library(ggplot2)
ggplot(data=tabla1, aes(y=Género, x=frecuencia, fill=Género))+
geom_bar(stat = "identity")+
geom_text(aes(label=frecuencia), vjust= 0.2)+theme_light()
## Agregar columna % a la tabla anterior
Al ejecutar este codigo no solo se nos mostrara una tabla en la que veremos el numero de veces que se repite cada genero, tambien veremos el en forma de de porcentaje
<- tabla1%>%
tabla2 mutate(porcentaje=round(frecuencia/sum(frecuencia)*100,2))
tabla2
## # A tibble: 13 × 3
## Género frecuencia porcentaje
## <chr> <int> <dbl>
## 1 Animation, Action, Adventure 17 36.2
## 2 Animation, Action, Comedy 3 6.38
## 3 Animation, Adventure, Comedy 10 21.3
## 4 Animation, Adventure, Drama 1 2.13
## 5 Animation, Comedy 5 10.6
## 6 Animation, Comedy, Drama 1 2.13
## 7 Animation, Comedy, Family 3 6.38
## 8 Animation, Comedy, Romance 1 2.13
## 9 Animation, Drama, Family 1 2.13
## 10 Animation, Family 1 2.13
## 11 Animation, Family, Fantasy 1 2.13
## 12 Animation, Short, Action 2 4.26
## 13 Animation, Short, Adventure 1 2.13
0.8 Gráfico
AL momento de graficarlo se nos mostrara en grafico de barras el porcentaje de cada genero de nuestra base de datos
ggplot(data=tabla2, aes(y=Género, x=porcentaje, fill=Género))+
geom_bar(stat = "identity")+
geom_text(aes(label=paste(porcentaje, "%"), vjust= 0.5))+
ylab("Géneros")+xlab("Porcentajes")+
ggtitle("Géneros de las series y peliculas")+theme_classic()
0.9 Gráfico circular o de sectores
Otra forma de ver estos porcentajes es si lo ponemos en un grafico circular solamente ingresamos el siguiente codigo y podremos ver el porcentaje de cada genero respecto a nuestra base de datos
ggplot(data=tabla2, aes(y=porcentaje, x=1, fill=Género))+
geom_bar(stat = "identity")+
geom_text(aes(label=paste0(round(porcentaje,1),"%")),
position = position_stack(vjust= 0.5))+
coord_polar(theta = "y")+
ylab("Géneros")+xlab("Porcentajes")+
ggtitle("Géneros de las series y peliculas")+theme_classic()
# Gráficos para variables cuantitativas {.unnumbered}
library(funModeling)
plot_num(animacion)
## Medidas estadísticas
summary(animacion)
## Puesto Nombre Año Duracion
## Min. : 1.00 Length:47 Length:47 Length:47
## 1st Qu.:13.50 Class :character Class :character Class :character
## Median :26.00 Mode :character Mode :character Mode :character
## Mean :25.89
## 3rd Qu.:38.50
## Max. :50.00
## Género Puntaje Votos
## Length:47 Min. :3.20 Min. : 355
## Class :character 1st Qu.:7.40 1st Qu.: 23128
## Mode :character Median :8.40 Median : 96880
## Mean :8.04 Mean : 161717
## 3rd Qu.:8.70 3rd Qu.: 210623
## Max. :9.70 Max. :1052286
library(funModeling)
profiling_num(animacion)
## variable mean std_dev variation_coef p_01 p_05 p_25
## 1 Puesto 2.589362e+01 1.464839e+01 0.5657144 1.460 3.30 13.5
## 2 Puntaje 8.040426e+00 1.096964e+00 0.1364311 4.626 6.53 7.4
## 3 Votos 1.617173e+05 1.988506e+05 1.2296185 439.640 1626.80 23128.0
## p_50 p_75 p_95 p_99 skewness kurtosis iqr
## 1 26.0 38.5 47.70 49.540 -0.02364928 1.791492 25.0
## 2 8.4 8.7 9.24 9.562 -1.95260767 9.157861 1.3
## 3 96880.0 210623.0 501382.80 805279.340 2.28211542 9.791415 187495.0
## range_98 range_80
## 1 [1.46, 49.54] [6.6, 45.4]
## 2 [4.626, 9.562] [6.8, 9]
## 3 [439.64, 805279.34] [6065, 384080.4]
0.10 mean, median, var,sd,quantile()
ggplot(animacion, aes(x=Puntaje))+
geom_histogram(bins = 6)
# Tablas de frecuencia de las variables cuantitativas {.unnumbered}
Mostraremos un histograma respecto al puntaje y especificaremos que sea de color rojo hist(animacion$Puntaje, col=“red”)
Este codigo nos mostrara un histograma respecto al puntje y tambien veremos su tabla de frecuencia
hist(animacion$Puntaje, col="red")
library(agricolae)
<-table.freq(hist(animacion$Puntaje, breaks = "Sturges")) tabla_freq
# Para particionar el espacio gráfico pordemos realizar {.unnumbered}
Este codigo nos mostrara un diagrama de cajas respecto al Puntaje y al Puesto de nuestra base de datos
boxplot(animacion$Puntaje)
boxplot(animacion$Puesto)