Graficamos

AL momento de graficarlo se nos mostrara en grafico de barras el numero de veces que se repite cada genero

library(ggplot2)
ggplot(data=tabla1, aes(y=Género, x=frecuencia, fill=Género))+
  geom_bar(stat = "identity")+
  geom_text(aes(label=frecuencia), vjust= 0.2)+theme_light()

## Agregar columna % a la tabla anterior

Al ejecutar este codigo no solo se nos mostrara una tabla en la que veremos el numero de veces que se repite cada genero, tambien veremos el en forma de de porcentaje

tabla2 <- tabla1%>%
  mutate(porcentaje=round(frecuencia/sum(frecuencia)*100,2))
tabla2
## # A tibble: 13 × 3
##    Género                       frecuencia porcentaje
##    <chr>                             <int>      <dbl>
##  1 Animation, Action, Adventure         17      36.2 
##  2 Animation, Action, Comedy             3       6.38
##  3 Animation, Adventure, Comedy         10      21.3 
##  4 Animation, Adventure, Drama           1       2.13
##  5 Animation, Comedy                     5      10.6 
##  6 Animation, Comedy, Drama              1       2.13
##  7 Animation, Comedy, Family             3       6.38
##  8 Animation, Comedy, Romance            1       2.13
##  9 Animation, Drama, Family              1       2.13
## 10 Animation, Family                     1       2.13
## 11 Animation, Family, Fantasy            1       2.13
## 12 Animation, Short, Action              2       4.26
## 13 Animation, Short, Adventure           1       2.13

0.8 Gráfico

AL momento de graficarlo se nos mostrara en grafico de barras el porcentaje de cada genero de nuestra base de datos

ggplot(data=tabla2, aes(y=Género, x=porcentaje, fill=Género))+
  geom_bar(stat = "identity")+
  geom_text(aes(label=paste(porcentaje, "%"), vjust= 0.5))+
  ylab("Géneros")+xlab("Porcentajes")+
  ggtitle("Géneros de las series y peliculas")+theme_classic()

0.9 Gráfico circular o de sectores

Otra forma de ver estos porcentajes es si lo ponemos en un grafico circular solamente ingresamos el siguiente codigo y podremos ver el porcentaje de cada genero respecto a nuestra base de datos

ggplot(data=tabla2, aes(y=porcentaje, x=1, fill=Género))+
  geom_bar(stat = "identity")+
  geom_text(aes(label=paste0(round(porcentaje,1),"%")),
            position = position_stack(vjust= 0.5))+
  coord_polar(theta = "y")+
  ylab("Géneros")+xlab("Porcentajes")+
  ggtitle("Géneros de las series y peliculas")+theme_classic()

# Gráficos para variables cuantitativas {.unnumbered}

library(funModeling)
plot_num(animacion)

## Medidas estadísticas

summary(animacion)
##      Puesto         Nombre              Año              Duracion        
##  Min.   : 1.00   Length:47          Length:47          Length:47         
##  1st Qu.:13.50   Class :character   Class :character   Class :character  
##  Median :26.00   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :25.89                                                           
##  3rd Qu.:38.50                                                           
##  Max.   :50.00                                                           
##     Género             Puntaje         Votos        
##  Length:47          Min.   :3.20   Min.   :    355  
##  Class :character   1st Qu.:7.40   1st Qu.:  23128  
##  Mode  :character   Median :8.40   Median :  96880  
##                     Mean   :8.04   Mean   : 161717  
##                     3rd Qu.:8.70   3rd Qu.: 210623  
##                     Max.   :9.70   Max.   :1052286
library(funModeling)
profiling_num(animacion)
##   variable         mean      std_dev variation_coef    p_01    p_05    p_25
## 1   Puesto 2.589362e+01 1.464839e+01      0.5657144   1.460    3.30    13.5
## 2  Puntaje 8.040426e+00 1.096964e+00      0.1364311   4.626    6.53     7.4
## 3    Votos 1.617173e+05 1.988506e+05      1.2296185 439.640 1626.80 23128.0
##      p_50     p_75      p_95       p_99    skewness kurtosis      iqr
## 1    26.0     38.5     47.70     49.540 -0.02364928 1.791492     25.0
## 2     8.4      8.7      9.24      9.562 -1.95260767 9.157861      1.3
## 3 96880.0 210623.0 501382.80 805279.340  2.28211542 9.791415 187495.0
##              range_98         range_80
## 1       [1.46, 49.54]      [6.6, 45.4]
## 2      [4.626, 9.562]         [6.8, 9]
## 3 [439.64, 805279.34] [6065, 384080.4]

0.10 mean, median, var,sd,quantile()

ggplot(animacion, aes(x=Puntaje))+
  geom_histogram(bins = 6)

# Tablas de frecuencia de las variables cuantitativas {.unnumbered}

Mostraremos un histograma respecto al puntaje y especificaremos que sea de color rojo hist(animacion$Puntaje, col=“red”)

Este codigo nos mostrara un histograma respecto al puntje y tambien veremos su tabla de frecuencia

hist(animacion$Puntaje, col="red")

library(agricolae)
tabla_freq<-table.freq(hist(animacion$Puntaje, breaks = "Sturges"))

# Para particionar el espacio gráfico pordemos realizar {.unnumbered}

Este codigo nos mostrara un diagrama de cajas respecto al Puntaje y al Puesto de nuestra base de datos

boxplot(animacion$Puntaje)

boxplot(animacion$Puesto)