3.7 Ejercicios

Usando la base de datos penguins y R (naturalmente), responde a los siguientes ejercicios:

  1. Genere gráficos de barra para mostrar:
  • La frecuencia de pinguinos según especie.
  • La frecuencia de pingüinos según sexo.
  1. Genere un histograma que muestre la distribución de la masa corporal (body_mass_g) de todos los pingüinos. Luego, genere otros 3 histogramas para gráfica la masa corporal de cada especie de pingüino. Utilice para cada histograma 15 bins.

  2. Genere un único histograma que muestre la distribución de la masa corporal (body_mass_g) de cada especie de pingüino. Utilice para cada histograma 15 bins (Hint: para esto, en lugar de usar la función geom_histogram, utilice la función geom_freqpoly. Esta función le permitirá graficar los histogramas como polígonos de frecuencia y así lograr visualizarlos en conjunto)

  3. Genere un boxplot que muestre la masa corporal (body_mass_g) de todos los pingüinos. Luego de eso, realice un gráfico que compare los diferentes boxplots de la masa corporal para cada especie de pingüino.

  4. Genere un gráfico de dispersión que compare las variables masa corporal (body_mass_g) y el largo de la aleta (flipper_length_mm) de los pingüinos. Muestre cada observación con un color diferente dependiendo de la especie del individuo y con una forma diferente dependiendo del sexo del individuo.

  5. Use gráficos de columna para mostrar cómo se compara, entre distintas especies de pingüinos, el promedio de cada una de las siguientes variables:

  • largo de pico
  • profundidad de pico
  • largo de aleta
  • masa corporal

3.7.1 Base de datos mpg

La base de datos mpg (ya precargada en el tidyverse, por lo que basta con escribir “mpg” para usarla en un comando) contiene datos de vehículos y su rendimiento tanto en ciudad como en carretera. La descripción de las variables es la siguiente:

  • manufacturer: name nombre del fabricante
  • model: nombre del modelo
  • displ: desplazamiento del motor, en litros
  • year: año de fabricación
  • cyl: número de cilindros
  • trans: tipo de transmisión (manual o automática)
  • drv: tipo de tracción, con f = tracción delantera, r = tracción trasera, 4 = tracción en cuatro ruedas
  • cty: rendimiento en ciudad, en millas por galón
  • hwy: rendimiento en carretera, en millas por galón
  • fl: tipo de combustible, con e = etanol, d = diesel, r = regular, p = premium, c = CNG (gas natural)
  • class: tipo de vehículo
  1. Construya un gráfico de barras que permita visualizar el número de vehículos de cada fabricante en la base de datos.

  2. Construya un gráfico de columnas para mostrar el rendimiento en ciudad (cty) promedio para cada clase (class).

  3. Construya un gráfico de columnas para mostrar el rendimiento en ciudad (cty) promedio para cada clase (class) y tipo de tracción (drv) simultáneamente. Tip: Mapee una de las variables (clase o tración) a una estética del gráfico. Procure que esta estética sea efectiva para hacer las comparaciones entre rendimientos en ciudad.

  4. Utilice un gráfico de dispersión para mostrar qué relación existe entre el tamaño del motor (displ) y el rendimiento en carretera, para cada clase de vehículo. ¿Qué puede observar?

  5. Usando histogramas, compare la distribución del rendimiento en ciudad para distintos tipos de tracción (drv).