2.12 Ejercicios

Usando la base de datos notas y R (naturalmente), responde a los siguientes ejercicios:

  1. ¿Qué tabla de datos resulta al seleccionar sólo a los hombres del curso?

  2. ¿Qué tabla de datos resulta al seleccionar a los hombres que tengan menos de un 5.0 en la Prueba 1?

  3. ¿Qué tabla de datos resulta al seleccionar a los alumnos que tengan una nota menor que 4.0 en la Prueba 1 o en la Prueba 2?

  4. ¿Qué países tienen a algún alumnos con nota mayor o igual a 6.0 en el examen?

  5. Obtén una tabla de datos anonimizada, es decir, que no tenga la identidad de los alumnos pero sí todas sus notas.

  6. Obtén una tabla de datos que tenga los promedios de las notas de tareas y de las notas de pruebas. Ambos promedios deben estar aproximados a un decimal9.

  7. Con la tabla de datos obtenida en el ítem anterior, crea una nueva columna que contenga el cálculo de la nota final de cada alumno, usando las siguientes ponderaciones:

    • Promedio pruebas: 50%
    • Nota examen: 30%
    • Promedio tareas: 20%
  8. Con las ponderaciones señaladas en el ítem anterior ¿hay algún alumno reprobado (nota final menor que 4.0)?

  9. Obtén un ranking de los alumnos según su nota final. En caso de haber empates, el alumno con mejor asistencia va primero.

  10. Compara el promedio de las notas finales entre hombres y mujeres del curso.

2.12.1 Base de datos mpg

La base de datos mpg (ya precargada en el tidyverse) contiene datos de vehículos y su rendimiento tanto en ciudad como en carretera. La descripción de las variables es la siguiente:

  • manufacturer: name nombre del fabricante
  • model: nombre del modelo
  • displ: desplazamiento del motor, en litros
  • year: año de fabricación
  • cyl: número de cilindros
  • trans: tipo de transmisión (manual o automática)
  • drv: tipo de tracción, con f = tracción delantera, r = tracción trasera, 4 = tracción en cuatro ruedas
  • cty: rendimiento en ciudad, en millas por galón
  • hwy: rendimiento en carretera, en millas por galón
  • fl: tipo de combustible, con e = etanol, d = diesel, r = regular, p = premium, c = CNG (gas natural)
  • class: tipo de vehículo

Usando R y tidyverse, responda las siguientes preguntas:

  1. ¿Cuál el es número de vehículos en esta base de datos?

  2. ¿Qué valores puede tomar la variable manufacturer?

  3. ¿Cuántos vehículos hay de cada fabricante en esta base de datos? ¿Cuál es el fabricante con más vehículos en esta base de datos?

  4. Obtenga una base de datos con todos aquellos vehículos de marca Honda y que tengan un rendimiento en carretera de más de 32 millas por galón.

  5. Obtenga una base de datos con todos aquellos vehículos que sean de marca Honda y que tengan transmisión automática10.

  6. Convierta los rendimientos en ciudad y carretera a kilómetros por litro (en lugar de millas por galón) y almacénelos en nuevas variables. Tip: 1 milla por galón es igual a 0.425144 kilómetros por litro.

  7. Construya una nueva variable que contenga el rendimiento promedio de cada vehículo (promedio entre rendimiento en ciudad y carretera).

  8. ¿Cuáles son los 10 vehículos con mayor rendimiento en ciudad? Si hay empates deben ser rotos usando el rendimiento en carretera.

  9. ¿Cuáles son los fabricantes que tienen vehículos dentro de los 10 primeros en rendimiento en ciudad (calulados antes)?

  10. Calcule el rendimiento promedio en ciudad y rendimiento promedio en carretera sobre todos los vehículos en la base de datos.

  11. ¿A partir de qué rendimiento se encuentra el 10% de vehículos con mejor rendimiento en ciudad? ¿Y en carretera?

  12. Compare el rendimiento en ciudad promedio entre los distintos tipos de vehículos, ¿cuáles son los 3 tipos de vehículos con mejores rendimientos en ciudad?

  13. Compare ahora el rendimiento en carretera promedio entre los distintos tipos de vehículos. ¿Cómo cambia el ranking de los 3 mejores vehículos en rendimiento?

  14. ¿Cómo ha cambiado el rendimiento en ciudad promedio para cada tipo de vehículo desde 1999 a 2008? ¿Y en carretera?


  1. Para aproximar a un número determinado de decimales, utiliza la función round(). Por ejemplo, si deseas redondear un número x a 1 decimal debes usar round(x, 1).↩︎

  2. Note que todos los vehículos con transmisión automática son aquellos cuyo valor de la variable trans comienza con “auto”↩︎