Entrenamiento en productos de datos: R Markdown
2021-05-06
Presentación
Durante el verano de 2021 tuve la oportunidad de reunirme dos veces por semana con un grupo de personas interesadas en aprender a elaborar productos de datos. La única condición impuesta para formar parte de este grupo fue tener mucha paciencia y disposición a cometer muchos errores en el camino. En resumen, pienso que las personas que lograron participar en las sesiones y elaborar su proyecto final, compilado en este libro digital, han tenido éxito en adquirir nuevos conocimientos que les permitirán aplicar sus habilidades de análisis de datos con mayor confianza y habilidad técnica.
Pienso que los aprendizajes logrados brillan particularmente a la luz de los desafíos que tuvieron que enfrentar.
En primer lugar, el comentario que dieron en común cuando tuvieron que presentarse ante los demás miembros del grupo fue “no soy bueno con los números.” Esto no fue sorprendente, siendo que todas las personas participantes provenían de estudios superiores de carreras de ciencias sociales, en las que mucha gente busca “refugiarse” de las matemáticas. Ante esto, espero que con el transcurso de los talleres haber podido convencerlos de dos ideas:
- Que en realidad no son tan malos con los números como pensaban.
- Que con eso es suficiente para obtener valor de los datos a los que tienen acceso.
El segundo desafío está relacionado con las condiciones en las que se brinda la educación no presencial. Por lo general, las condiciones son malas: deficiente calidad de señal de internet, falta de ambientes adecuados en la vivienda para atender las clases, computadoras de varios años de antigüedad y dificultad de poder realmente dedicarse exclusivamente a la sesión durante su duración completa por diferentes motivos. Estas dificultades no han sido exclusivas de este taller, sino que en general describen las condiciones en que se ha tenido que brindar la educación no presencial en nuestro país.
Por último, la pandemia por el covid 19. Además de obligarnos a ejecutar el taller en modalidad no presencial, fue un motivo directo para que varios participantes simplemente ya no pudieran continuar con las sesiones, ya sea porque enfermaron ellos mismos o una persona cercana que requirió su atención. Nuevamente, este es un hecho que se replica en toda la población estudiantil del país y el mundo. Espero que cuando los participantes afectados puedan recuperarse podamos encontrar un tiempo para completar las sesiones con ellos e incluirlos en este producto digital.
Este libro busca ser una compilación de los trabajos realizados como proyecto final para el Taller de Elaboración de productos de datos. Está pensado como una vitrina en la que los participantes puedan exhibir que han adquirido los conocimientos esperados en el taller:
- Elaborar cuadros y gráficos explorativos sobre variables específicas en set de datos relacionados a sus intereses.
- Elaborar reportes de análisis de datos usando R Markdown y el flujo de trabajo de Proyectos en RStudio.
Los trabajos han requerido modificaciones mínimas, hechas por mí, exclusivamente para poder numerar las tablas y gráficos siguiendo el estilo de bookdown
. Es probable que un ojo más entrenado que el de los autores en el lenguaje estadístico R encuentre que el código que usaron es perfectible. La idea de mantenerlo como ellos lo produjeron es que ese ojo pueda ser el de ellos mismos en el futuro.
Samuel Calderon