Data Science con R
Análisis de Datos y algoritmos de predicción con R. Segunda Edición
2024-12-29
Prefacio
¡Bienvenido(a) a la segunda edición de Data Science con R!
Este libro, inicialmente concebido como una recopilación de notas personales para facilitar mi aprendizaje, ha evolucionado hasta convertirse en un recurso integral que cubre desde los fundamentos hasta técnicas avanzadas en ciencia de datos.
He invertido más de 700 horas en la creación de este libro. Puedes apoyar este esfuerzo adquiriendo la versión en PDF en leanpub. Además, la compra incluye acceso a futuras actualizaciones y la posibilidad de realizar consultas directas conmigo durante tres meses sobre los temas tratados o su aplicación práctica.
En esta edición, se han incorporado las últimas tendencias y tecnologías en ciencia de datos. Esto incluye actualizaciones a las versiones más recientes de R (4.4.2) y RStudio (2024.12.0), así como la integración de bibliotecas modernas como keras, tensorflow, xgboost, quanteda y sparklyr. También se han añadido herramientas para visualización interactiva, como plotly y leaflet.
Nuevas secciones abordan temas cruciales como la ética en ciencia de datos, la reproducibilidad mediante R Markdown y el control de versiones con Git y GitHub. Además, hemos fortalecido los contenidos sobre aprendizaje profundo, análisis de series temporales, minería de texto y análisis de sentimientos.
La versión web disponible en bookdown1 busca democratizar el conocimiento en ciencia de datos. Compártelo y contribuyamos juntos a liberar el conocimiento.
Al igual que en la primera edición, esta versión se basa en ejercicios diseñados a partir de experiencias prácticas en clase y actividades de la Certificación Profesional en Data Science2 por HarvardX. El código utilizado para generar este libro está disponible en GitHub, fomentando la transparencia y la reproducibilidad.
Hemos mejorado y actualizado los ejercicios, incorporando casos prácticos recientes sobre análisis de redes sociales, cambio climático y minería de texto. Esto permite aplicar inmediatamente lo aprendido a problemas del mundo real.
Agradezco profundamente a los lectores de la primera edición por sus comentarios y sugerencias, los cuales han sido fundamentales para mejorar esta versión.
Este libro ha llegado a lectores en México, Colombia, España, Perú y Chile, entre otros países. Espero que esta segunda edición sea una herramienta valiosa para avanzar en tu aprendizaje y práctica de ciencia de datos.
Si tienes preguntas o sugerencias, puedes escribirme a dparedesi@uni.pe. Suelo responder en un plazo máximo de 48 horas.
Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.