2 Introducción

El manual de Estadística y Machine Learning con R tiene su origen en el libro de Econometría Aplicada (Ediciones Académicas) que elaboré junto a Alberto Muñoz Cabanes como bibliografía de referencia para el cursos de econometría I de la licenciatura de Admimistración y Dirección de Empresas de la Universidad Nacional de Educación a Distancia (UNED) de la que fui profesor en los cursos de 2001/2002 a 2004/2005. En noviembre de 2005 vine a trabajar en el Instituto Cantabro de Estadística (ICANE) y deje la docencia universitaria, hasta el curso 2011/12 donde me incorpore al equipo de profesores que imparte Econometría en el ahora Grado de Administración y Dirección de Empresas de la Universidad de Cantabria.

En el gobierno de Cantabria impartí diversos cursos de formación en Estadística con Excel con unos apuntes elaborados a partir del libro que edito Ediciones Académicas, estos apuntes se difundieron en el blog: https://wordpress.com/view/econometria.wordpress.com, como Curso de econometría Básica y Curos de Econometría Avanzado, en donde se incluían ejemplos en R de los contenidos del curso. Una vez se considero utilizar el software estadístico R, como referente para los futuros desarrollos estadísticos del ICANE, sutituyendo a diversos software (SPSS, Gretl, Octave, etc…) que utilizaban los diferentes departamentos, se desarrolló un plan de formación en R, que se inició en Octubre de 2016, con el curso “Introducción al análisis de datos con R”, impartido por los profesores Miguel Expósito Martín y Francisco Parra Rodríguez, dentro de la programación de cursos para formación para el gobierno de Cantabria del CEAR. Ese mismo año se impartió un curso de tecnicas estadísticas en R para el personal funcionario y becario del ICANE. Para ámbos cursos se elaboró un documento de trabajo (DOC nº2 2016): Curso de Estadística con R, en donde junto a las técnicas estadísticas se introducían algunos elementos del aprendizaje automático (http://www.icane.es/c/document_library/get_file?uuid=c2e9fff1-72d5-42ad-b391-bacb3ebe9dbe&groupId=10138). En 2017, se impartió a los becarios del Instituto otro curso de formación en R, en donde se ampliaron los contenidos de machine learning y los de estadística multivariante. El propósito de dicha formación era que las personas con beca en el ICANE, dispusieran habilidades e instrumentos de libre difusión con los que pudieran completar su capacitación estadística en el futuro. Dado que el perfil de las becas es amplio en lo que a titulaciones que permite (estadísticos, economístas, demógrafos, sociologos, etc…) se planteó una formación de caracter lo más generalista posible y no centrada en la producción estadística que realiza el ICANE. En 2018, preparé junto a los profesores Julio González Arias , Mauricio Beltrán Pascual y Juan Antonio Vicente Virseda, un master en la UNED de Data Science y Big Data aplicados a la Economía y a la Administración y Dirección de Empresas, una parte del material elaborado para dicho Master se ha incorporado a este book.

El manual de Estadística y Machine Learnig con R, ha sido elaborado exclusivamente con R, utilizando las librerias knitr, markdown y bookdown, que permiten editar y compilar documentos en diferentes formatos. Con el fin de que pueda utilizarse en futuros proyectos formativos, el documento se ha compilado en html, para ser consultado on-line y difundido a través de las redes sociales.