3 Solución reto ampliada.

__EN DESARROLLO.__La solución del reto ampliada todavía no la hemos desarrollado. Pero lo haremos. Si quieres seguir cómo lo vamos haciendo sólo tienes que seguir este repositorio de GitHub - Hackathon_Talento_Reto_2_Wind_Farm.

Para comenzar recordemos el objetivo final de este reto:

Todo el proceso previo a la generación de los modelos lo podíamos hacer con las herramientas que quisiésemos. Nosotros utilizamos R. Para la parte de modelado se nos dio acceso a una cuenta boost de BIGml.

3.1 Carga de las librerias necesarias.

Cargamos los paquetes que vamos a necesitar para el análisis

3.2 Importación de los datos.

3.2.1 Datos “train”.

3.2.2 Datos “test”.

3.3 Exploración y tratamiento de los datos.

3.3.1 Exploración inicial de las tablas.

3.3.2 Calidad de los datos.

3.3.2.1 Dataset de producción “prod_2015_2016”.

3.3.2.1.1 Completitud de los datos.
3.3.2.1.2 Número y frecuencia de registros.
3.3.2.1.3 Análisis de NAs (valores faltantes).
3.3.2.1.4 Transformaciones de la tabla.

3.3.3 Exploración y visualizaciones.

3.4 Generación de modelos base.

3.5 Descripción de la generación de los modelos con BIGml.