Capítulo 6 Bases fundamentales del aprendizaje supervisado
La unidad teórica consistirá en completar las siguientes lecturas.
6.1 Regresión
El análisis de la regresión es un proceso estadístico para estimar las relaciones entre variables. Incluye muchas técnicas para el modelado y análisis de diversas variables, cuando la atención se centra en la relación entre una variable dependiente y una o más variables independientes. Su propósito es establecer un modelo para la relación entre un cierto número de características y una variable objetivo continua. En la siguiente presentación se abordan las principales ideas detrás de la regresión:
6.2 Clasificación
La clasificación es el problema de identificar a cuál de un conjunto de categorías (o subcategorías) pertenece una nueva observación, sobre la base de un conjunto de datos de formación que contiene observaciones (o instancias) cuya categoría de miembros es conocida. La clasificación supervisada se basa en conocer a priori la clase a la que pertenecen las observaciones y que servirán para generar una característica de cada una de las clases para las nuevas observaciones o predicciones. A continuación se presentan estas ideas:
6.3 Evaluación en modelación predictiva
Siempre se debe evaluar un modelo para determinar si realizará un buen trabajo de predicción para nuevas observaciones. Dado que las futuras instancias tienen valores de destino desconocidos, se debe comprobar la métrica de precisión de la estrategia de modelación en relación con los datos de los que ya se sabe la respuesta de destino y utilizar esta comprobación como proxy de precisión predictiva. La lectura, Evaluación y Tueno, introduce a estas ideas:
6.4 Selección y Regularización en la modelación
Existen limitaciones que aparecen en la práctica al tratar de emplear modelos ajustados por mínimos cuadrados ordinarios. Las estrategias de selección y regularización se pueden aplicar para atenuar el impacto de estos problemas.