5.1 Métricas

5.1.1 Matriz de confusión

También conocida como matriz de errores, es una tabla que ayuda a visualizar el rendimiento de un algoritmo de clasificación.

Matriz de confusión

Figura 5.1: Matriz de confusión

Para diferenciar los cuatro términos lo mejor es un ejemplo:

Cuatro imágenes valen más que cuatro mil palabras [@udemy]

Figura 5.2: Cuatro imágenes valen más que cuatro mil palabras (Portilla 2018)

Cuidadín, que las matrices de confusión que vamos a obtener nosotros están en otro orden:

Otra posible representación de la matriz de confusión

Figura 5.3: Otra posible representación de la matriz de confusión

5.1.2 Exactitud, sensibilidad y precisión (Accuracy, recall & precision)

[@udemy]

Figura 5.4: (Portilla 2018)

  • La Exactitud (accuracy) responde a la pregunta ¿Cuál es la proporción de predicciones correctas?
  • La Sensibilidad (recall) responde a la pregunta ¿Qué proporción de positivos reales se han predicho correctamente?
  • La Precisión (precision) responde a la pregunta ¿Qué proporción de predicciones positivas es correcta?

Nótese que la sensibilidad y la precisión se definen aquí como proporción de positivos reales y proporción de predicciones positivas.

References

Portilla, Jose. 2018. Data Science and Machine Learning Bootcamp with R. https://www.udemy.com/data-science-and-machine-learning-bootcamp-with-r/.