3.1 Tidy data

Uno de los puntos principales en la filosofía de los paquetes de tidyverse es que se trabaja con datasets tidy. Esto significa que cumplen las siguientes tres reglas interconectadas:

  1. Cada variable está en contenida en una columna.
  2. Cada observación se encuentra en una fila.
  3. Cada valor (observación/variable) corresponde a una celda.

Este formato permite crear estructuras de datos consistentes, que también comparten una forma consistente de almacenamiento. Los datasets que recolectamos con información propia o los que obtenemos en diversas bases de datos no siempre cuentan con estas características y algunas veces es necesario implementar transformaciones y realizar limpieza de datos para llegar a este formato.