“Garbage in, Garbage out”.
La data “sucia” es mucho más que información inexacta, incompleta, inconsistente y duplicada.
En mi experiencia en el análisis de data cruda me he encontrado con la limitante para la visualización de datos, identificación de tendencias y oportunidades.
Muchos equipos se centran en el almacenamiento, la gestión de los datos, incluso en métodos para sacar conclusiones y conocimiento de los datos, lo cual es fundamental, pero casi siempre nos olvidamos de la materia prima: el dato.
Y es que si la data es mala, las conclusiones que saquemos de ellas, y por tanto las decisiones, serán incorrectas.
Aunque el proceso de limpieza de data requiera una buena parte de nuestro tiempo, herramientas y habilidades, siempre será el mejor camino. Mucho más aún. Es la mejor solución. Solo purificando de raíz podremos disfrutar de los beneficios y resultados de una buena data.