En ciencia de datos, pocas cosas llaman más la atención de los científicos de datos que un valor inesperado, un pico extraño o una correlación sorprendente. Pero cuidado: según la Ley de Twyman (Twyman’s law), esos datos que parecen más interesantes… ¡suelen estar mal!
Formulada de manera informal por el experto en visualización Tony Twyman, esta regla no escrita dice:
“Cualquier cifra que parezca interesante o inusual probablemente sea incorrecta.”
Puede sonar pesimista, pero en realidad es un recordatorio fundamental para cualquiera que trabaje con datos. Nuestro cerebro adora lo inesperado. Queremos encontrar patrones que expliquen lo extraordinario. Pero en la práctica, los sistemas de medición, las bases de datos y los procesos de recolección rara vez son infalibles. Por eso, los valores más impactantes suelen ser señales de que algo anda mal, más que pistas de un hallazgo revolucionario.
Imagina que estás analizando las ventas mensuales de un producto, y de repente ves que en abril las cifras se disparan un 500 % respecto al mes anterior. Es tentador correr a buscar explicaciones:
Pero antes de buscar hipótesis, la Ley de Twyman te sugiere hacer otra cosa: verificar si los datos son correctos.
Tal vez alguien cargó los datos dos veces. O los registros de marzo no se incluyeron por completo. O los datos de abril agrupan varias semanas de otros meses por un error en las fechas. También puede pasar que un archivo CSV mal procesado haya duplicado los registros, o que la fuente original haya cambiado de formato.
En cualquiera de estos casos, el pico no es una realidad: es una ilusión provocada por un error en los datos.
La Ley de Twyman no dice que todos los datos llamativos están mal. A veces los descubrimientos reales empiezan con un valor raro. Pero la regla recuerda que, en un mundo imperfecto, lo raro suele ser ruido antes que señal.
Por eso, ante cualquier dato que destaque por su rareza, la actitud ideal es:
La validación previa es lo que separa el entusiasmo ingenuo del análisis riguroso.
Aunque no es una “ley” formal como en física o matemáticas, la Ley de Twyman se ha convertido en una especie de mantra mental entre analistas, estadísticos y científicos de datos. Ayuda a contrarrestar dos sesgos muy humanos:
La Ley nos obliga a hacer una pausa y preguntarnos: ¿y si este valor es un error? Esa simple pregunta puede evitar errores, decisiones precipitadas o incluso publicaciones que luego se desmienten.
En visualización y análisis de datos, el “wow factor” puede ser una trampa. La Ley de Twyman no nos dice que ignoremos lo extraordinario, sino que lo cuestionemos antes de emocionarnos con ello.
La próxima vez que veas un pico inesperado, una correlación perfecta o una cifra que desafía toda lógica, recuerda: si un dato es demasiado bonito para ser cierto, probablemente no lo sea.
Nota: La imagen de este artículo fue generada utilizando un modelo de inteligencia artificial.
Seguimos evolucionando el laboratorio de Analytics Lane y hoy lanzamos la versión 1.1, disponible en:…
“El interés compuesto es la octava maravilla del mundo. El que lo entiende lo gana…
Tienes los datos de ventas de tres productos en dos años distintos y quieres saber…
Imagina la situación. Tu equipo lleva tres años con un modelo en producción. No es…
Cuando un banco evalúa una solicitud de crédito necesita responder a una pregunta aparentemente simple:…
En el octavo aniversario de Analytics Lane seguimos ampliando nuestro laboratorio de aplicaciones interactivas y,…
This website uses cookies.