• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Laboratorio
    • Encuestas: Tamaño de Muestra
    • Lotería: Probabilidad de Ganar
    • Reparto de Escaños (D’Hondt)
    • Tres en Raya con IA
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad
    • Tiendas afiliadas
      • AliExpress
      • Amazon
      • Banggood
      • GeekBuying
      • Lenovo

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • IA Generativa
  • Python
  • Pandas
  • NumPy
  • R
  • Excel

Curiosidad: La Ley de Twyman y la trampa de los datos “interesantes”

septiembre 11, 2025 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

En ciencia de datos, pocas cosas llaman más la atención de los científicos de datos que un valor inesperado, un pico extraño o una correlación sorprendente. Pero cuidado: según la Ley de Twyman (Twyman’s law), esos datos que parecen más interesantes… ¡suelen estar mal!

Formulada de manera informal por el experto en visualización Tony Twyman, esta regla no escrita dice:

“Cualquier cifra que parezca interesante o inusual probablemente sea incorrecta.”

Puede sonar pesimista, pero en realidad es un recordatorio fundamental para cualquiera que trabaje con datos. Nuestro cerebro adora lo inesperado. Queremos encontrar patrones que expliquen lo extraordinario. Pero en la práctica, los sistemas de medición, las bases de datos y los procesos de recolección rara vez son infalibles. Por eso, los valores más impactantes suelen ser señales de que algo anda mal, más que pistas de un hallazgo revolucionario.

Un ejemplo muy común

Imagina que estás analizando las ventas mensuales de un producto, y de repente ves que en abril las cifras se disparan un 500 % respecto al mes anterior. Es tentador correr a buscar explicaciones:

  • ¿Una campaña de marketing viral?
  • ¿Un nuevo mercado que se abrió inesperadamente?
  • ¿Una tendencia estacional que no habías considerado?

Pero antes de buscar hipótesis, la Ley de Twyman te sugiere hacer otra cosa: verificar si los datos son correctos.

Programador de tareas de Windows: Guía definitiva para automatizar tu trabajo (BAT, PowerShell y Python)
En Analytics Lane
Programador de tareas de Windows: Guía definitiva para automatizar tu trabajo (BAT, PowerShell y Python)

Tal vez alguien cargó los datos dos veces. O los registros de marzo no se incluyeron por completo. O los datos de abril agrupan varias semanas de otros meses por un error en las fechas. También puede pasar que un archivo CSV mal procesado haya duplicado los registros, o que la fuente original haya cambiado de formato.

En cualquiera de estos casos, el pico no es una realidad: es una ilusión provocada por un error en los datos.

Publicidad


Datos raros = doble chequeo

La Ley de Twyman no dice que todos los datos llamativos están mal. A veces los descubrimientos reales empiezan con un valor raro. Pero la regla recuerda que, en un mundo imperfecto, lo raro suele ser ruido antes que señal.

Por eso, ante cualquier dato que destaque por su rareza, la actitud ideal es:

  • Validar su origen: ¿de qué fuente proviene?
  • Comprobar la integridad del conjunto: ¿hay registros faltantes, duplicados o fuera de rango?
  • Comparar con otros indicadores: ¿los KPIs relacionados confirman el mismo patrón?

La validación previa es lo que separa el entusiasmo ingenuo del análisis riguroso.

Una herramienta mental para evitar sesgos

Aunque no es una “ley” formal como en física o matemáticas, la Ley de Twyman se ha convertido en una especie de mantra mental entre analistas, estadísticos y científicos de datos. Ayuda a contrarrestar dos sesgos muy humanos:

  1. El sesgo de confirmación: queremos que los datos confirman nuestras ideas.
  2. El sesgo de novedad: prestamos más atención a lo que es raro o espectacular.

La Ley nos obliga a hacer una pausa y preguntarnos: ¿y si este valor es un error? Esa simple pregunta puede evitar errores, decisiones precipitadas o incluso publicaciones que luego se desmienten.

Publicidad


Conclusión: desconfía de lo llamativo

En visualización y análisis de datos, el “wow factor” puede ser una trampa. La Ley de Twyman no nos dice que ignoremos lo extraordinario, sino que lo cuestionemos antes de emocionarnos con ello.

La próxima vez que veas un pico inesperado, una correlación perfecta o una cifra que desafía toda lógica, recuerda: si un dato es demasiado bonito para ser cierto, probablemente no lo sea.

Nota: La imagen de este artículo fue generada utilizando un modelo de inteligencia artificial.

¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 5 / 5. Votos emitidos: 2

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicaciones relacionadas

  • Programador de tareas de Windows: Guía definitiva para automatizar tu trabajo (BAT, PowerShell y Python)
  • La Paradoja del Cumpleaños, o por qué no es tan raro compartir fecha de nacimiento
  • Cómo abrir una ventana de Chrome con tamaño y posición específicos desde la línea de comandos en Windows
  • Curiosidad: El sesgo de supervivencia, o por qué prestar atención sólo a los que “llegaron” puede engañarte
  • Documentar tu API de Express con TypeScript usando OpenAPI (Swagger)
  • Data Lake y Data Warehouse: diferencias, usos y cómo se complementan en la era del dato
  • ¿Media, mediana o moda en variables ordinales? Guía práctica para el análisis de datos
  • Cómo ejecutar JavaScript desde Python: Guía práctica con js2py
  • Cómo generar contraseñas seguras con Python (y entender su nivel de seguridad)

Publicado en: Ciencia de datos, Opinión Etiquetado como: Curiosidades

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Bluesky
  • Facebook
  • GitHub
  • Instagram
  • Mastodon
  • Pinterest
  • RSS
  • Telegram
  • Tumblr
  • Twitter
  • YouTube

Publicidad

Entradas recientes

Curiosidad: ¿Por qué los datos “raros” son tan valiosos?

noviembre 6, 2025 Por Daniel Rodríguez

Cómo generar contraseñas seguras con Python (y entender su nivel de seguridad)

noviembre 4, 2025 Por Daniel Rodríguez

Cómo ejecutar JavaScript desde Python: Guía práctica con js2py

octubre 30, 2025 Por Daniel Rodríguez

Publicidad

Es tendencia

  • Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas publicado el mayo 10, 2019 | en Python
  • Curiosidad: ¿Por qué los datos “raros” son tan valiosos? publicado el noviembre 6, 2025 | en Ciencia de datos, Opinión
  • Redondear la hora en Python para agrupar datos publicado el octubre 26, 2020 | en Python
  • Diferencia entre R2 y R2 ajustado en modelos de regresión publicado el marzo 8, 2024 | en Ciencia de datos
  • Método del codo (Elbow method) para seleccionar el número óptimo de clústeres en K-means publicado el junio 9, 2023 | en Ciencia de datos

Publicidad

Lo mejor valorado

4.9 (24)

Seleccionar filas y columnas en Pandas con iloc y loc

4.6 (16)

Archivos JSON con Python: lectura y escritura

4.4 (14)

Ordenación de diccionarios en Python mediante clave o valor

4.7 (13)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.5 (10)

Diferencias entre var y let en JavaScript

Publicidad

Comentarios recientes

  • Daniel Rodríguez en Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • Pepe en Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • CARLOS ARETURO BELLO CACERES en Justicio: La herramienta gratuita de IA para consultas legales
  • Piera en Ecuaciones multilínea en Markdown
  • Daniel Rodríguez en Tutorial de Mypy para Principiantes

Publicidad


Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2025 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto