Opinión

Curiosidad: ¿Por qué los datos “raros” son tan valiosos?

En estadística, los valores atípicos —también llamados outliers— son esos datos que se alejan “demasiado” del resto. Son los números que no encajan, los casos extremos, los que te hacen fruncir el ceño y preguntarte: ¿esto estará mal medido?

Durante años se nos ha enseñado a sospechar de los outliers. A corregirlos, suavizarlos o, directamente, eliminarlos del análisis.

Pero… ¿y si te dijera que, en muchos casos, los outliers no son errores, sino mensajes escondidos?

¿Qué es un outlier, exactamente?

Un outlier es un dato que se desvía notablemente del patrón general. Por ejemplo:

  • En una clase de 30 alumnos con notas entre 4 y 8, alguien saca un 0.
  • En un estudio de sueldos, donde casi todos ganan entre 25.000 y 50.000 €, aparece alguien con 800.000 €.
  • En un ensayo clínico, un paciente tiene una reacción completamente distinta al tratamiento que funciona en los demás.

Técnicamente, puede definirse como un valor que está más allá de 1.5 veces el rango intercuartílico, o más de 3 desviaciones estándar por encima o por debajo de la media.

Pero más allá de fórmulas, la idea es simple: es un dato que rompe las reglas y se sale de lo “normal”.

Lo raro no siempre es ruido. A veces es señal.

En muchos análisis, los outliers son molestos: distorsionan promedios, deforman gráficos, hacen que los modelos no encajen.

Pero otras veces, lo raro es justo lo más valioso.

  • En medicina, un paciente con una reacción inesperada puede revelar un subtipo de enfermedad, una mutación genética o un nuevo efecto secundario.
  • En finanzas, un pico extraño puede anticipar una crisis, una burbuja o una oportunidad de inversión.
  • En ciberseguridad, un comportamiento anómalo puede ser el primer indicio de un ataque.
  • En ciencia, muchos grandes descubrimientos empezaron con un dato que “no cuadraba”.

Un outlier puede ser un error. O puede ser una pista.

Casos famosos donde lo raro cambió el mundo

A lo largo de la historia, varios descubrimientos cruciales nacieron de algo que, al principio, parecía un simple error:

  • Alexander Fleming y la penicilina: una placa de Petri se contaminó con moho. En lugar de descartarla, Fleming notó que las bacterias no crecían a su alrededor. Lo que parecía un accidente fue el comienzo de los antibióticos.
  • Clyde Tombaugh y Plutón: el descubrimiento de Plutón en 1930 fue gracias a un pequeño punto que se movía raro entre miles de estrellas. Un outlier celeste.
  • El paciente cero: en epidemias, identificar al primer infectado —el caso raro, el que no encaja— permite reconstruir cómo comenzó todo. Un dato marginal que cambia el curso de una pandemia.

¿Qué hacer con un outlier?

No hay una regla única. Pero estas preguntas te pueden guiar:

  1. ¿Podría ser un error de entrada o de medición? Revisa bien antes de descartarlo.
  2. ¿Tiene sentido dentro del contexto? A veces apunta a una subcategoría, una excepción o una nueva hipótesis.
  3. ¿Está afectando demasiado los resultados? En ese caso, tal vez convenga usar modelos más robustos.

A veces eliminar un outlier es correcto. Otras veces, eliminarlo es borrar justo lo más interesante del fenómeno.

Una reflexión final: ¿y si lo raro es lo normal mal entendido?

En muchas disciplinas hemos elevado tanto lo “promedio” que olvidamos algo esencial: la realidad es compleja, y la normalidad es una construcción estadística, no una verdad absoluta.

Los outliers nos obligan a mirar de nuevo. A hacer preguntas incómodas. A reconsiderar lo que dábamos por sentado.

Porque al final, lo que se sale de la línea recta es lo que hace avanzar el conocimiento.

Nota: La imagen de este artículo fue generada utilizando un modelo de inteligencia artificial..

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez
Tags: Curiosidades

Recent Posts

Cómo crear un Data Lake en Azure paso a paso

El volumen de datos que las organizaciones generan y deben manejar crece día a día:…

1 día ago

¿Por qué el azar no es tan aleatorio como parece?

Cuando escuchamos la palabra “azar”, pensamos en lo impredecible: una moneda que gira en el…

3 días ago

Detectan vulnerabilidad crítica en MLflow que permite ejecución remota de código

Una nueva vulnerabilidad crítica ha sido detectada en MLflow, la popular plataforma de código abierto…

4 días ago

Cómo generar contraseñas seguras con Python (y entender su nivel de seguridad)

Vivimos en un mundo cada vez más digital, donde gestionamos decenas (o incluso cientos) de…

1 semana ago

Cómo ejecutar JavaScript desde Python: Guía práctica con js2py

Aunque Python y JavaScript son lenguajes muy distintos en su propósito y ecosistema, no es…

2 semanas ago

¿Media, mediana o moda en variables ordinales? Guía práctica para el análisis de datos

Cuando comenzamos un análisis de datos, uno de los primeros pasos suele ser resumir las…

2 semanas ago

This website uses cookies.