Opinión

Curiosidad: ¿Por qué los datos “raros” son tan valiosos?

En estadística, los valores atípicos —también llamados outliers— son esos datos que se alejan “demasiado” del resto. Son los números que no encajan, los casos extremos, los que te hacen fruncir el ceño y preguntarte: ¿esto estará mal medido?

Durante años se nos ha enseñado a sospechar de los outliers. A corregirlos, suavizarlos o, directamente, eliminarlos del análisis.

Pero… ¿y si te dijera que, en muchos casos, los outliers no son errores, sino mensajes escondidos?

¿Qué es un outlier, exactamente?

Un outlier es un dato que se desvía notablemente del patrón general. Por ejemplo:

  • En una clase de 30 alumnos con notas entre 4 y 8, alguien saca un 0.
  • En un estudio de sueldos, donde casi todos ganan entre 25.000 y 50.000 €, aparece alguien con 800.000 €.
  • En un ensayo clínico, un paciente tiene una reacción completamente distinta al tratamiento que funciona en los demás.

Técnicamente, puede definirse como un valor que está más allá de 1.5 veces el rango intercuartílico, o más de 3 desviaciones estándar por encima o por debajo de la media.

Pero más allá de fórmulas, la idea es simple: es un dato que rompe las reglas y se sale de lo “normal”.

Lo raro no siempre es ruido. A veces es señal.

En muchos análisis, los outliers son molestos: distorsionan promedios, deforman gráficos, hacen que los modelos no encajen.

Pero otras veces, lo raro es justo lo más valioso.

  • En medicina, un paciente con una reacción inesperada puede revelar un subtipo de enfermedad, una mutación genética o un nuevo efecto secundario.
  • En finanzas, un pico extraño puede anticipar una crisis, una burbuja o una oportunidad de inversión.
  • En ciberseguridad, un comportamiento anómalo puede ser el primer indicio de un ataque.
  • En ciencia, muchos grandes descubrimientos empezaron con un dato que “no cuadraba”.

Un outlier puede ser un error. O puede ser una pista.

Casos famosos donde lo raro cambió el mundo

A lo largo de la historia, varios descubrimientos cruciales nacieron de algo que, al principio, parecía un simple error:

  • Alexander Fleming y la penicilina: una placa de Petri se contaminó con moho. En lugar de descartarla, Fleming notó que las bacterias no crecían a su alrededor. Lo que parecía un accidente fue el comienzo de los antibióticos.
  • Clyde Tombaugh y Plutón: el descubrimiento de Plutón en 1930 fue gracias a un pequeño punto que se movía raro entre miles de estrellas. Un outlier celeste.
  • El paciente cero: en epidemias, identificar al primer infectado —el caso raro, el que no encaja— permite reconstruir cómo comenzó todo. Un dato marginal que cambia el curso de una pandemia.

¿Qué hacer con un outlier?

No hay una regla única. Pero estas preguntas te pueden guiar:

  1. ¿Podría ser un error de entrada o de medición? Revisa bien antes de descartarlo.
  2. ¿Tiene sentido dentro del contexto? A veces apunta a una subcategoría, una excepción o una nueva hipótesis.
  3. ¿Está afectando demasiado los resultados? En ese caso, tal vez convenga usar modelos más robustos.

A veces eliminar un outlier es correcto. Otras veces, eliminarlo es borrar justo lo más interesante del fenómeno.

Una reflexión final: ¿y si lo raro es lo normal mal entendido?

En muchas disciplinas hemos elevado tanto lo “promedio” que olvidamos algo esencial: la realidad es compleja, y la normalidad es una construcción estadística, no una verdad absoluta.

Los outliers nos obligan a mirar de nuevo. A hacer preguntas incómodas. A reconsiderar lo que dábamos por sentado.

Porque al final, lo que se sale de la línea recta es lo que hace avanzar el conocimiento.

Nota: La imagen de este artículo fue generada utilizando un modelo de inteligencia artificial..

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez
Tags: Curiosidades

Recent Posts

Interés compuesto: la fuerza que multiplica tu dinero (y los errores que la anulan)

“El interés compuesto es la octava maravilla del mundo. El que lo entiende lo gana…

3 días ago

Cómo comparar datos con barras en Matplotlib: agrupadas, apiladas y porcentuales

Tienes los datos de ventas de tres productos en dos años distintos y quieres saber…

5 días ago

Costes hundidos en ciencia de datos: cuándo mantener un modelo y cuándo migrar

Imagina la situación. Tu equipo lleva tres años con un modelo en producción. No es…

1 semana ago

WOE e IV: La Base Matemática del Credit Scoring

Cuando un banco evalúa una solicitud de crédito necesita responder a una pregunta aparentemente simple:…

2 semanas ago

Lanzamiento de la versión 1.0 del laboratorio de Analytics Lane con nuevas herramientas de scoring

En el octavo aniversario de Analytics Lane seguimos ampliando nuestro laboratorio de aplicaciones interactivas y,…

2 semanas ago

¡Analytics Lane cumple ocho años!

Hoy, 2 de mayo de 2026, Analytics Lane cumple exactamente ocho años. Todo empezó con…

2 semanas ago

This website uses cookies.