Opinión

Curiosidad: ¿Por qué los datos “raros” son tan valiosos?

En estadística, los valores atípicos —también llamados outliers— son esos datos que se alejan “demasiado” del resto. Son los números que no encajan, los casos extremos, los que te hacen fruncir el ceño y preguntarte: ¿esto estará mal medido?

Durante años se nos ha enseñado a sospechar de los outliers. A corregirlos, suavizarlos o, directamente, eliminarlos del análisis.

Pero… ¿y si te dijera que, en muchos casos, los outliers no son errores, sino mensajes escondidos?

¿Qué es un outlier, exactamente?

Un outlier es un dato que se desvía notablemente del patrón general. Por ejemplo:

  • En una clase de 30 alumnos con notas entre 4 y 8, alguien saca un 0.
  • En un estudio de sueldos, donde casi todos ganan entre 25.000 y 50.000 €, aparece alguien con 800.000 €.
  • En un ensayo clínico, un paciente tiene una reacción completamente distinta al tratamiento que funciona en los demás.

Técnicamente, puede definirse como un valor que está más allá de 1.5 veces el rango intercuartílico, o más de 3 desviaciones estándar por encima o por debajo de la media.

Pero más allá de fórmulas, la idea es simple: es un dato que rompe las reglas y se sale de lo “normal”.

Lo raro no siempre es ruido. A veces es señal.

En muchos análisis, los outliers son molestos: distorsionan promedios, deforman gráficos, hacen que los modelos no encajen.

Pero otras veces, lo raro es justo lo más valioso.

  • En medicina, un paciente con una reacción inesperada puede revelar un subtipo de enfermedad, una mutación genética o un nuevo efecto secundario.
  • En finanzas, un pico extraño puede anticipar una crisis, una burbuja o una oportunidad de inversión.
  • En ciberseguridad, un comportamiento anómalo puede ser el primer indicio de un ataque.
  • En ciencia, muchos grandes descubrimientos empezaron con un dato que “no cuadraba”.

Un outlier puede ser un error. O puede ser una pista.

Casos famosos donde lo raro cambió el mundo

A lo largo de la historia, varios descubrimientos cruciales nacieron de algo que, al principio, parecía un simple error:

  • Alexander Fleming y la penicilina: una placa de Petri se contaminó con moho. En lugar de descartarla, Fleming notó que las bacterias no crecían a su alrededor. Lo que parecía un accidente fue el comienzo de los antibióticos.
  • Clyde Tombaugh y Plutón: el descubrimiento de Plutón en 1930 fue gracias a un pequeño punto que se movía raro entre miles de estrellas. Un outlier celeste.
  • El paciente cero: en epidemias, identificar al primer infectado —el caso raro, el que no encaja— permite reconstruir cómo comenzó todo. Un dato marginal que cambia el curso de una pandemia.

¿Qué hacer con un outlier?

No hay una regla única. Pero estas preguntas te pueden guiar:

  1. ¿Podría ser un error de entrada o de medición? Revisa bien antes de descartarlo.
  2. ¿Tiene sentido dentro del contexto? A veces apunta a una subcategoría, una excepción o una nueva hipótesis.
  3. ¿Está afectando demasiado los resultados? En ese caso, tal vez convenga usar modelos más robustos.

A veces eliminar un outlier es correcto. Otras veces, eliminarlo es borrar justo lo más interesante del fenómeno.

Una reflexión final: ¿y si lo raro es lo normal mal entendido?

En muchas disciplinas hemos elevado tanto lo “promedio” que olvidamos algo esencial: la realidad es compleja, y la normalidad es una construcción estadística, no una verdad absoluta.

Los outliers nos obligan a mirar de nuevo. A hacer preguntas incómodas. A reconsiderar lo que dábamos por sentado.

Porque al final, lo que se sale de la línea recta es lo que hace avanzar el conocimiento.

Nota: La imagen de este artículo fue generada utilizando un modelo de inteligencia artificial..

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez
Tags: Curiosidades

Recent Posts

Analytics Lane lanza ScoreFlow, un SaaS para construir y desplegar scorecards de crédito

En Analytics Lane seguimos evolucionando nuestras herramientas y damos un paso más con el lanzamiento…

7 horas ago

DBSCAN y la selección de ε: teoría, intuición y aplicación práctica

Cuando hablamos de clustering, lo primero que viene a la mente suele ser k-means. Pero…

1 día ago

El bestiario de los indicadores económicos absurdos: El zoo patrio

Cualquier país desarrollado tiene sus propios indicadores folclóricos. España, por motivos que tienen mucho que…

6 días ago

Por qué el banco te ofrece un 3% TAE y no es lo que parece

Entras a la web de tu banco. En la página principal, un banner llamativo: “Depósito…

1 semana ago

Analytics Lane lanza la versión 1.3 del laboratorio con nuevas herramientas de evaluación de modelos y utilidades prácticas

Seguimos ampliando el laboratorio de Analytics Lane con el lanzamiento de la versión 1.3, disponible…

2 semanas ago

Augurios deportivos y portadas malditas, o cuando The Economist predice mejor al revés – El bestiario de los indicadores económicos absurdos (parte 3)

Cerramos la serie internacional con la categoría más estrambótica de todas: indicadores que predicen el…

2 semanas ago

This website uses cookies.