Hoy en día es habitual someterse a múltiples pruebas o tests y, por tanto, recibir con frecuencia una confirmación como esta: «Tu test ha dado positivo». En ese momento, da igual el tipo de prueba: la detección de un contaminante, un sensor de seguridad o una prueba médica rutinaria. Nuestra atención se fija inmediatamente en esa palabra: positivo.
Y entonces la mente empieza a rellenar los huecos: «¿Significa esto que realmente tengo el problema? ¿Hasta qué punto puedo confiar en este resultado? ¿Puede estar equivocándose?»
Estos pensamientos son completamente normales. Vivimos rodeados de tests y sistemas de detección. No solo los que se realizan en laboratorios o centros de salud, sino también sensores que deciden si debe sonar una alarma, sistemas automáticos que clasifican paquetes, detectores de billetes falsos, filtros de spam en el correo electrónico, algoritmos que marcan una transacción como sospechosa o radares que detectan excesos de velocidad.
Todos estos sistemas tienen algo en común: se equivocan. Ninguno ofrece certezas del 100 %. Sin embargo, en nuestra vida cotidiana solemos interpretar sus resultados como si fueran definitivos: positivo igual a verdadero, negativo igual a falso.
La realidad, sin embargo, es mucho más compleja… y también más fascinante.
En esta entrada te guiaré por ese territorio. Veremos por qué un resultado no es un simple “sí” o “no”, qué factores influyen realmente en la fiabilidad de un test, cómo la prevalencia cambia por completo la interpretación de un resultado y por qué un sistema con un 99 % de precisión puede decirnos una cosa… aunque la realidad sea la contraria.
Prepárate para descubrir cómo funcionan realmente los tests y, sobre todo, cómo interpretarlos sin caer en trampas intuitivas.
Tabla de contenidos
Nuestro cerebro no está diseñado para pensar en términos probabilísticos. Requiere entrenamiento y, aun así, incluso la intuición de un estadístico experimentado puede fallar. El cerebro prefiere historias simples: blanco o negro, sí o no, funciona o no funciona. Cuando vemos una luz roja en una máquina, asumimos que hay un fallo. Cuando una alarma no suena, damos por hecho que todo está bien.
La estadística, en cambio, habita en una zona gris. Habla de porcentajes, errores e incertidumbre. Puede resultar incómoda, pero también es liberadora: entender la naturaleza probabilística de los tests nos permite tomar mejores decisiones.
Aquí aparece una idea clave: no basta con conocer la precisión del test. También importa el contexto en el que se aplica. Y ahí entra en juego uno de los conceptos más importantes —y menos conocidos— para el público general: la prevalencia.
Antes de llegar a ella, necesitamos sentar las bases: falsos positivos, falsos negativos, sensibilidad y especificidad. No te preocupes: lo haremos de forma intuitiva.
Cualquier prueba que clasifica algo como “positivo” o “negativo” puede equivocarse de dos maneras.
El test dice “positivo”, pero la realidad dice “no”.
Ejemplos cotidianos:
El problema aquí es que el test ve peligro donde no lo hay.
El test dice “negativo”, pero la realidad dice “sí”.
Ejemplos:
Este error suele ser más peligroso: no detectar algo que sí está presente.
El error es algo inherente a cualquier proceso de medición o predicción. Siempre que intentamos clasificar, detectar o anticipar un fenómeno, existe la posibilidad de equivocarnos. Ahora bien, la probabilidad de que ese error ocurra no es aleatoria: depende directamente de las características del test que estemos utilizando.
En particular, hay dos conceptos fundamentales que determinan hasta qué punto un test es fiable y nos permiten anticipar cómo y cuándo puede fallar: la sensibilidad y la especificidad. Aunque estos términos suenen técnicos, en realidad son fáciles de comprender si pensamos con claridad qué mide cada uno y en qué situaciones entran en juego.
La sensibilidad mide la capacidad del test para detectar los casos reales.
Sensibilidad = Probabilidad de que el test dé positivo si la condición está presente.
En términos simples:
Una analogía útil es la de un dispositivo que debe detectar objetos peligrosos en una cinta transportadora. Si este es muy sensible detectará casi todo. Puede ser algo exagerado, pero rara vez dejará pasar un objeto peligroso.
La especificidad mide la capacidad del test para no generar falsos positivos.
Especificidad = Probabilidad de que el test dé negativo si la condición NO está presente.
En palabras sencillas:
Piensa en un detector de billetes falsos: si tiene buena especificidad, solo marcará como sospechosos los billetes realmente falsos y no “acusará” a billetes auténticos por pequeños defectos.
Aquí aparece uno de los errores más comunes:
«Si un test tiene un 99 % de sensibilidad y un 99 % de especificidad, entonces un resultado positivo significa que tengo un 99 % de probabilidad de que sea cierto».
Esto no es correcto. De hecho, puede ser completamente falso. Falta una pieza clave: la frecuencia real del fenómeno, es decir, su prevalencia.
La prevalencia es la proporción real de casos en una población.
Por ejemplo:
¿Por qué es tan importante? Porque determina cuántos casos reales existen antes de aplicar el test.
Aquí aparece una idea contraintuitiva:
Cuando la prevalencia es muy baja, incluso un test excelente puede generar tantos falsos positivos como verdaderos positivos.
Veámoslo con números.
Supongamos una condición X que aparece en el 1 % de la población y un test con:
En una población de 10.000 personas:
Resultados del test:
Entre quienes sí tienen la condición:
Entre quienes no la tienen:
Resultado final:
La probabilidad real de que un positivo sea verdadero es del 50 %.
Ahora la condición aparece en el 10 %:
Resultados:
Ahora, de 1080 positivos totales:
La probabilidad de que un positivo sea verdadero es aproximadamente del 91,7 %.
Los tests son linternas que iluminan la realidad, pero no la muestran completa. Un resultado positivo no equivale a un diagnóstico, ni uno negativo garantiza seguridad absoluta.
Interpretar correctamente un test requiere entender qué sabíamos antes de realizarlo.
Aceptar que vivimos en un mundo probabilístico no nos debilita: nos permite tomar decisiones más razonables, más informadas y, en última instancia, más humanas.
Nota: Las imágenes de este artículo fueron generadas utilizando un modelo de inteligencia artificial.
En un entrada previa explicamos qué son el WOE y el IV y por qué…
Seguimos evolucionando el laboratorio de Analytics Lane y hoy lanzamos la versión 1.1, disponible en:…
“El interés compuesto es la octava maravilla del mundo. El que lo entiende lo gana…
Tienes los datos de ventas de tres productos en dos años distintos y quieres saber…
Imagina la situación. Tu equipo lleva tres años con un modelo en producción. No es…
Cuando un banco evalúa una solicitud de crédito necesita responder a una pregunta aparentemente simple:…
This website uses cookies.