• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Laboratorio
    • Estadística
      • Calculadora del Tamaño Muestral en Encuestas
      • Calculadora de estadísticos descriptivos
      • Test de normalidad
      • Calculadora de contrastes de hipotesis
      • Calculadora de tamano del efecto
      • Simulador de Regresión Lineal con Ruido
      • Visualizador de PCA
      • Visualizador de Series Temporales
      • Simulador de Regresión Logística
      • Simulador de K-Means
      • Simulador de DBSCAN
      • Detector de la Ley de Benford
    • Probabilidad
      • Calculadora de Probabilidad de Distribuciones
      • Calculadora de Probabilidades de Lotería
      • Simulador del Problema de Monty Hall
      • Simulador de la Estrategia Martingala
    • Finanzas
      • Calculadora de Préstamos e Hipotecas
      • Conversor TIN ↔ TAE
      • Calculadora DCA con ajuste por inflación
      • Calculadora XIRR con Flujos Irregulares
      • Simulador FIRE (Financial Independence, Retire Early)
    • Negocios
      • CLV
      • Scoring
    • Herramientas
      • Formateador / Minificador de JSON
      • Conversor CSV ↔ JSON
      • Comparador y Formateador de Texto y JSON
      • Formateador y Tester de Expresiones Regulares
      • Inspector de JWT
      • Generador y verificador de hashes
      • Codificador / Decodificador Base64 y URL
      • Conversor de bases numericas
      • Conversor de Timestamp Unix
      • Conversor de colores
      • Generador de UUIDs
    • Juegos
      • Tres en Raya
      • Nim con Q-Learning
    • Más
      • Método D’Hondt
      • Generador de Contraseñas Seguras
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • IA Generativa
  • Python
  • Pandas
  • NumPy
  • R
  • Excel

¿Qué métrica deberías mirar: exactitud, precisión o recall? Elegir bien empieza por entender el problema

marzo 17, 2026 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 5 minutos

En una entrada anterior vimos que no existen métricas buenas o malas para los modelos de clasificación, sino preguntas mal planteadas. Cada métrica mide algo distinto: el promedio de aciertos, la fiabilidad al predecir, la capacidad para no dejar escapar casos importantes…

Pero, una vez entendido eso, a la hora de evaluar un modelo de clasificación, surge la siguiente pregunta práctica:

¿Cuál debería usar en mi caso particular?

Y aquí es donde muchos proyectos tropiezan. No porque no sepan calcular métricas, sino porque intentan elegir la métrica mirando el modelo… en lugar de mirar el problema. El problema nos va a decir si lo importante son los aciertos, la fiabilidad o la capacidad para no dejar escapar casos, no el modelo.

Elegir una métrica no es una decisión técnica aislada. Es una decisión sobre qué tipo de error estás dispuesto a aceptar y cuál no.

Tabla de contenidos

  • 1 El primer paso no es técnico: es estratégico
  • 2 Caso 1: Cuando equivocarte al actuar es muy caro
  • 3 Caso 2: Cuando no actuar es lo verdaderamente peligroso
  • 4 Caso 3: Cuando el problema está equilibrado
  • 5 Caso 4: Cuando necesitas equilibrio entre no equivocarte y no dejar pasar nada
  • 6 Una pregunta más útil que cualquier métrica
  • 7 Cuando el problema no es solo técnico, sino humano
  • 8 No se trata de elegir una sola métrica
  • 9 La tentación de elegir la métrica más favorecedora para el modelo
  • 10 Elegir bien es entender el sistema completo
  • 11 Conclusiones: la métrica correcta es la que responde a tu pregunta real

El primer paso no es técnico: es estratégico

Antes de importar funciones de evaluación o calcular nada, conviene responder a una pregunta muy simple:

¿Qué error sería más grave en este sistema?

No el más frecuente. No el más incómodo. El más grave. Porque no todos los errores tienen el mismo impacto en el problema que se desea resolver. Un falso positivo puede ser molesto. Un falso negativo puede ser peligroso. Y a veces ocurre justo al revés.

Nuevo test de normalidad interactivo en el laboratorio de Analytics Lane
En Analytics Lane
Nuevo test de normalidad interactivo en el laboratorio de Analytics Lane

La métrica adecuada no depende del algoritmo. Depende de las consecuencias de este en nuestro problema.

Caso 1: Cuando equivocarte al actuar es muy caro

Imagina un sistema que bloquea automáticamente operaciones con tarjetas bancarias por posible fraude.

Si el sistema bloquea una tarjeta legítima:

  • el usuario se enfada
  • el banco recibe reclamaciones
  • la confianza disminuye

En este caso, el problema no es dejar pasar algún fraude ocasional. El problema es actuar sin motivo suficiente.

Aquí la pregunta clave es:

“Cuando digo que hay fraude, ¿suele ser verdad?”

Esa es exactamente la pregunta que responde la precisión.

Cuando el coste de un falso positivo es alto, la precisión debe ser una métrica central. No implica ignorar el resto, pero sí priorizar la fiabilidad al actuar.

Publicidad


Caso 2: Cuando no actuar es lo verdaderamente peligroso

Ahora cambiemos de escenario. Un sistema que detecta posibles tumores en imágenes médicas.

Si el sistema no detecta un tumor real:

  • el diagnóstico se retrasa
  • el tratamiento se complica
  • el riesgo aumenta

Aquí el error más grave no es alarmar de más. Es no detectar lo que está ahí.

La pregunta relevante cambia:

“De todos los casos que realmente son problemáticos, ¿cuántos detecto?”

Eso es exactamente lo que mide el recall.

En contextos donde el coste de perder un caso es alto, el recall se convierte en la prioridad.

Caso 3: Cuando el problema está equilibrado

Hay situaciones en las que:

  • las clases están más o menos equilibradas
  • el coste de equivocarse en un sentido u otro es similar
  • el modelo no activa acciones drásticas

Por ejemplo, clasificar noticias por categoría, ordenar comentarios por tema o etiquetar imágenes.

En estos casos, mirar el promedio de aciertos puede ser razonable. Aquí la exactitud tiene sentido como métrica de referencia general.

Pero, incluso en estos casos, conviene revisar que el modelo no esté funcionando bien para unas clases y mal para otras.

Caso 4: Cuando necesitas equilibrio entre no equivocarte y no dejar pasar nada

Muchos problemas no presenta casos extremos en cuanto a los tipos de errores. No se trata solo de evitar falsos positivos ni solo de detectar todo. Se trata de encontrar un punto intermedio.

Por ejemplo:

  • sistemas de moderación de contenido
  • detección de spam
  • recomendaciones sensibles

Aquí puede tener sentido mirar una métrica que combine precisión y recall, como el F1-score, para asegurarte de que no estás sacrificando completamente uno en favor del otro.

Pero hay que recordar que el equilibrio no siempre es neutral. A veces, el problema puede exigir inclinarse ligeramente hacia uno de los dos lados.

Publicidad


Una pregunta más útil que cualquier métrica

Hay una forma muy práctica de decidir qué métrica priorizar. Preguntarse:

Si este sistema se equivoca 100 veces, ¿qué tipo de error preferiría que cometiera?

  • ¿Que moleste 100 veces sin motivo?
  • ¿Que deje pasar 100 casos importantes?
  • ¿Que reparta los errores de forma equilibrada?

La respuesta a esa pregunta casi siempre señala la métrica que debería tener más peso en la evaluación.

Cuando el problema no es solo técnico, sino humano

Las métricas no viven en el vacío. Viven en sistemas donde hay personas. Un modelo con recall altísimo puede ser ignorado si genera demasiadas alertas. Un modelo con precisión altísima puede ser irrelevante si casi nunca interviene.

Por eso, elegir métricas también implica pensar en:

  • la experiencia del usuario
  • la tolerancia al error
  • la confianza en el sistema

A veces, el mejor modelo en métricas no es el mejor modelo en uso real.

No se trata de elegir una sola métrica

Otro error frecuente es buscar “la métrica correcta” como si fuera única. En la práctica, lo más sensato suele ser:

  • elegir una métrica principal alineada con el objetivo
  • complementarla con otras que aporten contexto

Por ejemplo:

  • priorizar recall, pero vigilar la precisión
  • priorizar la precisión, pero controlar el recall
  • usar la exactitud como referencia general

Las métricas no deben competir entre sí. Deben ayudarnos a entender distintas dimensiones del comportamiento del modelo.

Publicidad


La tentación de elegir la métrica más favorecedora para el modelo

Hay una trampa muy humana que puede aparecer al seleccionar la métrica. Cuando entrenamos un modelo y vemos varias métricas, es tentador destacar aquella en la que mejor sale. Por ejemplo, una exactitud del 90 % porque las clases están muy desbalanceadas. Es fácil justificarlo después: “esta es la más adecuada para el problema, porque…”.

Pero, si la métrica no fue elegida antes de entrenar, la decisión pierde objetividad. Se escogió el mejor número, pero no la métrica más adecuada.

La decisión sobre qué métrica importa más para nuestro problema debería tomarse antes de ver los resultados. Porque en ese momento es cuando aún estamos pensando en el problema, no en defender el modelo.

Elegir bien es entender el sistema completo

Al final, elegir una métrica no es una cuestión matemática. Es una cuestión de diseño del sistema.

Implica preguntarse:

  • ¿Qué decisiones se toman con este modelo?
  • ¿Qué ocurre cuando se equivoca?
  • ¿Quién sufre las consecuencias?
  • ¿Qué error es más tolerable?

La métrica adecuada no es la más sofisticada ni la más popular. Es la que mejor refleja el tipo de error que realmente importa en tu contexto.

Conclusiones: la métrica correcta es la que responde a tu pregunta real

Si en la primera entrada vimos que cada métrica responde a una pregunta distinta, en esta la conclusión es clara:

La métrica correcta no depende del algoritmo.
Depende del problema que estás intentando resolver.

Elegir métricas no es un trámite técnico. Es una decisión estratégica sobre cómo defines el éxito de tu modelo a la hora de resolver el problema para el que se creó.

Y cuando esa definición es clara, las métricas dejan de ser números aislados y se convierten en herramientas útiles para construir sistemas mejores.

Nota: La imagen de este artículo fue generada utilizando un modelo de inteligencia artificial.

¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 0 / 5. Votos emitidos: 0

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicidad


Publicaciones relacionadas

  • Nuevo test de normalidad interactivo en el laboratorio de Analytics Lane
  • Nuevo conversor de timestamp Unix en el laboratorio de Analytics Lane
  • Calculadora de Contrastes de Hipótesis: interpreta correctamente el p-valor y toma decisiones estadísticas con confianza
  • Calculadora de Tamaño del Efecto: la herramienta clave para entender cuánto importa realmente una diferencia
  • Simulador de DBSCAN: descubre cómo encontrar clusters reales (y ruido) sin fijar K
  • Conversor de Colores: convierte, compara y valida cualquier color en tiempo real
  • Analytics Lane lanza su Generador de UUIDs: identificadores únicos, seguros y listos para producción en segundos
  • 1200 publicaciones en Analytics Lane
  • Analytics Lane lanza su Conversor TIN ↔ TAE: la herramienta definitiva para entender el coste real de depósitos, préstamos e hipotecas

Publicado en: Ciencia de datos Etiquetado como: Machine learning

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Bluesky
  • Facebook
  • GitHub
  • Instagram
  • Mastodon
  • Pinterest
  • RSS
  • Telegram
  • Tumblr
  • Twitter
  • YouTube

Publicidad

Entradas recientes

Interés compuesto: la fuerza que multiplica tu dinero (y los errores que la anulan)

mayo 14, 2026 Por Daniel Rodríguez

Cómo comparar datos con barras en Matplotlib: agrupadas, apiladas y porcentuales

mayo 12, 2026 Por Daniel Rodríguez

Costes hundidos en ciencia de datos: cuándo mantener un modelo y cuándo migrar

mayo 7, 2026 Por Daniel Rodríguez

Publicidad

Es tendencia

  • Error: No se puede cargar el archivo porque la ejecución de scripts está deshabilitada en este sistema Solución a los problemas de ejecución de scripts en Windows 11 cuando se da el mensaje: “No se puede cargar el archivo porque la ejecución de scripts está deshabilitada en este sistema” publicado el febrero 14, 2024 | en Herramientas
  • El método de la bisección e implementación en Python publicado el marzo 11, 2022 | en Ciencia de datos
  • Probabilidad básica: cómo entender el azar en nuestra vida diaria publicado el junio 24, 2025 | en Ciencia de datos, Opinión
  • Cerca La regresión logística publicado el julio 23, 2018 | en Ciencia de datos
  • Creación de gráficos animados con Python publicado el mayo 4, 2020 | en Python

Publicidad

Lo mejor valorado

4.9 (24)

Seleccionar filas y columnas en Pandas con iloc y loc

4.6 (16)

Archivos JSON con Python: lectura y escritura

4.4 (14)

Ordenación de diccionarios en Python mediante clave o valor

4.7 (13)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.9 (11)

Pandas: Cambiar los tipos de datos en los DataFrames

Comentarios recientes

  • bif en JSON en bases de datos: cuándo es buena idea y cuándo no
  • bif en Cómo desinstalar Oracle Database 19c en Windows
  • M. Pilar en Cómo eliminar las noticias en Windows 11 y recuperar tu concentración
  • Daniel Rodríguez en Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • Pepe en Probabilidad básica: cómo entender el azar en nuestra vida diaria

Publicidad


Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2026 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto