Ciencia de datos

¿Qué es el sesgo en aprendizaje automático?

En los procesos de toma de decisiones el término sesgo tiene generalmente connotaciones negativas. No es deseable que un proceso automático lo tenga de ningún tipo. La palabra sesgo procede de sesgar, un verbo que hace referencia a torcer o atravesar algo hacia uno de sus lados. Por lo que una decisión sesgada, que se tuerce en algún sentido, no es deseable. Los modelos de aprendizaje automático (“machine learnig”) no están exentos de este problema, ya que son desarrollados por personas. Así es importante conocer qué es el sesgo en aprendizaje automático y cómo se puede minimizar su aparición.

El sesgo en aprendizaje automático

El sesgo en aprendizaje automático, también conocido como sesgo de modelo, aparece cuando un modelo produce resultados erróneos de forma sistemática. La aparición de estos es debida a que los modelos son desarrollados por personas. Las cuales tiene tienen preferencias que transfieren a los modelos. Tanto sean conscientes como inconscientes. Muchas veces estas pueden pasar desapercibidos hasta que se los modelos se ponen en producción.

Origen de los sesgos

Una de las principales fuentes de sesgos de los modelos de aprendizaje automático son los procesos de capturar de datos. Estos datos que posteriormente se emplearán para el entrenamiento de los modelos. Un proceso cuyo resultado depende de la calidad, la objetividad y el tamaño de los conjuntos de datos empleados. Así, si los datos utilizados no son representan de forma objetiva la realidad, los modelos resultantes del proceso tendrán necesariamente sesgo.

Esto puede estar causado por una mala planificación del proceso por los responsables. O una falta de análisis crítico. Por lo que es importante saber cómo preguntar para evitar la aparición de sesgos.

Importancia de eliminar los sesgos

Los modelos de aprendizaje automático se utilizan diariamente para la toma de decisiones. Desde tareas triviales como qué anuncio se le presenta al visitante de una página web, hasta otras que pueden afectar a la vida de las personas como a quien se le concede un préstamo y a quien no. O, incluso, con implicaciones que pueden ser de vida y muerte como un diagnóstico médico.

Conclusiones

Es importante tomar consciencia del hecho que los modelos de aprendizaje automático pueden ser entrenados con sesgo. Por lo que es necesario poner en marcha todas las medidas posibles para evitarlo. La primera es garantizar que los datos utilizados son representativos de la realidad, no obtenidos únicamente en un subconjunto de la población en la que se van a aplicar. Una vez hecho esto los científicos de datos podrán desarrollar modelos que presenten el menor sesgo posible.

Es necesario recordar que los modelos de aprendizaje automático no piensan ni tienen sentimientos. Por lo que es una tarea de los científicos de datos pensar por ellos para evitar la existencia de sesgos.

Imágenes: Pixabay

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez

Recent Posts

Interés compuesto: la fuerza que multiplica tu dinero (y los errores que la anulan)

“El interés compuesto es la octava maravilla del mundo. El que lo entiende lo gana…

4 días ago

Cómo comparar datos con barras en Matplotlib: agrupadas, apiladas y porcentuales

Tienes los datos de ventas de tres productos en dos años distintos y quieres saber…

6 días ago

Costes hundidos en ciencia de datos: cuándo mantener un modelo y cuándo migrar

Imagina la situación. Tu equipo lleva tres años con un modelo en producción. No es…

2 semanas ago

WOE e IV: La Base Matemática del Credit Scoring

Cuando un banco evalúa una solicitud de crédito necesita responder a una pregunta aparentemente simple:…

2 semanas ago

Lanzamiento de la versión 1.0 del laboratorio de Analytics Lane con nuevas herramientas de scoring

En el octavo aniversario de Analytics Lane seguimos ampliando nuestro laboratorio de aplicaciones interactivas y,…

2 semanas ago

¡Analytics Lane cumple ocho años!

Hoy, 2 de mayo de 2026, Analytics Lane cumple exactamente ocho años. Todo empezó con…

2 semanas ago

This website uses cookies.