• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Herramientas
    • Método D’Hondt – Atribución de escaños
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad
    • Tiendas afiliadas
      • AliExpress
      • Amazon
      • Banggood
      • GeekBuying
      • Lenovo

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • Python
  • Pandas
  • NumPy
  • Matlab
  • Julia
  • Excel
  • IA Generativa

Aprendizaje supervisado y aprendizaje no supervisado

julio 13, 2018 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 4 minutos

Aprendizaje supervisado y no supervisado

Los modelos de aprendizaje automático se pueden dividir en dos grandes familias: aprendizaje supervisado y aprendizaje no supervisado. La principal diferencia entre estas dos familias se encuentra en los datos de entrenamiento. En el aprendizaje supervisado los resultados que se desean obtener del modelo son conocidos previamente. Siendo utilizados para guiar su entrenamiento. Por otro lado, en el aprendizaje no supervisado el resultado deseado no se utiliza durante el entrenamiento. En la mayoría de los casos tampoco se conoce previamente, siendo descubierto durante el proceso aprendizaje.

Tabla de contenidos

  • 1 Aprendizaje supervisado
    • 1.1 Clasificación
    • 1.2 Regresión
    • 1.3 Proceso de entrenamiento
  • 2 Aprendizaje no supervisado
    • 2.1 Aprendizaje por refuerzo
  • 3 Conclusiones

Aprendizaje supervisado

En el entrenamiento de los algoritmos de aprendizaje supervisado, además de los datos necesarios para realizar la predicción, es necesario disponer de una característica objetivo para cada una de las instancias. Siendo este el valor que el modelo ha de reproducir. Pudiendo ser este un valor tanto de tipo numérico como categórico. Una vez finalizado el proceso de entrenamiento, el valor objetivo ya no es necesario, ya que es la predicción que realiza el modelo. Solamente son necesarias el resto de las características. A partir de este momento, el valor objetivo únicamente se suele utilizar en los procesos de validación. Para comprobar si el modelo sigue siendo valido.

Publicidad


Clasificación

El aprendizaje supervisado es bastante común en problemas de clasificación en los que se desea obtener una categoría. Por ejemplo, son adecuados para la detección del fraude. En estos problemas se utilizan todos los datos de una operación y se busca predecir si esta es fraudulenta o legitima. Otro problema típico es el reconocimiento de caracteres en imágenes. En estos la entrada es un mapa de bits y el resultado es cualquiera de los posibles caracteres de un alfabeto.

Consistencia en nombres y orden en TypeScript: la base de un código mantenible aplicado a tslane
En Analytics Lane
Consistencia en nombres y orden en TypeScript: la base de un código mantenible aplicado a tslane

Regresión

Otras situaciones en los que el aprendizaje supervisado es bastante habitual son en los problemas de regresión. En estos se intenta predecir un valor continuo. Por ejemplo, se puede intentar predecir las unidades producidas en una factoría en base a diferentes factores que afecten a esta. En general, el aprendizaje supervisado es adecuado para los problemas en los que se puede conocer, por lo menos para el conjunto de datos de entrenamiento, el valor o categoría que le corresponde a cada uno de los registros.

Publicidad


Proceso de entrenamiento

Independientemente del problema, el aprendizaje se realiza mediante la minimización del error que comente el modelo sobre el conjunto de datos de entrenamiento. Aunque solamente minimizando el error no se puede garantizar un aprendizaje correcto. Pudiendo suceder que el modelo memorice los resultados, lo que se conoce como sobreajuste. Al memorizar los datos de entrenamiento la precisión obtenida es muy alta en este conjunto, pero suele ser baja fuera de los mismos. Este efecto se observa cuando el modelo utilizado es demasiado complejo para los datos. Por otro lado, cuando en los datos una de las categorías domina sobre el resto, el modelo puede asignar todas las respuestas a la clase mayoritaria para minimizar el error. Esto es lo que se conoce como el problema de desequilibrio de clases.

El sobreajuste se resuelve reduciendo la complejidad del modelo, lo que conduce a modelos menos precisos en el conjunto de entrenamiento. Pero más realistas precisos en otros conjuntos de datos. Para el problema de desequilibrio de clases es necesario equilibrar las clases en las muestras.

Aprendizaje no supervisado

A diferencia de los algoritmos de aprendizaje supervisado, en los no supervisados no es necesario disponer de la respuesta correcta en los datos de entrenamiento. Ya que no se busaca la reproducción de un resultado conocido, sino el descubrimiento de nuevos patrones o resultados.

Estos problemas aparentan ser más complejos que los anteriores. Ya que se espera que el modelo aprenda sin decirle el qué. Los problemas más habituales en este tipo de aprendizaje son los de clúster. En estos se busca grupos de registros que son similares entres si y, al mismo tiempo, diferentes del resto. Una vez obtenidos los grupos se le ha de asignar una clasificación a cada uno, la cual puede ser conocida o no antes de entrenar el modelo. Lo que muchas veces lleva al descubrimiento de patrones desconocidos. Por ejemplo, en una tienda la agrupación de clientes puede llevar a diferencias entre los clientes fieles o de conveniencia. Descubriendo al mismo tiempo otras categorías de estos que se desconocían previamente. Estos nuevos grupos se pueden utilizar posteriormente para realizar campañas especificas al poder identificar sus intereses y preferencias comunes.

Publicidad


Aprendizaje por refuerzo

Otro de los problemas habituales de este tipo son los que se resuelven mediante el aprendizaje por refuerzo. En estos problemas no se conoce la solución y la forma de entrenar el modelo es mediante la introducción de refuerzos positivos o negativos en función en función de los resultados. Provocando de esta forma que el modelo pueda tomar una decisión, no predecir una categoría o un valor numérico.  

La utilizad de este enfoque se encuentra en problemas para los que se puede asignar una recompensa o penalizaciones, pero no se conoce cómo llegar al resultado. El mejor proceso para llegar al resultado es lo que lo descubre el algoritmo, ya que conoce las recompensa o la penalización asociada a cada una de sus posibles acciones y resultados. Una de sus posibles aplicaciones es en juegos, por ejemplo, el ajedrez. En estas el modelo conoce el valore de cada pieza y las posibles recompensas de sus acciones.

Conclusiones

En esta entrada se ha visto la diferencia entre las principales familias de aprendizaje que existen en el aprendizaje automático: aprendizaje supervisado y aprendizaje no supervisado. En el caso del supervisado se lo que se busca es reproducir un valor conocido en un conjunto de datos de entrenamiento. Por otro lado, en el no supervisado lo que se intenta encontrar patrones nuevos, que en muchos casos no son conocidos antes de entrenar el modelo.

¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 5 / 5. Votos emitidos: 4

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicidad


Publicaciones relacionadas

  • Consistencia en nombres y orden en TypeScript: la base de un código mantenible aplicado a tslane
  • Análisis de Redes con Python
  • Nuevo calendario de publicaciones: más calidad, mejor ritmo
  • Probabilidad básica: cómo entender el azar en nuestra vida diaria
  • Cómo eliminar las noticias en Windows 11 y recuperar tu concentración
  • Publicaciones de verano 2025: los trucos más populares, ahora en vídeo
  • Cómo enviar correos desde PowerShell utilizando Brevo: Guía paso a paso para automatizar tus notificaciones
  • Nueva herramienta disponible: Calculadora del Método D’Hondt para la atribución de escaños
  • Cómo enviar correos desde Python utilizando Brevo: Automatiza tus notificaciones con scripts eficientes

Publicado en: Ciencia de datos Etiquetado como: Aprendizaje no supervisado, Aprendizaje supervisado, Machine learning

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Bluesky
  • Facebook
  • GitHub
  • Instagram
  • Mastodon
  • Pinterest
  • RSS
  • Telegram
  • Tumblr
  • Twitter
  • YouTube

Publicidad

Entradas recientes

¡Nuevo video! Gráficos de barras en Matplotlib sin complicarte

julio 17, 2025 Por Daniel Rodríguez

¡Nuevo video! Iterar filas en Pandas sin romperte la cabeza

julio 15, 2025 Por Daniel Rodríguez

¡Nuevo video! Encuentra la posición en listas como un PRO

julio 10, 2025 Por Daniel Rodríguez

Publicidad

Es tendencia

  • Obtención de valores únicos de una columna con Pandas publicado el mayo 8, 2019 | en Python
  • Cómo encontrar la posición de elementos en una lista de Python publicado el abril 12, 2021 | en Python
  • Combinar varios archivos Jupyter Notebook en uno publicado el noviembre 21, 2022 | en Python
  • Gráficos de barras en Matplotlib publicado el julio 5, 2022 | en Python
  • pandas Pandas: Cómo iterar sobre las filas de un DataFrame en Pandas publicado el septiembre 13, 2021 | en Python

Publicidad

Lo mejor valorado

4.9 (24)

Seleccionar filas y columnas en Pandas con iloc y loc

4.6 (16)

Archivos JSON con Python: lectura y escritura

4.4 (14)

Ordenación de diccionarios en Python mediante clave o valor

4.7 (13)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.5 (10)

Diferencias entre var y let en JavaScript

Publicidad

Comentarios recientes

  • Piera en Ecuaciones multilínea en Markdown
  • Daniel Rodríguez en Tutorial de Mypy para Principiantes
  • Javier en Tutorial de Mypy para Principiantes
  • javier en Problemas con listas mutables en Python: Cómo evitar efectos inesperados
  • soldado en Numpy básico: encontrar la posición de un elemento en un Array de Numpy

Publicidad


Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2025 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto