A la hora de crear un modelo de aprendizaje automático para clasificar las clases en una tarea dada existen múltiples familias de algoritmo. Se puede utilizar una regresión logística, unos árboles de decisión, unas máquinas de vectores de soporte (SVM), unos k-vecinos o redes neuronales. Pero no siempre se obtiene los resultados deseosos. En estas situaciones una solución puede … [Leer más...] acerca de Aprendizaje ensemble por votación mayoritaria
Machine learning
Machine Learning (Aprendizaje Automático o Aprendizaje Máquina) es la rama de la inteligencia artificial que estudia cómo construir sistemas que puedan aprender automáticamente de la experiencia. Esto es, sistemas que puedan realizar mejores predicciones o tomar mejores decisiones a medida que aumenta su experiencia.
Los algoritmos de Machine Learning se dividen en tres categorías en función de los datos utilizados: aprendizaje supervisado, aprendizaje no supervisado y aprendizaje por refuerzo. En aprendizaje supervisado se utilizan conjuntos de datos, durante el proceso de entrenamiento, en los que se conoce el valor que debe reproducir el modelo. Pudiéndose medir el desempeño de los modelos en base a lo bien que reproduce posteriormente estos valores en otros conjuntos de datos. Tal como se puede intuir del nombre, en el caso de aprendizaje no supervisado, no se busca que los modelos reproducen un valor concreto. Siendo el objetivo de estos modelos identificar patrones que permitan separar y clasificar los datos en diferentes grupos. Por otro lado, en aprendizaje por refuerzo se busca la creación de agentes que pueden realizar acciones sobre un entorno. Siendo este un aprendizaje completamente diferente a los dos anteriores.
Los conceptos de sesgo y varianza en aprendizaje automáticos
El sesgo y varianza son dos conceptos importantes a la hora de medir el error en los modelos de aprendizaje automático. Por eso es necesario comprender su significado para evaluar correctamente lo que nos dicen.Sesgo y varianza en estadísticaLa estadística es un área en la que se intenta extraer conclusiones de las poblaciones utilizando únicamente los datos de una … [Leer más...] acerca de Los conceptos de sesgo y varianza en aprendizaje automáticos
Random Forest
El algoritmo de Random Forest (también conocido como Bosques Aleatorios) es ampliamente utilizado para la creación de modelos supervisados. Basado en una idea simple: combinar diferentes árboles de decisión. Permite obtener modelos con menor propensión al sobreajuste que un árbol de decisión.El fundamento de Random ForestRandom Forest es básicamente un algoritmo de … [Leer más...] acerca de Random Forest
¿Qué es el sesgo en aprendizaje automático?
En los procesos de toma de decisiones el término sesgo tiene generalmente connotaciones negativas. No es deseable que un proceso automático lo tenga de ningún tipo. La palabra sesgo procede de sesgar, un verbo que hace referencia a torcer o atravesar algo hacia uno de sus lados. Por lo que una decisión sesgada, que se tuerce en algún sentido, no es deseable. Los modelos de … [Leer más...] acerca de ¿Qué es el sesgo en aprendizaje automático?
Seleccionar automáticamente los modelos en Python con GridSearchCV
Las clases GridSearchCV y RandomizedSearchCV de Scikit-learn pueden ser utilizadas para automatizar la selección de los parámetros de un modelo. Aplicando para ello la técnica de validación cruzada. Partiendo de un modelo y un conjunto de sus parámetros prueba múltiples combinaciones para identificar aquella que ofrece mayor rendimiento. Proceso que se ha visto en una entrada … [Leer más...] acerca de Seleccionar automáticamente los modelos en Python con GridSearchCV
Comparación entre la regresión logística y SVM (máquinas de vectores de soporte)
Unos de los problemas más habituales en aprendizaje automático son los problemas de clasificación. El objetivo en este tipo de problemas es asignar la clase correcta a cada uno de los registros de un conjunto de datos. Un caso particular de estos es la clasificación binaria, en el que solamente existen dos clases que suelen etiquetadas como verdadero y falso. Los algoritmos de … [Leer más...] acerca de Comparación entre la regresión logística y SVM (máquinas de vectores de soporte)
Regresión lineal en JavaScript con ml.js
JavaScript es uno de los lenguajes más populares actualmente. Esto se puede observar en el ranking de la encuesta anual que realiza a los desarrolladores Stack Overflow. En 2018, por sexto año consecutivo, JavaScript se ha situado como el lenguaje más popular. Dada su popularidad no es de extrañar que existan múltiples librerías para el desarrollo de modelos de aprendizaje … [Leer más...] acerca de Regresión lineal en JavaScript con ml.js
Implementación del método descenso del gradiente en Python
Una de las fases clave en los proyectos de aprendizaje automático es el entrenamiento de los modelos. El futuro rendimiento de los modelos dependerá en gran medida del éxito en esta fase. En esta es necesario identificar los parámetros de un modelo o método de aprendizaje automático con los que se consigue el máximo rendimiento sobre el conjunto de datos de entrenamiento. … [Leer más...] acerca de Implementación del método descenso del gradiente en Python
¿Qué es el análisis de clúster?
El término análisis de clúster hace referencia a la familia de algoritmos que permiten agrupar registros similares de un conjunto de datos en grupos. A cada uno de estos grupos es a lo que se denomina un clúster. El objetivo final del análisis es asignar a cada clúster los registros que son similares entre sí. Al mismo tiempo que los registros del resto de clústeres son … [Leer más...] acerca de ¿Qué es el análisis de clúster?
La exactitud y la precisión en modelos de clasificación
En los modelos de clasificación, unos de los indicadores que se utilizan para seleccionar uno u otro son la exactitud (en inglés “precision”) y la exhaustividad (en inglés “recall”). La exactitud y la exhaustividad son una forma simple de medir la calidad de las predicciones realizadas.La matriz de confusiónEn los problemas de clasificación los resultados se suelen … [Leer más...] acerca de La exactitud y la precisión en modelos de clasificación
Diferencias entre regresión y clasificación en aprendizaje automático
Dentro del aprendizaje automático existen dos grandes familias de algoritmos: el aprendizaje supervisado y el aprendizaje no supervisado. En la primera de ellos los modelos son entrenados a partir de un conjunto de datos en el que la respuesta correcta es conocida. Siendo la finalidad del entrenamiento conseguir que los modelos reproduzcan este a partir de las características … [Leer más...] acerca de Diferencias entre regresión y clasificación en aprendizaje automático
La interpretación de las redes neuronales
Las redes neuronales profundas han demostrado ser una de las herramientas más potentes a la hora de realizar predicciones. Existen pocas técnicas en el aprendizaje automático que permitan alcanzar el nivel de precisión que ofrecen estas. Por eso no es de extrañar que el número de casos de éxito en los que son utilizadas no haga más que aumentar. Aún así, su utilización es … [Leer más...] acerca de La interpretación de las redes neuronales