Las clases GridSearchCV y RandomizedSearchCV de Scikit-learn pueden ser utilizadas para automatizar la selección de los parámetros de un modelo. Aplicando para ello la técnica de validación cruzada. Partiendo de un modelo y un conjunto de sus parámetros prueba múltiples combinaciones para identificar aquella que ofrece mayor rendimiento. Proceso que se ha visto en una entrada … [Leer más...] acerca de Seleccionar automáticamente los modelos en Python con GridSearchCV
Scikit-Learn
Automatización del procesado de datos en Scikit-learn con Pipeline
En aprendizaje automático la creación de un modelo es un proceso complejo que requiere llevar a cabo múltiples pasos. Siendo la preparación de los datos uno de los que más tiempo requiere. Tras la obtención de un conjunto de datos es necesario aplicarle a este diferentes operaciones antes de poder utilizar un estimador. A modo de ejemplo algunas de las operaciones más … [Leer más...] acerca de Automatización del procesado de datos en Scikit-learn con Pipeline
Algunas librerías interesantes de Python para ciencia de datos
En una entrada anterior se recopilaron las cuatro librerías más importantes de Python para los científicos de datos. En esta entrada se van a ver otras seis librerías también interesantes de Python para ciencia de datos. Cada una de ellas permite trabajar en un tipo de problema concreto.imbalanced-learnEl entrenamiento de los algoritmos de clasificación funciona mejor … [Leer más...] acerca de Algunas librerías interesantes de Python para ciencia de datos
Cuatro librerías para ciencia de datos en Python
Hoy en día Python es uno de los lenguajes de referencia para los científicos de datos. En él se pueden implementar desde los análisis de datos más básicos hasta los modelos de aprendizaje automático más avanzados. Permitiendo llevar estos posteriormente a directamente a producción de una forma fácil. Esta popularidad es debida a múltiples factores. Entre ellos se puede destacar … [Leer más...] acerca de Cuatro librerías para ciencia de datos en Python
GridSearchCV
GridSearchCV es una clase disponible en scikit-learn que permite evaluar y seleccionar de forma sistemática los parámetros de un modelo. Indicándole un modelo y los parámetros a probar, puede evaluar el rendimiento del primero en función de los segundos mediante validación cruzada. En caso de que se desee evaluar modelos con parámetros aleatorios existe el método … [Leer más...] acerca de GridSearchCV