El algoritmo de Random Forest (también conocido como Bosques Aleatorios) es ampliamente utilizado para la creación de modelos supervisados. Basado en una idea simple: combinar diferentes árboles de decisión. Permite obtener modelos con menor propensión al sobreajuste que un árbol de decisión.
Random Forest es básicamente un algoritmo de bagging en el que se combinan diferentes árboles de decisión. Los cuales se obtienen tras un proceso de entrenamiento en el que se utiliza una muestra aleatoria diferente para cada uno de ellos. Obteniendo así una predicción diferente en cada uno de los árboles. La predicción final se obtiene mediante votación, seleccionado aquella opción que es reportada por una mayor cantidad de árboles. Esto permite obtener un modelo con una menor varianza.
A la hora de seleccionar los conjuntos de datos utilizados para el entrenamiento de cada uno de los árboles existen dos niveles de aleatoriedad.
Las principales ventajas de estos modelos frente a otras familias son:
Los algoritmos de Random Forest no son la mejor selección en todos los casos. Existen situaciones en las que su utilización puede ser contraproducente. Por ejemplo, se pueden enumerar las siguientes:
En la entrada se han explicado los fundamentos de un algoritmo para la creación de modelos supervisados ampliamente utilizado. Random Forest es permite obtener de una manera fácil y sin la necesidad de realizar suposiciones sobre el conjunto de datos modelos con una alta capacidad predictiva. En su contra se encuentra que no ofrecen la misma capacidad explicativa que lo los árboles de decisión.
Imágenes: Pixabay (Johannes Plenio)
En un entrada previa explicamos qué son el WOE y el IV y por qué…
Seguimos evolucionando el laboratorio de Analytics Lane y hoy lanzamos la versión 1.1, disponible en:…
“El interés compuesto es la octava maravilla del mundo. El que lo entiende lo gana…
Tienes los datos de ventas de tres productos en dos años distintos y quieres saber…
Imagina la situación. Tu equipo lleva tres años con un modelo en producción. No es…
Cuando un banco evalúa una solicitud de crédito necesita responder a una pregunta aparentemente simple:…
This website uses cookies.