El algoritmo de Random Forest (también conocido como Bosques Aleatorios) es ampliamente utilizado para la creación de modelos supervisados. Basado en una idea simple: combinar diferentes árboles de decisión. Permite obtener modelos con menor propensión al sobreajuste que un árbol de decisión.
Random Forest es básicamente un algoritmo de bagging en el que se combinan diferentes árboles de decisión. Los cuales se obtienen tras un proceso de entrenamiento en el que se utiliza una muestra aleatoria diferente para cada uno de ellos. Obteniendo así una predicción diferente en cada uno de los árboles. La predicción final se obtiene mediante votación, seleccionado aquella opción que es reportada por una mayor cantidad de árboles. Esto permite obtener un modelo con una menor varianza.
A la hora de seleccionar los conjuntos de datos utilizados para el entrenamiento de cada uno de los árboles existen dos niveles de aleatoriedad.
Las principales ventajas de estos modelos frente a otras familias son:
Los algoritmos de Random Forest no son la mejor selección en todos los casos. Existen situaciones en las que su utilización puede ser contraproducente. Por ejemplo, se pueden enumerar las siguientes:
En la entrada se han explicado los fundamentos de un algoritmo para la creación de modelos supervisados ampliamente utilizado. Random Forest es permite obtener de una manera fácil y sin la necesidad de realizar suposiciones sobre el conjunto de datos modelos con una alta capacidad predictiva. En su contra se encuentra que no ofrecen la misma capacidad explicativa que lo los árboles de decisión.
Imágenes: Pixabay (Johannes Plenio)
En ciencia de datos y estadística, los promedios y porcentajes son herramientas fundamentales para resumir…
Las bases de datos son el corazón de casi cualquier sistema de información moderno. Ya…
En ciencia de datos, pocas cosas llaman más la atención de los científicos de datos…
Calcular adecuadamente el tamaño de la muestra es una parte esencial en el diseño de…
Hoy en día, cuando pensamos en ciencia de datos, lo primero que nos viene a…
Ampliar el espacio de almacenamiento en un sistema Linux es una tarea habitual y crítica…
This website uses cookies.