En una entrada anterior se ha visto qué es la minería de datos y para que se utiliza. En esta entrada se van a estudiar los posibles tipos de análisis en minería de datos.
Tabla de contenidos
En minería de datos se pueden realizar diferentes tipos de análisis, los cuales se pueden clasificar en base a su complejidad. Estos básicamente se pueden dividir en seis categorías, ordenados de mayor a menor complejidad, son:
El análisis descriptivo es el más simple de todos, en este no se llega a crear un modelo en sí, pero los resultados obtenidos pueden ser utilizados para mejorar la compresión de los problemas planteados. Suelen ser el tipo de análisis que se realizan en las primeras fases de cara a aumentar la compresión de los datos disponibles.
Los análisis exploratorios son un paso más allá de los descriptivos, en estos ya se buscan relaciones entre los datos, pero estas no tienen por qué ser las respuestas directas a unos problemas de negocio. Mediante estos se pude llegar a comprender que dos variables están relacionadas, pero no obtener una fórmula que describa la forma exacta de esta relación.
En los análisis inferenciales ya se evalúan teorías. En estos casos se pueden comprobar las relaciones que existen entre las diferentes variables de las que se dispone en los conjuntos de datos.
Los análisis predictivos son aquellos en los que los modelos resultantes se pueden utilizar para realizar predicciones en ocasiones futuras eventos. Mediante estos análisis es posible predecir cómo se comportará un cliente, el mercado o un sistema ante una situación dada y poder anticipar la respuesta más adecuada en función de las necesidades.
Los análisis causales van más allá de las predicciones permitiendo relacionar las causas con los efectos y el grado en el que se afectan mutuamente. Este es un nivel de conocimiento mayor ya que no solamente se puede predecir el comportamiento de un cliente, el mercado o un sistema, sino que se pude identificar las caudas que llevan al mismo y actuar sobre ellas.
Finalmente, el tipo de análisis más complejo son los mecanicistas en los que se puede llegar a comprender los cambios que producen unas variables en resto. Este es el análisis que menos se realiza ya que para alcanzar el mismo es necesario una compresión profunda de los procesos a modelar, lo que no siempre es posible.
En esta entrada se han visto una categorización con los seis tipos de análisis que se utilizan en minería de datos. Ordenados de mayor a menor complejidad son: descriptivos, exploratorios, inferenciales, predictivos, causales o mecanicistas. La complejidad también indica la frecuencia con la que se utilizan, siendo menos utilizados los últimos.
La economía es una de las pocas disciplinas donde puedes proponer que el largo de…
Imagina que construyes un modelo de credit scoring y obtienes un Gini de 0,65. Un…
En un mundo donde los datos se han convertido en el lenguaje dominante de la…
Llevas un rato analizando datos y tienes cuatro gráficos abiertos en ventanas separadas: ventas, usuarios,…
Hace poco publiqué una entrada en la que trataba de un sesgo bien documentado: aferrarse…
En un entrada previa explicamos qué son el WOE y el IV y por qué…
This website uses cookies.