Ciencia de datos

Tipos de análisis en minería de datos

En una entrada anterior se ha visto qué es la minería de datos y para que se utiliza. En esta entrada se van a estudiar los posibles tipos de análisis en minería de datos.

Posibles análisis en minería de datos

En minería de datos se pueden realizar diferentes tipos de análisis, los cuales se pueden clasificar en base a su complejidad. Estos básicamente se pueden dividir en seis categorías, ordenados de mayor a menor complejidad, son:

  • Descriptivos: descripción cualitativa de las principales características de los datos.
  • Exploratorios: análisis de los datos en búsqueda de relaciones desconocidas.
  • Inferenciales: evaluación de la validez de teorías en muestras de los datos.
  • Predictivos: análisis de los datos presentes para obtener predicciones para ser utilizadas en la predicción de eventos futuros.
  • Causales: estudia el efecto en una variable al cambiar otra.
  • Mecanicistas: comprensión de los cambios que se produce en las variables y el efecto que producen en otras variables.

Análisis descriptivo

El análisis descriptivo es el más simple de todos, en este no se llega a crear un modelo en sí, pero los resultados obtenidos pueden ser utilizados para mejorar la compresión de los problemas planteados. Suelen ser el tipo de análisis que se realizan en las primeras fases de cara a aumentar la compresión de los datos disponibles.

Análisis exploratorios

Los análisis exploratorios son un paso más allá de los descriptivos, en estos ya se buscan relaciones entre los datos, pero estas no tienen por qué ser las respuestas directas a unos problemas de negocio. Mediante estos se pude llegar a comprender que dos variables están relacionadas, pero no obtener una fórmula que describa la forma exacta de esta relación.

Análisis inferenciales

En los análisis inferenciales ya se evalúan teorías. En estos casos se pueden comprobar las relaciones que existen entre las diferentes variables de las que se dispone en los conjuntos de datos.

Análisis predictivos

Los análisis predictivos son aquellos en los que los modelos resultantes se pueden utilizar para realizar predicciones en ocasiones futuras eventos. Mediante estos análisis es posible predecir cómo se comportará un cliente, el mercado o un sistema ante una situación dada y poder anticipar la respuesta más adecuada en función de las necesidades.

Análisis causales

Los análisis causales van más allá de las predicciones permitiendo relacionar las causas con los efectos y el grado en el que se afectan mutuamente. Este es un nivel de conocimiento mayor ya que no solamente se puede predecir el comportamiento de un cliente, el mercado o un sistema, sino que se pude identificar las caudas que llevan al mismo y actuar sobre ellas.

Análisis mecanicistas

Finalmente, el tipo de análisis más complejo son los mecanicistas en los que se puede llegar a comprender los cambios que producen unas variables en resto. Este es el análisis que menos se realiza ya que para alcanzar el mismo es necesario una compresión profunda de los procesos a modelar, lo que no siempre es posible.

Conclusiones

En esta entrada se han visto una categorización con los seis tipos de análisis que se utilizan en minería de datos. Ordenados de mayor a menor complejidad son: descriptivos, exploratorios, inferenciales, predictivos, causales o mecanicistas. La complejidad también indica la frecuencia con la que se utilizan, siendo menos utilizados los últimos.

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez

Recent Posts

Calibración vs Discriminación en Credit Scoring: diferencias clave y cómo evaluarlas

Imagina que construyes un modelo de credit scoring y obtienes un Gini de 0,65. Un…

3 días ago

Ley de Benford: cómo detectar datos manipulados con ejemplos reales

En un mundo donde los datos se han convertido en el lenguaje dominante de la…

1 semana ago

Subplots en Matplotlib: cómo organizar múltiples gráficos en una sola figura

Llevas un rato analizando datos y tienes cuatro gráficos abiertos en ventanas separadas: ventas, usuarios,…

2 semanas ago

Síndrome del objeto brillante en ciencia de datos: el error simétrico a los costes hundidos

Hace poco publiqué una entrada en la que trataba de un sesgo bien documentado: aferrarse…

2 semanas ago

De la Regresión Logística al Scorecard: La Transformación Matemática

En un entrada previa explicamos qué son el WOE y el IV y por qué…

3 semanas ago

This website uses cookies.