El término análisis de clúster hace referencia a la familia de algoritmos que permiten agrupar registros similares de un conjunto de datos en grupos. A cada uno de estos grupos es a lo que se denomina un clúster. El objetivo final del análisis es asignar a cada clúster los registros que son similares entre sí. Al mismo tiempo que los registros del resto de clústeres son … [Leer más...] acerca de ¿Qué es el análisis de clúster?
Ciencia de datos
La ciencia de datos es un área de conocimiento interdisciplinar en el cual se utilizan procesos para recopilar, preparar, analizar, visualizar y modelar datos para extraer todo su valor. Pudiéndose emplear tanto con conjuntos de datos estructurados como no estructurados. Los científicos de datos, los profesionales de esta área deben poseer grandes conocimientos de estadística e informática. Además de conocimiento de los procesos que están modelando.
Con la ciencia de datos es posible revelar tendencias y obtener información para que tanto las empresas como las instituciones puedan tomar mejores decisiones. Basando estas así en conocimiento validado no en intuiciones.
Las publicaciones de esta sección abarca diferentes temas de áreas como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva.
La exactitud y la precisión en modelos de clasificación
En los modelos de clasificación, unos de los indicadores que se utilizan para seleccionar uno u otro son la exactitud (en inglés “precision”) y la exhaustividad (en inglés “recall”). La exactitud y la exhaustividad son una forma simple de medir la calidad de las predicciones realizadas.La matriz de confusiónEn los problemas de clasificación los resultados se suelen … [Leer más...] acerca de La exactitud y la precisión en modelos de clasificación
Diferencias entre regresión y clasificación en aprendizaje automático
Dentro del aprendizaje automático existen dos grandes familias de algoritmos: el aprendizaje supervisado y el aprendizaje no supervisado. En la primera de ellos los modelos son entrenados a partir de un conjunto de datos en el que la respuesta correcta es conocida. Siendo la finalidad del entrenamiento conseguir que los modelos reproduzcan este a partir de las características … [Leer más...] acerca de Diferencias entre regresión y clasificación en aprendizaje automático
La interpretación de las redes neuronales
Las redes neuronales profundas han demostrado ser una de las herramientas más potentes a la hora de realizar predicciones. Existen pocas técnicas en el aprendizaje automático que permitan alcanzar el nivel de precisión que ofrecen estas. Por eso no es de extrañar que el número de casos de éxito en los que son utilizadas no haga más que aumentar. Aún así, su utilización es … [Leer más...] acerca de La interpretación de las redes neuronales
¿Por qué limitar el número de unidades en una oferta?
En algunos mercados es habitual encontrar ofertas comerciales en las que se limitan las unidades que un cliente puede adquirir. Esta limitación se fija para evitar que los primeros clientes puedan agotar el stock disponible. Unos clientes que ante las dimisiones de la oferta puedan realizar acopio de una gran cantidad de producto. Así se puede alegar que se desea llegar al … [Leer más...] acerca de ¿Por qué limitar el número de unidades en una oferta?
Preguntas en formularios: anclaje
Esta entrada finaliza la serie en la que se revisan diferentes efectos que se han de tener en cuenta a la hora de diseñar formularios o workshops. Comenzó con una entrada sobre la interpretación que puede existir al preguntar sobre tendencia. En la siguiente se ha discutido los efectos del entorno en la precisión. La tercera ha sido analizado los fenómenos de pastoreo y … [Leer más...] acerca de Preguntas en formularios: anclaje
Preguntas en formularios: pastoreo y auto-pastoreo
En entradas anteriores fue explicado cómo pueden afectar a la respuesta la forma de preguntar cuándo se pregunta sobre la tendencia y el efecto del entorno. En esta tercera entrada se va a analizar el efecto de pastoreo y auto-pastoreo que suele aparecer especialmente en los workshops. Esto dos efectos están relacionados ya que las nuevas respuestas se basan en las anteriores. … [Leer más...] acerca de Preguntas en formularios: pastoreo y auto-pastoreo
Preguntas en formularios: precisión y entorno
En una entrada anterior se explico cómo puede afectar la forma de preguntar a las respuestas obtenidas cuando se pregunta sobre tendencia. En esta nueva entrada se explicará el efecto que puede tener el entorno en la precisión de los valores obtenidos. Analizando cómo se puede relacionar la precisión y entorno.Las herramientas empleadas para la realización de medidas de … [Leer más...] acerca de Preguntas en formularios: precisión y entorno
Preguntas en formularios: preguntar sobre la tendencia
Se dice que para obtener una buena respuesta es necesario realizar buenas preguntas. Una mala pregunta puede crear confusión en la mente de interlocutor, consiguiendo que su respuesta no sea la deseada. Obviamente, cuando se diseñan formularios para obtener datos estadísticos es necesario tener en cuenta la forma en la que se plantean las preguntas. La forma en la que se … [Leer más...] acerca de Preguntas en formularios: preguntar sobre la tendencia
¿Cómo afecta el número de referencias en las ventas?
Intuitivamente es fácil pensar que al aumentar el número de referencias en un catálogo las ventas han de aumentar. La justificación de esta idea tan arraigada es sencilla, al disponer de una mayor oferta es más probable satisfacer las preferencias de un número mayor de clientes. Con más clientes satisfechos es de esperar que las ventas aumentaran proporcionalmente. Pero según … [Leer más...] acerca de ¿Cómo afecta el número de referencias en las ventas?
¿Qué es Small Data?
En el año 2016 el gurú del comportamiento del consumidor Martin Lindstrom publicó el libro “Small Data: Las pequeñas pistas que nos advierten de las grandes tendencias”. Convirtiéndose en uno de los libros más vendido del año y llegando a ser Bestseller del New York Times. Gracias a la popularidad obtenida por el libro también se popularizo el termino “Small Data” (datos … [Leer más...] acerca de ¿Qué es Small Data?
Reglas de asociación y market-basket analysis
Las reglas de asociación permiten encontrar patrones comunes en los elementos de grandes conjuntos de datos. Una de las principales aplicaciones de esta técnica es el análisis de la cesta de la compra (market-basket analysis). Mediante el cual se pude identificar los productos que se compra de forma conjunta en una tienda.Uno de los ejemplos más citado sobre los resultados … [Leer más...] acerca de Reglas de asociación y market-basket analysis