Los modelos de aprendizaje automático se pueden dividir en dos grandes familias: aprendizaje supervisado y aprendizaje no supervisado. La principal diferencia entre estas dos familias se encuentra en los datos de entrenamiento. En el aprendizaje supervisado los resultados que se desean obtener del modelo son conocidos previamente. Siendo utilizados para guiar su entrenamiento. … [Leer más...] acerca de Aprendizaje supervisado y aprendizaje no supervisado
Ciencia de datos
La ciencia de datos es un área de conocimiento interdisciplinar en el cual se utilizan procesos para recopilar, preparar, analizar, visualizar y modelar datos para extraer todo su valor. Pudiéndose emplear tanto con conjuntos de datos estructurados como no estructurados. Los científicos de datos, los profesionales de esta área deben poseer grandes conocimientos de estadística e informática. Además de conocimiento de los procesos que están modelando.
Con la ciencia de datos es posible revelar tendencias y obtener información para que tanto las empresas como las instituciones puedan tomar mejores decisiones. Basando estas así en conocimiento validado no en intuiciones.
Las publicaciones de esta sección abarca diferentes temas de áreas como la estadística, la minería de datos, el aprendizaje automático y la analítica predictiva.
6 aplicaciones del CLV
En este blog se ha hablado en varias ocasiones del concepto de valor de ciclo de vida de cliente (CLV por siglas en inglés “Customer Lifetime Value”). Las entradas han sido principalmente técnicas, prestando menos atención a las aplicaciones del CLV. En concreto se puede encontrar una introducción técnica al concepto en la entrada "Valor de ciclo de vida de cliente". Por otro … [Leer más...] acerca de 6 aplicaciones del CLV
El problema de desequilibrio de clases en conjuntos de datos de entrenamiento
Al enfrentarse a la situación de crear un modelo de clasificación es habitual que las clases no se encuentran balanceadas. Esto es, el número de registros para una de las clases es inferior al resto. Cuando el desequilibrio es pequeño, uno a dos, esto no supone un problema, pero cuando es grande es un problema para la mayoría de los modelos de clasificación. Esta situación se … [Leer más...] acerca de El problema de desequilibrio de clases en conjuntos de datos de entrenamiento
Optimizar el precio para maximizar los beneficios
El proceso de fijación de precios es clave para el éxito de cualquier producto. Un precio alto se traduce en un gran beneficio por unidad vendida, pero el volumen de ventas se resentirá. Por otro lado, un precio bajo se suele traducir en un gran volumen de ventas, pero con poco margen. Así, para poder optimizar el precio que permita maximizar el beneficio de un product se ha de … [Leer más...] acerca de Optimizar el precio para maximizar los beneficios
Modelos BG/NBD para CLV
Uno de los conceptos clave en marketing para medir el valor del un cliente es el CLV. En entradas anteriores se ha visto la importancia del valor de vida de cliente y un modelo para obtener la tasa de retención. En los negocios en los que no existe una relación contractual, como puede ser una tienda on-line, identificar la probabilidad de que un cliente siga activo es … [Leer más...] acerca de Modelos BG/NBD para CLV
Tasa de retención de clientes para CLV
El concepto de valor de ciclo de vida de cliente (CLV) se explico en una entrada anterior. Uno de los parámetros necesarios para obtener un valor correcto del CLV es la tasa de retención de los clientes. Este valor nos indica el porcentaje de clientes que continúan activos después de un periodo de tiempo.Para un análisis básico se puede asumir que el valor de la tasa de … [Leer más...] acerca de Tasa de retención de clientes para CLV
Implementación de una red neuronal desde cero
En esta entrada se va a implementar una red neuronal desde cero, sin utilizar librerías como Theano (http://deeplearning.net/software/theano/) o TensorFlow (https://www.tensorflow.org). La finalidad de este ejercicio poder comprender mejor cómo funcionan las redes neuronales antes de implementar soluciones más complejas mediante alguna librerías.Fundamentos de la … [Leer más...] acerca de Implementación de una red neuronal desde cero
Valor de ciclo de vida de cliente
En la mayoría de los negocios uno de los principales problemas es conocer el valor que aporta cada uno de los clientes. Uno de los indicadores más utilizados es el valor de ciclo de vida del cliente (CLV, por sus siglas en inglés "customer lifetime value"). El CLV se define como el valor presente de los beneficios futuros generados por el cliente durante toda la relación que se … [Leer más...] acerca de Valor de ciclo de vida de cliente