Uno de los conceptos clave en marketing para medir el valor del un cliente es el CLV. En entradas anteriores se ha visto la importancia del valor de vida de cliente y un modelo para obtener la tasa de retención. En los negocios en los que no existe una relación contractual, como puede ser una tienda on-line, identificar la probabilidad de que un cliente siga activo es clave. En la bibliografía existes múltiples modelos, para medir esta probabilidad y obtener así el CLV. En esta entrada se va a estudiar uno de los más utilizados, el modelo BG/NBD.
Inicialmente el modelo BG/NBD fue propuesto por Peter S. Fader et al. en el 2003 en este artículo. Este modelo fue desarrollado para describir el comportamiento de compra repetida en un entorno donde los clientes compran a un ritmo constante (aunque de manera estocástica) durante un período de tiempo, y luego se vuelven inactivos (abandonan).
Para la creación del modelo BG/NBD sus autores se han basado en las siguientes cinco suposiciones:
El modelo BG/NBD se pueden encontrar implementado tanto en R como en Python. El modelo en R se puede encontrar en paquete BTYD (https://cran.r-project.org/web/packages/BTYD/index.html), mientras que en Python es en lifetimes (https://pypi.org/project/Lifetimes/). Para los ejemplos se utilizará al paquete de Python que se ha de instalar utilizando pip:
pip install lifetimes
Antes de trabajar con el modelo se ha de realizar una carga inicial de los datos en dónde se tiene tres características:
Esta tarea se puede realizar con el código:
from lifetimes.datasets import load_cdnow_summary data = load_cdnow_summary(index_col = [0])
El ajuste del modelo se puede realizar utilizando el método BetaGeoFitter que se puede encontrar en la librería lifetimes de Phyton. Uno de los primeros resultados que se pueden obtener son el modelo son la gráfica de Frecuencia/Recencia en la que se representa el número de transacciones esperadas para un cliente en base a su recencia.
from lifetimes import BetaGeoFitter from lifetimes.plotting import plot_frequency_recency_matrix bgf = BetaGeoFitter(penalizer_coef = 0.0) bgf.fit(data['frequency'], data['recency'], data['T']) plot_frequency_recency_matrix(bgf)
Obteniéndose la siguiente gráfica
Otro resultado interesante es la probabilidad de que un cliente siga vivo. Esto se puede ver en la matriz de probabilidad:
from lifetimes.plotting import plot_probability_alive_matrix plot_probability_alive_matrix(bgf)
Con lo que se obtiene la siguiente gráfica
Una vez creado el modelo se pueden estimar las ventas esperadas para cada uno de los clientes en diferentes periodos de tiempo. Al seleccionar un cliente se puede obtener los siguientes valores.
for per in range(1, 10):
print("Las ventas esperadas en", per, "periodos es", bgf.predict(per, 3, 30, 40)) A partir de lo que se puede observar por pantalla los siguientes resultados:
Las ventas esperadas en 1 periodos es 0.051478533257478386 Las ventas esperadas en 2 periodos es 0.10234426954917505 Las ventas esperadas en 3 periodos es 0.15261444751497685 Las ventas esperadas en 4 periodos es 0.2023055306896734 Las ventas esperadas en 5 periodos es 0.2514332555186299 Las ventas esperadas en 6 periodos es 0.3000126755884701 Las ventas esperadas en 7 periodos es 0.3480582024341811 Las ventas esperadas en 8 periodos es 0.39558364324353096 Las ventas esperadas en 9 periodos es 0.4426022357444098
Finalmente se puede comparar el modelo con los resultados obtenidos en la realidad.
from lifetimes.plotting import plot_period_transactions plot_period_transactions(bgf)
De lo que se obtiene el siguiente resultado
Normalmente el conjunto de datos disponibles es un histórico de transacciones y no de la forma que es requerida para la construcción de un modelo. En estos casos es necesario realizar una transformación de los datos al formato requerido. Para analizar los datos primero se ha de cargar un conjunto de transacciones:
from lifetimes.datasets import load_transaction_data transaction_data = load_transaction_data()
Posteriormente se ha de transformar utilizando el comando summary_data_from_transaction_data
from lifetimes.utils import summary_data_from_transaction_data summary = summary_data_from_transaction_data(transaction_data, 'id', 'date', observation_period_end='2014-12-31')
Los datos ya transformado se pueden dividir el conjunto de datos en dos uno para el entrenamiento de los modelos y otro para la validación de estos. Esta es la forma para comprobar que el modelo implementado reproduce el comportamiento de los clientes en la realidad. Esto se puede realizar de la siguiente forma:
from lifetimes.utils import calibration_and_holdout_data summary_cal_holdout = calibration_and_holdout_data(transaction_data, 'id', 'date', calibration_period_end = '2014-09-01', observation_period_end = '2014-12-31' )
A partir de este conjunto de datos, se puede realizar el ajuste utilizando las columnas terminadas en cal, y la prueba empleando las columnas terminadas en holdout:
from lifetimes.plotting import plot_calibration_purchases_vs_holdout_purchases bgf.fit(summary_cal_holdout['frequency_cal'], summary_cal_holdout['recency_cal'], summary_cal_holdout['T_cal']) plot_calibration_purchases_vs_holdout_purchases(bgf, summary_cal_holdout)
Obteniéndose como resultado la siguiente gráfica
En esta entrada se ha presentado el modelo BG/NBD para medir la probabilidad que un cliente continúe activo. Este modelo, cuando se verifican los supuestos, permite obtener una estimación de esta probabilidad. Así se puede obtener un valor clave para obtener el CLV de un cliente.
En la era del dato, las organizaciones se enfrentan al reto de gestionar volúmenes masivos…
En la serie Creación de una API REST con Express y TypeScript construimos una API…
Durante la Segunda Guerra Mundial, la Fuerza Aérea de Estados Unidos quería reforzar sus aviones…
En muchas situaciones —ya sea para grabar un tutorial, tomar capturas de pantalla profesionales, probar…
Imagínate en una sala con un grupo de personas, por ejemplo, en una oficina, un…
En el trabajo diario con ordenadores, es común encontrarse con tareas repetitivas: realizar copias de…
This website uses cookies.