Ciencia de datos

Ley potencial y visitas Analytics Lane

La ley potencial es una relación entre magnitudes que se puede observar en diferentes fenómenos de carácter físico, biológico o debidos a la actividad humana. Los cuales se caracterizan por tener distribuciones sesgadas de los valores en los que un pequeño número de registros tienen valores más elevados. Además de tener invariancia de escala. Algunos fenómenos que siguen esta ley son las erupciones volcánicas, el tamaño de las poblaciones o la popularidad de los apellidos en una población.

Otro aspecto en el que se espera que se cumpla la ley potencial es el número de visitas a una web. Por lo que es una buena idea probarlo con las visitas a Analytics Lane. Comprobado de esta manera si se el número de visitas cumplen esta ley o no.

La ley potencial

En muchos fenómenos se puede relacionar dos magnitudes mediante la ley potencial. Una ley que se puede expresar como

y = a x^k

donde x e y es una magnitud son las magnitudes que relacionar y a y k son los constantes. Una relación simple que tiene múltiples e interesantes características. Siendo una de las principales características la invariancia de escala. Esto es, si se multiplica una magnitud por una constante la ley también se multiplica por una constante.

Representación de la ley potencial

Las magnitudes de los fenómenos que siguen la ley potencial se pueden represar en una línea recta cuando ambas escalas son logarítmicas. Lo que se puede comprobar simplemente aplicando el logaritmo en ambas partes de la ecuación.

\log(y) = \log(a) + k \log(x).

Lo que es una recta con pendiente k y altura el origen \log(a).

Aplicación a las visitas a Analytics Lane

Para verificar la ley potencial hemos consultado el numero de visitas a las diferentes páginas de Analytics Lane durante los últimos tres meses y ordenadas estas de menor a mayor. Estos datos se guardan en un archivo Excel. Para comprobar si se verifica la ley se importan los datos del archivo Excel en Python con pandas. Posteriormente se calcula el logaritmo de las visitas y frecuencias para representar con seaborn. Utilizándose la función lmplot() que también implemente la regresión lineal.

import numpy as np
import pandas as pd
import seaborn as sns

visits = pd.read_excel('power.xlsx')
visits = np.log(visits)

sns.lmplot(x='visitas', y='frecuencia', data=visits)

Al ejecutar este código se obtiene la siguiente figura.

Relación entre visitas número de visitar y frecuencia

En esta se puede ver que las visitas a Analytics Lane no siguen estrictamente la ley potencial. Pero se ajustan bastante. El R^2 del modelo es 0,72.

Conclusiones

En esta entrada se ha comprobado cómo las visitas a Analytics Lane no se ajustan estrictamente a la ley potencial.

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez

Recent Posts

De la Regresión Logística al Scorecard: La Transformación Matemática

En un entrada previa explicamos qué son el WOE y el IV y por qué…

1 día ago

Analytics Lane lanza la versión 1.1 del laboratorio con nuevas suites de CLV y Scoring

Seguimos evolucionando el laboratorio de Analytics Lane y hoy lanzamos la versión 1.1, disponible en:…

2 días ago

Interés compuesto: la fuerza que multiplica tu dinero (y los errores que la anulan)

“El interés compuesto es la octava maravilla del mundo. El que lo entiende lo gana…

6 días ago

Cómo comparar datos con barras en Matplotlib: agrupadas, apiladas y porcentuales

Tienes los datos de ventas de tres productos en dos años distintos y quieres saber…

1 semana ago

Costes hundidos en ciencia de datos: cuándo mantener un modelo y cuándo migrar

Imagina la situación. Tu equipo lleva tres años con un modelo en producción. No es…

2 semanas ago

WOE e IV: La Base Matemática del Credit Scoring

Cuando un banco evalúa una solicitud de crédito necesita responder a una pregunta aparentemente simple:…

2 semanas ago

This website uses cookies.