Ciencia de datos

Ley potencial y visitas Analytics Lane

La ley potencial es una relación entre magnitudes que se puede observar en diferentes fenómenos de carácter físico, biológico o debidos a la actividad humana. Los cuales se caracterizan por tener distribuciones sesgadas de los valores en los que un pequeño número de registros tienen valores más elevados. Además de tener invariancia de escala. Algunos fenómenos que siguen esta ley son las erupciones volcánicas, el tamaño de las poblaciones o la popularidad de los apellidos en una población.

Otro aspecto en el que se espera que se cumpla la ley potencial es el número de visitas a una web. Por lo que es una buena idea probarlo con las visitas a Analytics Lane. Comprobado de esta manera si se el número de visitas cumplen esta ley o no.

La ley potencial

En muchos fenómenos se puede relacionar dos magnitudes mediante la ley potencial. Una ley que se puede expresar como

y = a x^k

donde x e y es una magnitud son las magnitudes que relacionar y a y k son los constantes. Una relación simple que tiene múltiples e interesantes características. Siendo una de las principales características la invariancia de escala. Esto es, si se multiplica una magnitud por una constante la ley también se multiplica por una constante.

Representación de la ley potencial

Las magnitudes de los fenómenos que siguen la ley potencial se pueden represar en una línea recta cuando ambas escalas son logarítmicas. Lo que se puede comprobar simplemente aplicando el logaritmo en ambas partes de la ecuación.

\log(y) = \log(a) + k \log(x).

Lo que es una recta con pendiente k y altura el origen \log(a).

Aplicación a las visitas a Analytics Lane

Para verificar la ley potencial hemos consultado el numero de visitas a las diferentes páginas de Analytics Lane durante los últimos tres meses y ordenadas estas de menor a mayor. Estos datos se guardan en un archivo Excel. Para comprobar si se verifica la ley se importan los datos del archivo Excel en Python con pandas. Posteriormente se calcula el logaritmo de las visitas y frecuencias para representar con seaborn. Utilizándose la función lmplot() que también implemente la regresión lineal.

import numpy as np
import pandas as pd
import seaborn as sns

visits = pd.read_excel('power.xlsx')
visits = np.log(visits)

sns.lmplot(x='visitas', y='frecuencia', data=visits)

Al ejecutar este código se obtiene la siguiente figura.

Relación entre visitas número de visitar y frecuencia

En esta se puede ver que las visitas a Analytics Lane no siguen estrictamente la ley potencial. Pero se ajustan bastante. El R^2 del modelo es 0,72.

Conclusiones

En esta entrada se ha comprobado cómo las visitas a Analytics Lane no se ajustan estrictamente a la ley potencial.

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez

Recent Posts

Analytics Lane lanza ScoreFlow, un SaaS para construir y desplegar scorecards de crédito

En Analytics Lane seguimos evolucionando nuestras herramientas y damos un paso más con el lanzamiento…

5 días ago

DBSCAN y la selección de ε: teoría, intuición y aplicación práctica

Cuando hablamos de clustering, lo primero que viene a la mente suele ser k-means. Pero…

6 días ago

El bestiario de los indicadores económicos absurdos: El zoo patrio

Cualquier país desarrollado tiene sus propios indicadores folclóricos. España, por motivos que tienen mucho que…

2 semanas ago

Por qué el banco te ofrece un 3% TAE y no es lo que parece

Entras a la web de tu banco. En la página principal, un banner llamativo: “Depósito…

2 semanas ago

Analytics Lane lanza la versión 1.3 del laboratorio con nuevas herramientas de evaluación de modelos y utilidades prácticas

Seguimos ampliando el laboratorio de Analytics Lane con el lanzamiento de la versión 1.3, disponible…

2 semanas ago

This website uses cookies.