• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad
    • Tiendas afiliadas
      • AliExpress
      • Amazon
      • Banggood
      • GeekBuying
      • Lenovo

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • Python
  • Pandas
  • NumPy
  • Matlab
  • Julia
  • JavaScript
  • Excel

¿Siguen las visitas a Analytics Lane la ley de la potencia?

diciembre 10, 2021 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

Visitas a Analytics Lane modeladas por la ley de la potencia, la distribución lognormal y la ley de la potencia truncada

Hace un par de años, en los primeros días del blog, intenté comprobar si las visitas a Analytics Lane seguían la ley de la potencia. Sin obtener en aquel momento un resultado claro. La ley de la potencia es una relación entre magnitudes que se puede observar en múltiples fenómenos de carácter físico, biológico o debido a la actividad humana. Ahora, una vez han aumentado el númoro de páginas y visitas en el blog es un buen momento para revisar si esta ley se verifica o existen otras alternativas más adecuadas como una distribución lognormal.

Paquete para trabajar con la ley de la potencia

En PyPI existe un paquete que facilita con el que se pueden automatizar el análisis de datos para comprobar si estos siguen una ley como la de la potencia o son mejores otras alternativas. Un paquete que se llama powerlaw y se puede instalar simplemente con el siguiente comando

pip install powerlaw

Datos de visitar a Analytics Lane

Para el análisis se van a utilizar los datos de visitas únicas a las 500 páginas más populares durante el pasado mes. Evitando de esta manera el error que puede introducir las búsquedas u otras visitas a las páginas inexistentes.

Ajustando los datos a la ley de la potencia

Al ajustar el número de visitas con la ley se obtiene una gráfica como la siguiente. Una gráfica en la que se ve como los datos no siguen perfectamente la ley, especialmente en las páginas menos visitadas.

Visitas a Analytics Lane modeladas por la ley de la potencia
Visitas a Analytics Lane modeladas por la ley de la potencia

Distribución Lognormal

Una alternativa para explicar las visitas al blog es una distribución Lognormal. Lo que se puede comparar en la siguiente gráfica.

Publicidad


Visitas a Analytics Lane modeladas por la ley de la potencia y la distribución lognormal
Visitas a Analytics Lane modeladas por la ley de la potencia y la distribución lognormal

En este caso se puede ver claramente que los datos se ajustan mejor a una distribución Lognormal. Lo que se puede comprobar mediante el método distribution_compare() del paquete powerlaw.

Ley de la potencia truncada

Otra alternativa es la ley de la potencia truncada, una modificación en la que se tiene en cuenta el hecho de usar datos truncados, como es el caso. Solamente se usan las visitas a las 500 primeras páginas. En este caso el resultado con los tres modelos se puede ver en la siguiente gráfica.

Visitas a Analytics Lane modeladas por la ley de la potencia, la distribución lognormal y la ley de la potencia truncada
Visitas a Analytics Lane modeladas por la ley de la potencia, la distribución lognormal y la ley de la potencia truncada

En este caso es dificil apreciar, pero el modelo basado en la versión truncada es ligeramente mejor que la Lognormal. Algo que también se puede validar con el método distribution_compare().

Los resultados que se muestran en la entrada se pueden conseguir con el siguiente código

import pandas as pd
import powerlaw
from matplotlib.pyplot import legend

visitas = pd.read_excel('visitas.xlsx')

fit = powerlaw.Fit(visitas.Unicas)

fig = fit.plot_ccdf(linewidth = 2)
fit.power_law.plot_ccdf(ax = fig, color = 'r', linewidth = 2, linestyle = '--')
fit.lognormal.plot_ccdf(ax = fig, color = 'g', linewidth = 2, linestyle = '--')
fit.truncated_power_law.plot_ccdf(ax = fig, color = 'b', linewidth = 2, linestyle = '--')
legend(['Visitas', 'Power Law', 'Lognormal', 'Truncate Power Law'])

Conclusiones

En esta ocasión se ha podido comprobar que las visitas a una web, por lo menos en el caso de Analytics Lane, cumple la ley. Aunque para validarlo hay que tener en cuenta que los datos empleados para el análisis suelen estar truncados para evitar ruido causado por visitas que no deberían tenerse en cuenta.

Publicidad


¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 0 / 5. Votos emitidos: 0

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicaciones relacionadas

  • Dealine
    Modelos BG/NBD para CLV
  • Preguntas en formularios: precisión y entorno
    Preguntas en formularios: precisión y entorno
  • Aprendizaje profundo
    ¿Qué es el Aprendizaje Profundo o Deep Learning?
  • CP-UCB para un problema Bandido Multibrazo (Multi-Armed Bandit)
    CP-UCB para un problema Bandido Multibrazo (Multi-Armed…
  • Tipos de elasticidad de la demanda en función del precio
    Tipos de elasticidad de la demanda en función del precio
  • UCB1-Normal para un problema Bandido Multibrazo (Multi-Armed Bandit)
    UCB1-Normal para un problema Bandido Multibrazo (Multi-Armed…

Publicado en: Ciencia de datos Etiquetado como: Analytics Lane

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Publicidad




Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Facebook
  • GitHub
  • Instagram
  • Pinterest
  • RSS
  • Twitter
  • Tumblr
  • YouTube

Publicidad

Entradas recientes

El método de Hare-Niemeyer y su implementación en Python

septiembre 29, 2023 Por Daniel Rodríguez

Redimensionar una partición de disco LVM con espacio no asignado en Linux

septiembre 27, 2023 Por Daniel Rodríguez

¿Cómo saber la versión de Pandas o cualquier otra librería en Python?

septiembre 25, 2023 Por Daniel Rodríguez

Publicidad

Es tendencia

  • ¿Cómo eliminar columnas y filas en un dataframe pandas? publicado el marzo 25, 2019 | en Python
  • Seleccionar filas y columnas en Pandas con iloc y loc publicado el junio 21, 2019 | en Python
  • La aplicación Auto Py to Exe Creación de un EXE desde un archivo Python en Windows publicado el mayo 16, 2022 | en Python
  • Cómo encontrar la posición de elementos en una lista de Python publicado el abril 12, 2021 | en Python
  • Unir y combinar dataframes con pandas en Python publicado el septiembre 10, 2018 | en Python

Publicidad

Lo mejor valorado

4.9 (22)

Seleccionar filas y columnas en Pandas con iloc y loc

4.7 (12)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.6 (15)

Archivos JSON con Python: lectura y escritura

4.5 (10)

Diferencias entre var y let en JavaScript

4.3 (12)

Ordenación de diccionarios en Python mediante clave o valor

Publicidad

Comentarios recientes

  • Daniel Rodríguez en ¿Cómo eliminar columnas y filas en un dataframe pandas?
  • Miguel en ¿Cómo eliminar columnas y filas en un dataframe pandas?
  • alberto en Resolver problema de credenciales en Bitbucket
  • Pablo en Aplicar el método D’Hondt en Excel
  • Agapito en Creación de un EXE desde un archivo Python en Windows

Publicidad

Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2023 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto