Las gráficas de barras son una de las más empleadas para la representación de datos. Siendo una excelente opción para aquellos casos en los que se desea mostrar valores numéricos asociados a categorías. Pudiéndose tanto aplicar los datos de diversas categorías en una misma barra, como dibujar diferentes barras una a lado de otra. Veamos algunas formas para conseguir gráficos de barras en Matplotlib.
Ejemplo básico de gráficos de barras en Matplotlib
Supongamos que en un DataFrame se encuentra el número de visitas para diferentes días de la semana por país de origen. Así, para representar el número total de visitas se puede usar una gráfica de barras de modo que se pueda ver la evolución de los datos a través de los días. En Matplotlib estas gráficas se pueden crear mediante la función bar()
. Una función que solamente necesita dos parámetros, siendo el primero las etiquetas o valores de referencia y el segundo los valores. Pudiéndose usar un código como el siguiente.
import pandas as pd import matplotlib.pyplot as plt data = pd.DataFrame({'España' : [826, 943, 942, 901], 'Colombia': [668, 781, 791, 813], 'México': [488, 553, 563, 537]}, index=('Lunes', 'Martes', 'Miercoles', 'Jueves')) total = data.sum(axis=1) plt.bar(total.index, total) plt.show()
El cual produce la siguiente gráfica.
En este ejemplo, lo primero que ha hecho es sumar los valores del DataFrame para mostrar las visitas totales. Para lo que se ha empleado el método sum()
, pero realizando la operación por filas en lugar de columnas, lo que sería el comportamiento por defecto, para lo que se utilizado la propiedad axis
. Una vez hecho esto se usan los índices del resultado para etiquetar las columnas y los valores para representar los datos.
Gráfica de barras horizontales
La función bar()
produce gráficos en los que las barras son verticales. En el caso de que se desee una figura con barras horizontales se debe emplear en su lugar la función barh()
, la cual se usa exactamente igual que la anterior. Lo que se muestra en el siguiente ejemplo.
plt.barh(total.index, total) plt.show()
Obteniendo como resultado al ejecutar el código la siguiente figura en la que las barras son horizontales.
Gráficos apilados de barras
Los gráficos anteriores pueden mostrar algo más de información indicando además cuántos visitantes proceden de cada uno de los diferentes países. Siendo una opción para ello los gráficos de barras apiladas. Para construir estas figuras se pueden crear diferentes gráficos de barras, uno encima de otros, de modo que se obtiene el efecto deseado. Lo que se puede ver en el siguiente código de ejemplo.
plt.bar(data.index, data.España + data.Colombia + data.México, label='España') plt.bar(data.index, data.Colombia + data.México, label='Colombia') plt.bar(data.index, data.México, label='México') plt.legend(loc='best') plt.show()
Lo que produce la siguiente figura.
Nótese que para representar los datos de España se ha tenido que sumar los valores de las barras que se encuentra dejos de esta (Colombia y México), lo mismo que sucede para el caso de Colombia al que se le debe sumar los datos de México. De este modo, al superponer las diferentes barras, el efecto es como si se apilaran las barras. Puede ser algo tedioso, pero una vez que se comprende el proceso resulta sencillo.
Gráficos de barras adyacentes
También se puede situar las barras unas al lado de otras para comparar el número de visitas por país. Algo que también requiere cierto trabajo. En primer lugar, es necesario definir un ancho para las barras que debe ser inferior a la unidad y, al igual que antes, dibujar varios gráficos unos encima de otros, pero desplazando la posición de las barras. Esto se puede conseguir creando un vector para el eje x, al que se le sumará o restará según el caso una cantidad proporcional al ancho de las barras, de modo que las gráficas no se superpongan. Siendo esto algo que se hace en el siguiente ejemplo.
import numpy as np n = len(data.index) x = np.arange(n) width = 0.25 plt.bar(x - width, data.España, width=width, label='España') plt.bar(x, data.Colombia, width=width, label='Colombia') plt.bar(x + width, data.México, width=width, label='México') plt.xticks(x, data.index) plt.legend(loc='best') plt.show()
Algo que genera como resultado la siguiente figura.
Nótese que en primer lugar se ha definido un ancho para las barras de 0,25, lo que supone que las tres barras ocupan un ancho total de 0,75. La posición para los datos de España se desplazan 0,25 a la izquierda, los datos de Colombia se sitúan en el centro y los de México se desplazan a la derecha 0,25. Siendo esto lo que genera el resultado deseado. Finalmente, se ha de reemplazar mediante la función xticks()
los valores numéricos por las etiquetas.
Si en lugar de tres barras fuesen dos, para que el efecto fuese el deseado, deberían desplazarse la mitad de ancho a la izquierda la primera barra (x - width/2
) y la segunda esa misma cantidad a la derecha (x + width/2
). Siendo adecuado además aumentar el ancho de las barras a algo como 0,4, para que el ancho total de las dos sea 0,8.
Conclusiones
En esta entrada se ha visto el funcionamiento básico de los gráficos de barras en Matplotlib. Uno de los gráficos más utilizados y que, aun así, requiere conocer ciertos trucos para crear barras apiladas y adyacentes.
Deja una respuesta