En una entrada hace dos semanas se explicó cómo combinar un gráfico de tarta con uno de barras apiladas para mostrar el detalle de una de las categorías de la tarta. Lo que permite crear representaciones que muestran en detalle los datos. En esta entrada, se verá cómo combinar dos gráficos de tarta para ofrecer información detallada de subcategorías de datos en Python con … [Leer más...] acerca de Crear dos gráficos de tarta para ofrecer información detallada de subcategorías en Python
Python
Python es un lenguaje de programación interpretado con una filosofía basada en la legibilidad del código. Un lenguaje que gracias posee un gran ecosistema de librerías para la ciencia de datos. Por lo que es uno de los más populares en la actualidad entre los científicos de datos. Además, es uno de los lenguajes más deseados y adorados por los programadores según las encuestas de Stack Overflow.
Python es un lenguaje de programación interpretado de propósito general que obliga al uso de una sintaxis clara, gracias a la cual el código es altamente legible. Siendo un lenguaje potente y fácil de aprender. Además, permite utilizar múltiples paradigmas de programación. Lo que permite usar desde programación orientada a objetos, pasando por programación imperativa o funcional.
Los paquetes de Python más utilizados por los científicos son:
- NumPy: permite el tratamiento de datos basados en matrices,
- Pandas: ideal para la manipulación de datos heterogéneos mediante objetos DataFrame,
- SciPy: implementa tareas habituales en computación científica,
- Matplotlib: facilita la visualización de datos y scikit-learn creación de modelos de aprendizaje automático.
Las publicaciones de esta sección versan sobre estas librerías y las bases del lenguaje.
Uso de contextlib para la gestión de contextos en Python
La seguridad del código es una parte cada vez más importante a la hora de escoger una tecnología. En Python, uno de los mecanismos que facilitan la escritura de código seguro, al mismo tiempo que lo hacen eficiente, son los context managers. Mediante el cual se hace más sencilla la gestión de los recursos. Con este mecanismo se puede garantizar la liberación adecuada de los … [Leer más...] acerca de Uso de contextlib para la gestión de contextos en Python
Cómo eliminar caracteres inválidos en nombres de archivos en Windows y Linux usando Python
Antes de escribir un archivo en disco es importante asegurarse de que este es válido. En Windows, Linux y macOS existen restricciones sobre los caracteres que pueden formar parte del nombre de un archivo. Si un usuario introduce algún carácter no válido, al intentar guardar el archivo este no se podrá crear y se producirá un error en el tiempo de ejecución. Por lo que es una … [Leer más...] acerca de Cómo eliminar caracteres inválidos en nombres de archivos en Windows y Linux usando Python
Crear un gráfico de tarta con subcategorías detalladas mediante barras apiladas en Python
A la hora de representar datos complejos en los que existen categorías y subcategorías puede ser necesario mostrar la distribución general y el detalle de una categoría en específico. Por ejemplo, las ventas de una tienda por departamento y el detalle de un departamento en específico. Una opción para conseguir esto es combinar un gráfico de tarta, con la que se puede mostrar la … [Leer más...] acerca de Crear un gráfico de tarta con subcategorías detalladas mediante barras apiladas en Python
Trabajando con números de alta precisión en Python: El módulo decimal
El tipo de dato más habitual para trabajar con número en Python es float. Este tipo permite almacenar números reales positivos o negativos con precisión doble, el equivalente al tipo double de C u otros lenguajes. Sin embargo, en situaciones es necesario contar con una mayor precisión, como en cálculos financieros donde los errores de redondeo pueden tener consecuencias … [Leer más...] acerca de Trabajando con números de alta precisión en Python: El módulo decimal
Cómo calcular el rango de red y convertir máscaras CIDR en Python
Al configurar redes de ordenadores, el rango de red es uno de los parámetros claves. El rango de red se puede representar usando la notación clásica de máscara de subred o el formato CIDR (Classless Inter-Domain Routing). En esta entrada, se explicará el formato CIDR y cómo traducirlo a la notación clásica de máscara de subred. Incluyendo el código Python para realizar estos … [Leer más...] acerca de Cómo calcular el rango de red y convertir máscaras CIDR en Python
Introducción a las gráficas de tarta en Matplotlib
Junto a las gráficas de barras, una de las mejores opciones para visualizar datos categóricos son las gráficas de tarta. Mediante las cuales se puede mostrar el peso que tienen cada una de las categorías en el total de los datos. En esta entrada se explicarán las bases para la creación de gráficas de tarta en Matplotlib y algunas de las opciones más interesantes.Creación de … [Leer más...] acerca de Introducción a las gráficas de tarta en Matplotlib
Decoradores en Python: Qué son, cómo crear uno y ejemplos
Python es un lenguaje de programación que destaca por su simplicidad, flexibilidad y con el que es fácil escribir código limpio. Siendo los decoradores una de las características del lenguaje que más ayudan a esto. Los decoradores permiten extender el comportamiento de las funciones y métodos de una manera elegante, facilitando la reutilización del código. En esta entrada, se … [Leer más...] acerca de Decoradores en Python: Qué son, cómo crear uno y ejemplos
Cómo crear gráficos con un eje secundario en matplotlib
Cuando se necesita comprar series de datos con escalas o unidades diferentes una de las mejores opciones son los gráficos con ejes secundarios. Mostrando los valores de una serie en el eje de la derecha y otra en la de la izquierda. Así, la persona que analiza el gráfico puede comparar las tendencias de ambas series sin los problemas de las dimensiones o escalas. En esta … [Leer más...] acerca de Cómo crear gráficos con un eje secundario en matplotlib
Procesado de datos en Python con collections
Python cuenta con múltiples estructuras de datos nativas del lenguaje (listas, diccionarios, tuplas y conjuntos) que son fundamentales para los desarrolladores. Aunque, para ciertas tareas complejas, pueden no ser suficiente. En estos casos, se puede recurrir al módulo collections. Este módulo proporciona estructuras de datos avanzadas que se puede usar para simplificar el … [Leer más...] acerca de Procesado de datos en Python con collections
Cómo dar formato a datos en Pandas
Pandas es posiblemente la biblioteca de Python más utilizada para la manipulación y el análisis de datos. Una parte crucial del análisis de datos es la presentación de los resultados. Lo que se debe hacer de forma clara y comprensible para que los destinatarios del análisis puedan comprender las conclusiones de estos de una forma rápida e intuitiva. En esta entrada, se … [Leer más...] acerca de Cómo dar formato a datos en Pandas
Exploración de datos con Pandas: Entendiendo df.describe()
Pandas es la biblioteca de referencia en Python para el análisis y manipulación de datos. Usando para ello los objetos DataFrame. Una de los métodos más útiles que se incluyen en los DataFrame es df.describe(), con el que se puede obtener de una forma rápida un resumen comprensible de los datos. En esta entrada, se analizará cómo usar esta función para obtener diferentes … [Leer más...] acerca de Exploración de datos con Pandas: Entendiendo df.describe()










