Pandas, al igual que la mayoría de las librerías de Python, es un software del que se están publicando continuamente versiones con mejoras y nuevas funcionalidades. Por eso, saber la versión de Pandas puede ser algo necesario. Especialmente cuando se desea utilizar nuevas funcionalidades que solamente se encuentran a partir de una versión. Veamos cómo se puede saber en Python … [Leer más...] acerca de ¿Cómo saber la versión de Pandas o cualquier otra librería en Python?
Python
Python es un lenguaje de programación interpretado con una filosofía basada en la legibilidad del código. Un lenguaje que gracias posee un gran ecosistema de librerías para la ciencia de datos. Por lo que es uno de los más populares en la actualidad entre los científicos de datos. Además, es uno de los lenguajes más deseados y adorados por los programadores según las encuestas de Stack Overflow.
Python es un lenguaje de programación interpretado de propósito general que obliga al uso de una sintaxis clara, gracias a la cual el código es altamente legible. Siendo un lenguaje potente y fácil de aprender. Además, permite utilizar múltiples paradigmas de programación. Lo que permite usar desde programación orientada a objetos, pasando por programación imperativa o funcional.
Los paquetes de Python más utilizados por los científicos son:
- NumPy: permite el tratamiento de datos basados en matrices,
- Pandas: ideal para la manipulación de datos heterogéneos mediante objetos DataFrame,
- SciPy: implementa tareas habituales en computación científica,
- Matplotlib: facilita la visualización de datos y scikit-learn creación de modelos de aprendizaje automático.
Las publicaciones de esta sección versan sobre estas librerías y las bases del lenguaje.
Como filtrar en base a listas o DataFrames en Pandas
La indexación booleana en Pandas permite seleccionar de forma sencilla los elementos de un DataFrame en base a que los valores de una o varias filas cumplan ciertas condiciones. Solamente se debe crear un vector booleano con el valor True en las filas que se desean seleccionar. Algo que es fácil cuando la condición se debe comparar con un único valor, solamente se debe escribir … [Leer más...] acerca de Como filtrar en base a listas o DataFrames en Pandas
Manipulación de cadenas en Python
La manipulación de cadenas de texto es una tarea habitual y clave en programación. Por eso Python, al igual que la mayoría de los lenguajes de programación, ofrece una serie de funciones para ello en la librería estándar. En esta publicación, se explorarán algunas de las funciones y métodos disponibles para la manipulación de cadenas en Python. Conocer y comprender estas … [Leer más...] acerca de Manipulación de cadenas en Python
Trucos y consejos para optimizar la velocidad en Seaborn
Seaborn es una de las bibliotecas más populares para la visualización de datos en Python. A pesar de esto, en ocasiones, especialmente cuando se trabaja con conjuntos de datos grandes, puede que la generación de los gráficos sea un proceso lento. Para solucionar este problema cuando aparece existen ciertos trucos y consejos para optimizar la velocidad en Seaborn. En esta … [Leer más...] acerca de Trucos y consejos para optimizar la velocidad en Seaborn
Combinar diferentes tipos de gráficos en Seaborn
Seaborn es una biblioteca para la visualización de datos en Python que cuenta con una gran variedad de tipos de gráficos predefinidos. Ofreciendo de esta forma una manera rápida y sencilla para crear representaciones de los datos. Algo que se potencia aún más con la capacidad que tiene para combinar diferentes tipos de gráficos en una sola figura, lo que permite crear gráficas … [Leer más...] acerca de Combinar diferentes tipos de gráficos en Seaborn
Cómo crear gráficos múltiples en Seaborn
Los gráficos múltiples, también conocidos por su nombre en inglés subplots, son una forma efectiva para mostrar múltiples visualizaciones de datos en una misma figura. Permitiendo ver al mismo tiempo más de un tipo de dato o tendencia. La mayoría de las bibliotecas de visualización de datos incluye funciones y métodos para esto, lo que no es una excepción en el caso de Seaborn. … [Leer más...] acerca de Cómo crear gráficos múltiples en Seaborn
Trabajar con datos faltantes con Seaborn
Los datos faltantes son un desafío a la hora de realizar casi cualquier análisis de datos. Si no se tiene en cuenta la falta de valores en algunos registros pueden aparecer sesgos en los resultados y una reducción de la precisión de los estadísticos. Lo que dificulta la interpretación de los resultados. Por eso es importante identificar la presencia de estos registros en los … [Leer más...] acerca de Trabajar con datos faltantes con Seaborn
Creación de gráficos de residuos en Seaborn para análisis de regresión
El análisis de los residuos es una parte clave para evaluar la calidad del ajuste en los modelos de regresión. Permitiendo verificar si se cumplen las condiciones subyacentes de estos modelos. Seaborn, una de las principales bibliotecas para la visualización de datos en Python, cuenta con funciones para facilitar la creación de gráficos de residuos de una forma rápida y fácil. … [Leer más...] acerca de Creación de gráficos de residuos en Seaborn para análisis de regresión
Gráficos de contorno en Seaborn: Representación de distribuciones conjuntas y estimaciones de densidad
Los gráficos de contorno permiten visualizar la distribución conjunta de dos variables. Facilitando estimar la densidad de los valores. Seaborn, una de las principales bibliotecas para la visualización de datos en Python, dispone de funciones con las que se pueden crear este tipo de gráficos de una forma sencilla. En esta entrada, se verá cómo crear gráficos de contorno en … [Leer más...] acerca de Gráficos de contorno en Seaborn: Representación de distribuciones conjuntas y estimaciones de densidad
Análisis de outliers en Seaborn: Cómo identificar y visualizar valores atípicos
Los valores atípicos u outliers de un conjunto de datos son aquellos registros que se alejan de forma significativa de los demás puntos. Identificar estos valores es crucial para un correcto análisis de datos. No conocer ni comprender los outliers de un conjunto de datos puede llevar a conclusiones erróneas durante los análisis de datos, ya que su presencia afecta a los … [Leer más...] acerca de Análisis de outliers en Seaborn: Cómo identificar y visualizar valores atípicos
Aplicación de estilos de visualización en Seaborn
Las gráficas de Seaborn cuentan por defecto con un estilo visual legible y elegante. Aunque puede que no se adapte a las necesidades específicas de algunos usuarios. Por eso es posible personalizar los estilos de visualización en Seaborn para que las gráficas se adapten a las necesidades y preferencias de cada usuario. En esta entrada, se verá cómo aplicar los estilos … [Leer más...] acerca de Aplicación de estilos de visualización en Seaborn
Creación de gráficos animados con Seaborn y Matplotlib
La creación de gráficos animados permite mostrar los cambios de tendencia que se observan a lo largo de tiempo en los conjuntos de datos. Mostrando una gráfica diferente cada poco segundo. Los gráficos de Seaborn se pueden combinar con las funciones de Matplotlib para crear gráficos animados, algo que es posible dado que Seaborn está creada sobre la base de Matplotlib. En esta … [Leer más...] acerca de Creación de gráficos animados con Seaborn y Matplotlib