La primera opción que suele venir a la cabeza cuando se necesita realizar una misma operación sobre diferentes valores es mediante el uso de un bucle. Lo que en Python se puede hacer mediante el uso de for o while. Esta es una forma natural de operar, primero se ejecuta la instrucción sobre el primer elemento, después sobre el segundo y así hasta que se termina. Si se conoce el … [Leer más...] acerca de Acelera el código mediante vectorización en Python: elimina los bucles para aumentar el rendimiento hasta 1800 veces
Python
Python es un lenguaje de programación interpretado con una filosofía basada en la legibilidad del código. Un lenguaje que gracias posee un gran ecosistema de librerías para la ciencia de datos. Por lo que es uno de los más populares en la actualidad entre los científicos de datos. Además, es uno de los lenguajes más deseados y adorados por los programadores según las encuestas de Stack Overflow.
Python es un lenguaje de programación interpretado de propósito general que obliga al uso de una sintaxis clara, gracias a la cual el código es altamente legible. Siendo un lenguaje potente y fácil de aprender. Además, permite utilizar múltiples paradigmas de programación. Lo que permite usar desde programación orientada a objetos, pasando por programación imperativa o funcional.
Los paquetes de Python más utilizados por los científicos son:
- NumPy: permite el tratamiento de datos basados en matrices,
- Pandas: ideal para la manipulación de datos heterogéneos mediante objetos DataFrame,
- SciPy: implementa tareas habituales en computación científica,
- Matplotlib: facilita la visualización de datos y scikit-learn creación de modelos de aprendizaje automático.
Las publicaciones de esta sección versan sobre estas librerías y las bases del lenguaje.
Ordenar valores en Pandas
En los DataFrames de Pandas se pueden ordenar los registros en base a los valores es estos utilizando el método sort_values(). Este método permite ordenar en base a una o varias columnas, tanto de forma ascendente como descendente, e indicar cómo se deben tratar los valores nulos. Veamos cómo se puede usar este método para ordenar valores en Pandas, para ello primero se … [Leer más...] acerca de Ordenar valores en Pandas
Por qué no usar cadenas de texto para representar rutas en Python
El trabajo con archivos es algo habitual y necesario en casi cualquier leguaje de programación. Los archivos son uno de los métodos más utilizados para la importación y exportación de datos en los programas informáticos. Lo más probable, cuando se comienza a trabajar en Python, la forma de guardar y gestionar las rutas es mediante el uso de cadenas de texto, pero esta no es la … [Leer más...] acerca de Por qué no usar cadenas de texto para representar rutas en Python
Extender con métodos propios los DataFrame de Pandas
Los DataFrames de Pandas son una fantástica herramienta para analizar datos en Python. No solamente pueden almacenar datos en formato tabular, sino que también disponen de una amplia variedad de métodos para seleccionar, procesar y analizar los datos de una forma altamente eficiente. Sin embargo, en algunas ocasiones, puede ser que no exista un método que permita solucionar de … [Leer más...] acerca de Extender con métodos propios los DataFrame de Pandas
Uso de decoradores en Python para simplificar el código
Los decoradores en Python son una opción del lenguaje para modificar o extender el comportamiento de las funciones o métodos sin cambiar el código. Con lo que se puede crear código más sencillo y legible. Veamos qué son los decoradores en Python y cómo se puede utilizar.Fundamentos de los decoradores en PythonEn Python, las funciones son objetos de primera clase como … [Leer más...] acerca de Uso de decoradores en Python para simplificar el código
¿Cómo saber la versión de Pandas o cualquier otra librería en Python?
Pandas, al igual que la mayoría de las librerías de Python, es un software del que se están publicando continuamente versiones con mejoras y nuevas funcionalidades. Por eso, saber la versión de Pandas puede ser algo necesario. Especialmente cuando se desea utilizar nuevas funcionalidades que solamente se encuentran a partir de una versión. Veamos cómo se puede saber en Python … [Leer más...] acerca de ¿Cómo saber la versión de Pandas o cualquier otra librería en Python?
Como filtrar en base a listas o DataFrames en Pandas
La indexación booleana en Pandas permite seleccionar de forma sencilla los elementos de un DataFrame en base a que los valores de una o varias filas cumplan ciertas condiciones. Solamente se debe crear un vector booleano con el valor True en las filas que se desean seleccionar. Algo que es fácil cuando la condición se debe comparar con un único valor, solamente se debe escribir … [Leer más...] acerca de Como filtrar en base a listas o DataFrames en Pandas
Manipulación de cadenas en Python
La manipulación de cadenas de texto es una tarea habitual y clave en programación. Por eso Python, al igual que la mayoría de los lenguajes de programación, ofrece una serie de funciones para ello en la librería estándar. En esta publicación, se explorarán algunas de las funciones y métodos disponibles para la manipulación de cadenas en Python. Conocer y comprender estas … [Leer más...] acerca de Manipulación de cadenas en Python
Trucos y consejos para optimizar la velocidad en Seaborn
Seaborn es una de las bibliotecas más populares para la visualización de datos en Python. A pesar de esto, en ocasiones, especialmente cuando se trabaja con conjuntos de datos grandes, puede que la generación de los gráficos sea un proceso lento. Para solucionar este problema cuando aparece existen ciertos trucos y consejos para optimizar la velocidad en Seaborn. En esta … [Leer más...] acerca de Trucos y consejos para optimizar la velocidad en Seaborn
Combinar diferentes tipos de gráficos en Seaborn
Seaborn es una biblioteca para la visualización de datos en Python que cuenta con una gran variedad de tipos de gráficos predefinidos. Ofreciendo de esta forma una manera rápida y sencilla para crear representaciones de los datos. Algo que se potencia aún más con la capacidad que tiene para combinar diferentes tipos de gráficos en una sola figura, lo que permite crear gráficas … [Leer más...] acerca de Combinar diferentes tipos de gráficos en Seaborn
Cómo crear gráficos múltiples en Seaborn
Los gráficos múltiples, también conocidos por su nombre en inglés subplots, son una forma efectiva para mostrar múltiples visualizaciones de datos en una misma figura. Permitiendo ver al mismo tiempo más de un tipo de dato o tendencia. La mayoría de las bibliotecas de visualización de datos incluye funciones y métodos para esto, lo que no es una excepción en el caso de Seaborn. … [Leer más...] acerca de Cómo crear gráficos múltiples en Seaborn
Trabajar con datos faltantes con Seaborn
Los datos faltantes son un desafío a la hora de realizar casi cualquier análisis de datos. Si no se tiene en cuenta la falta de valores en algunos registros pueden aparecer sesgos en los resultados y una reducción de la precisión de los estadísticos. Lo que dificulta la interpretación de los resultados. Por eso es importante identificar la presencia de estos registros en los … [Leer más...] acerca de Trabajar con datos faltantes con Seaborn