Los mensajes de advertencia en Python, a los que se les suele llamar por su nombre en inglés warnings, informa de posibles problemas durante la ejecución del código. Sin interrumpir la ejecución del código como sí hacen los errores. Los warnings son mensajes no críticos que se deben tener en cuenta para mejorar los programas y evitar posibles errores. En esta entrada, se … [Leer más...] acerca de Gestión de los warnings en Python: Controlando el flujo de información
Python
Python es un lenguaje de programación interpretado con una filosofía basada en la legibilidad del código. Un lenguaje que gracias posee un gran ecosistema de librerías para la ciencia de datos. Por lo que es uno de los más populares en la actualidad entre los científicos de datos. Además, es uno de los lenguajes más deseados y adorados por los programadores según las encuestas de Stack Overflow.
Python es un lenguaje de programación interpretado de propósito general que obliga al uso de una sintaxis clara, gracias a la cual el código es altamente legible. Siendo un lenguaje potente y fácil de aprender. Además, permite utilizar múltiples paradigmas de programación. Lo que permite usar desde programación orientada a objetos, pasando por programación imperativa o funcional.
Los paquetes de Python más utilizados por los científicos son:
- NumPy: permite el tratamiento de datos basados en matrices,
- Pandas: ideal para la manipulación de datos heterogéneos mediante objetos DataFrame,
- SciPy: implementa tareas habituales en computación científica,
- Matplotlib: facilita la visualización de datos y scikit-learn creación de modelos de aprendizaje automático.
Las publicaciones de esta sección versan sobre estas librerías y las bases del lenguaje.
Comprobar que una cadena sólo contiene números en Python
En muchas aplicaciones se puede recibir una cadena de texto que solamente debe contener valor numérico. Esto es, una cadena que solamente debería contener números y, a lo sumo, un punto como separador decimal. Si un usuario introduce este dato, es necesario validar el contenido de la cadena antes de poder emplearla dentro del código. En esta entrada, se verá cómo comprobar que … [Leer más...] acerca de Comprobar que una cadena sólo contiene números en Python
Mejorando la calidad del código Python con comas finales: Un detalle que marca la diferencia
A la hora de escribir código los detalles importan, incluso los aparentemente insignificantes. Uno de estos detalles, el cual suele ser completamente ignorado habitualmente, son las comas finales, conocidas en inglés como "Trailing Commas". Estas comas son las que se sitúan al final de la última línea en las estructuras como listas, tuplas y diccionarios. Aunque puede parecer … [Leer más...] acerca de Mejorando la calidad del código Python con comas finales: Un detalle que marca la diferencia
Obtener los datos de cotización de acciones en Python
En el ámbito financiero, acceder a datos precisos es esencial para poder realizar análisis acertados. Uno de los conjuntos de datos más relevantes y demandados son las cotizaciones de acciones. Para obtener esta información de manera efectiva, y, a ser posible, en tiempo real, es crucial contar con herramientas adecuadas. Una de las bibliotecas más populares para obtener los … [Leer más...] acerca de Obtener los datos de cotización de acciones en Python
Visualización de datos con Pyjanitor y Matplotlib o Seaborn: Potenciando el análisis visual
La visualización de datos es una parte clave del análisis de datos y comunicación de los resultados. Facilitando la comprensión de patrones, identificación de tendencias y comunicación de hallazgos de una manera más sencilla y efectiva que solamente estadísticas. En esta cuarta y última entrega la serie dedicada a Pyjanitor se explicará cómo se puede combinar con bibliotecas … [Leer más...] acerca de Visualización de datos con Pyjanitor y Matplotlib o Seaborn: Potenciando el análisis visual
Transformación de datos con Pyjanitor: Potenciando el análisis de datos
La transformación de los datos es una fase crucial en cualquier proyecto de ciencia de datos. Preparar los datos de entrada para que tengan un formato adecuado para el análisis que se desea realizar puede ser la diferencia entre el éxito o fracaso del proyecto. La biblioteca Pyjanitor ofrece varios métodos para simplificar y optimizar este proceso. En esta entrada, se … [Leer más...] acerca de Transformación de datos con Pyjanitor: Potenciando el análisis de datos
Limpieza de datos con Pyjanitor: Optimizando los flujos de trabajo
Contar con unos datos de calidad es clave para que los resultados de un análisis de datos sean válidos. Sin embargo, en la mayoría de las ocasiones, los conjuntos de datos suelen tener múltiples problemas de calidad. Por ejemplo, la presencia de valores nulos, nombres de columnas no estandarizados y datos mal formateados. En esta entrada se analizará las opciones existentes … [Leer más...] acerca de Limpieza de datos con Pyjanitor: Optimizando los flujos de trabajo
Introducción a Pyjanitor: Simplificando la limpieza y transformación de datos en Python
El proceso de limpieza y transformación de datos es una fase clave que se debe realizar antes de cualquier análisis en un proyecto de ciencia de datos. Siendo una fase clave para el éxito del proyecto. Generalmente, trabajar con datos desordenados o mal formateados es una tarea ardua que puede llegar a consumir mucho tiempo. Para solucionar esto existen bibliotecas como … [Leer más...] acerca de Introducción a Pyjanitor: Simplificando la limpieza y transformación de datos en Python
Uso del método df.describe() de Pandas para el análisis de datos
Pandas es la biblioteca de referencia para el análisis de datos en Python. Lo que es debido a ofrecer una gran cantidad de funciones para la manipulación y análisis altamente eficientes y fáciles de utilizar. Posiblemente uno de los mejores ejemplos de estos es el método df.describe(). Una función que produce un resumen estadístico del contenido de un DataFrame que permite … [Leer más...] acerca de Uso del método df.describe() de Pandas para el análisis de datos
Inclusión de valores y variables en las f-strings de Python
Las f-strings, o formatted string literals, son una característica introducida en Python 3.6 con la que se simplifica la tarea de dar formato a las cadenas de texto. Facilitando interpolar variables y expresiones dentro de las cadenas de texto. Sin embargo, ¿sabías que las f-strings tienen una función especial que permite incluir tanto el nombre de la variable como su valor en … [Leer más...] acerca de Inclusión de valores y variables en las f-strings de Python
Introducción a SQLite 3 en Python
Las bases de datos son una parte clave de los programas que necesitan persistir información. Para pequeñas aplicaciones, donde solo se guardan unos pocos registros, recurrir a una gran base de datos relacional como pueden ser PostgreSQL, MariaDB o SQL Server no es una buena opción debido que pueden ser difíciles de configurar. En estos casos una mejor opción es un sistema … [Leer más...] acerca de Introducción a SQLite 3 en Python
Mejorando la calidad de las imágenes en Jupyter Notebook: Un enfoque completo
Jupyter Notebook se ha vuelto una herramienta fundamental para el análisis y la visualización de datos en múltiples entornos. Sin embargo, la calidad por defecto de las imágenes puede no ser adecuada en muchas aplicaciones. Por eso, en una entrada anterior, expliqué cómo cambiar esa resolución por defecto por una más adecuada en los monitores de alta resolución (HiDPI o Retina … [Leer más...] acerca de Mejorando la calidad de las imágenes en Jupyter Notebook: Un enfoque completo