Algo que siempre me ha preocupado en el blog es obtener el mejor rendimiento posible de Python y del resto de plataformas con las que trabajo. Reducir, aunque sea un poco, el tiempo de entrenamiento de los modelos o análisis de datos es siempre positivo. Así se puede dedicar más tiempo a analizar los resultados y menos a esperar por estos. Para lo que el procesador es algo … [Leer más...] acerca de Comparativa de rendimiento M1 frente Ryzen 7 para Python
Python
Python es un lenguaje de programación interpretado con una filosofía basada en la legibilidad del código. Un lenguaje que gracias posee un gran ecosistema de librerías para la ciencia de datos. Por lo que es uno de los más populares en la actualidad entre los científicos de datos. Además, es uno de los lenguajes más deseados y adorados por los programadores según las encuestas de Stack Overflow.
Python es un lenguaje de programación interpretado de propósito general que obliga al uso de una sintaxis clara, gracias a la cual el código es altamente legible. Siendo un lenguaje potente y fácil de aprender. Además, permite utilizar múltiples paradigmas de programación. Lo que permite usar desde programación orientada a objetos, pasando por programación imperativa o funcional.
Los paquetes de Python más utilizados por los científicos son:
- NumPy: permite el tratamiento de datos basados en matrices,
- Pandas: ideal para la manipulación de datos heterogéneos mediante objetos DataFrame,
- SciPy: implementa tareas habituales en computación científica,
- Matplotlib: facilita la visualización de datos y scikit-learn creación de modelos de aprendizaje automático.
Las publicaciones de esta sección versan sobre estas librerías y las bases del lenguaje.
Diferencia entre a=a+b y a+=b en Python
El operador de asignación y suma (+=) se puede usar en Python para sumar el valor de un variable a la de otra o concatenar tanto cadenas de texto como listas. El resultado es el mismo que se obtendría realizando la operación y asignando el resultado a la primera variable. Aparentemente no es más que azúcar sintáctico (syntactic sugar). Pero no es así, existen unas pequeñas … [Leer más...] acerca de Diferencia entre a=a+b y a+=b en Python
Combinar varios archivos Jupyter Notebook en uno
En una entrada reciente se ha visto cómo se puede dividir de forma automática un archivo Jupyter Notebook en varios. Gracias al paquete nbmanips. Pudiéndose emplear como criterio de separación los índices, el número de celdas o etiquetas. Algún lector me ha comentado si también es posible combinar varios archivos Jupyter Notebook automáticamente, sin la necesidad de copiar y … [Leer más...] acerca de Combinar varios archivos Jupyter Notebook en uno
Diferencia entre dos fechas en Python
Posiblemente una de las mejores opciones para trabajar con fechas en Python sea el tipo de dato datetime64 de NumPy. El cual permite realizar operaciones con fechas como con números, pudiendo restar, sumar o dividir con días, semanas, meses o años. Veamos las opciones que ofrece datetime64 para calcular la diferencia entre dos fechas en Python.Creación de series con … [Leer más...] acerca de Diferencia entre dos fechas en Python
Dividir un archivo de Jupyter Notebook en varios
Al trabajar con Jupyter Notebooks nos podemos encontrar que después de trabajar en un archivo este es demasiado grande y es mejor dividirlo en varios para trabajar mejor con ellos. Dado que puede haber cientos de celdas, copiar una a una puede ser una tarea tediosa. Afortunadamente existe una herramienta con la que se puede hacer justamente esto, dividir un archivo de Jupyter … [Leer más...] acerca de Dividir un archivo de Jupyter Notebook en varios
Modificar el formato de los DataFrame de Pandas
Cuando se imprime un DataFrame de Pandas por la pantalla este se muestra con un formato estándar. A pesar de que este es más que adecuado para la mayoría de las aplicaciones, el estilo se puede modificar para adaptarlo a nuestras necesidades. Veamos algunos cambios que se pueden realizar en el formato de los DataFrame de Pandas para obtener unos que se puedan adaptar a cada uno … [Leer más...] acerca de Modificar el formato de los DataFrame de Pandas
Paquetes con el algoritmo Apriori en Python
El algoritmo Apriori es uno de los más empleados para la creación de reglas de asociación. A pesar de ello, no existe un paquete que se puede considerar el "estándar" en Python, como sucede con el caso de arules en R. En esta ocasión voy a analizar algunos paquetes que se pueden encontrar en PyPi en los que se implementa el algoritmo Apriori en Python para tener una comparativa … [Leer más...] acerca de Paquetes con el algoritmo Apriori en Python
Mejora la legibilidad y calidad del código Python
Escribir un código legible y de calidad debería ser una de nuestras preocupaciones. No solamente es necesario que el programa realice la tarea para la que se ha diseñado de una forma eficiente, sino que también debería ser fácil de leer y comprender para cualquiera que lo desee revisar. Incluidos nosotros en un futuro. Recordando que la teoría de las ventanas rotas nos dice que … [Leer más...] acerca de Mejora la legibilidad y calidad del código Python
Inclusión de barras de error en Matplotlib
A la hora de la presentación de resultados experimentales la inclusión de barras de error en las gráficas es clave para comunicar la confianza que se tiene en los valores presentados. Por eso, en la mayoría de las bibliotecas para la generación de gráficos existen funciones para ello. La función con la que se pueden crear gráficas con barras de barras de error en Matplotlib es … [Leer más...] acerca de Inclusión de barras de error en Matplotlib
Cómo funciona k-modes e implementación en Python
La semana pasada publiqué un artículo donde explicaba el funcionamiento del algoritmo de k-means o k-medias junto a una implementación básica en Python. Este algoritmo es uno de los más utilizados para análisis de clúster. Aunque cuenta con un problema importante, al estar basado en la métrica euclídea solamente se puede utilizar cuando todas las características del conjunto de … [Leer más...] acerca de Cómo funciona k-modes e implementación en Python
Obtener la IP local y pública en Python
Hace unos días publiqué una entrada en la explicaba los pasos para conseguir tanto la IP de nuestro ordenador en la red local como la pública con la que se accede a internet desde Matlab. Información que no se puede obtener directamente de las funciones estándar, pero es útil en múltiples ocasiones. Dado que en Python tampoco existe una función para obtener esta información, en … [Leer más...] acerca de Obtener la IP local y pública en Python
Cómo funciona k-means e implementación en Python
El algoritmo de k-means o k-medias es uno de los más utilizados dentro del análisis de clúster. Algo que se puede explicar porque este es un algoritmo sencillo, fácil de interpretar y generalmente ofrece buenos resultados en la mayoría de los conjuntos de datos. Por lo que suele estar implementado en la mayoría de las librerías estadísticas y de aprendizaje automático como … [Leer más...] acerca de Cómo funciona k-means e implementación en Python











