Al lanzar una tarea pesada, como puede ser una simulación Montecarlo, es habitual trabajar en otra cosa. No es productivo esperar sin hacer nada a la espera de que finalice la tarea. Por este motivo, para evitar estar pendiente de la finalización, puede ser interesante que el propio Python envíe una notificación al escritorio al terminar. Facilitando el uso de los resultados en … [Leer más...] acerca de Enviar notificaciones de escritorio con Python
Python
Python es un lenguaje de programación interpretado con una filosofía basada en la legibilidad del código. Un lenguaje que gracias posee un gran ecosistema de librerías para la ciencia de datos. Por lo que es uno de los más populares en la actualidad entre los científicos de datos. Además, es uno de los lenguajes más deseados y adorados por los programadores según las encuestas de Stack Overflow.
Python es un lenguaje de programación interpretado de propósito general que obliga al uso de una sintaxis clara, gracias a la cual el código es altamente legible. Siendo un lenguaje potente y fácil de aprender. Además, permite utilizar múltiples paradigmas de programación. Lo que permite usar desde programación orientada a objetos, pasando por programación imperativa o funcional.
Los paquetes de Python más utilizados por los científicos son:
- NumPy: permite el tratamiento de datos basados en matrices,
- Pandas: ideal para la manipulación de datos heterogéneos mediante objetos DataFrame,
- SciPy: implementa tareas habituales en computación científica,
- Matplotlib: facilita la visualización de datos y scikit-learn creación de modelos de aprendizaje automático.
Las publicaciones de esta sección versan sobre estas librerías y las bases del lenguaje.
¿Cómo eliminar columnas o filas multi-índice en un dataframe de Pandas?
Los dataframes de Pandas ofrecen la posibilidad de emplear múltiples índices para etiquetar los datos almacenados. Algo que se puede usar tanto para las columnas como para las filas, permitiendo organizar así ciertos tipos de datos de una forma mucho más eficiente. Ya que es posible seleccionar los diferentes valores en base a los diferentes niveles de los índices. Para … [Leer más...] acerca de ¿Cómo eliminar columnas o filas multi-índice en un dataframe de Pandas?
Pandas: Cómo iterar sobre las filas de un DataFrame en Pandas
Iterar sobre las filas de un DataFrame es una operación que se suele realizar de forma bastante habitual. Existiendo por ello diferentes formas de hacerlo. En esta ocasión vamos a ver tres de los métodos más utilizados para comparar posteriormente el rendimiento de estas.Conjunto de datos de ejemploPara trabajar en esta ocasión vamos a emplear un conjunto de datos … [Leer más...] acerca de Pandas: Cómo iterar sobre las filas de un DataFrame en Pandas
Pandas: Cómo crear un DataFrame aleatorio
En algunos casos son necesarios los conjuntos de datos aleatorios, por ejemplo, para la evaluación del rendimiento de algoritmos. Al trabajar con Pandas muchas veces necesitamos en forma de DataFrame. Algo que directamente no se puede hacer, pero sí usando los generadores de números aleatorios de NumPy, para crear a partir de estos unos DataFrame. Veamos cómo se puede crear un … [Leer más...] acerca de Pandas: Cómo crear un DataFrame aleatorio
NumPy: Obtener los índices de los máximos de un vector
Para ordenar los elementos de un vector de NumPy existe el método sort(). Pero, en algunas ocasiones, puede que esto no sea los necesario, sino los índices de los máximos o mínimos de un vector. Por ejemplo, para seleccionar los elementos asociados en otro vector. En estas ocasiones se puede recurrir al método argsort() con el cual se puede obtener justamente este … [Leer más...] acerca de NumPy: Obtener los índices de los máximos de un vector
Pandas: Iterar sobre las columnas de un DataFrame
Normalmente al trabajar con objetos DataFrame de Pandas se itera sobre las filas, ya que lo habitual es que estas representen los registros. Aun así, en ciertas ocasiones es posible que sea necesario iterar sobre las columnas de un DataFrame, por lo que en esta entrada se mostrarán algunas de las formas que existen para realizar esta tarea.Conjunto de datos de … [Leer más...] acerca de Pandas: Iterar sobre las columnas de un DataFrame
NumPy: Imprimir todos los elementos de un vector de NumPy
Al imprimir por pantalla una matriz de NumPy es posible que no aparezcan todos los elementos, solamente una parte de estos. Lo que es debido a una opción por defecto en la configuración de la librería. Veamos cómo se puede acceder a la configuración para cambiar esta opción de modo que sea posible imprimir todos los elementos de un vector de NumPy.Las opciones de impresión … [Leer más...] acerca de NumPy: Imprimir todos los elementos de un vector de NumPy
Pandas: Mostrar todos los elementos de un DataFrame
En Pandas, al sacar por pantalla los elementos de grandes conjuntos de datos por defecto solamente se mostrará una parte de estos. Lo que generalmente es una buena solución. Al trabajar de este modo, es fácil hacerse una idea de la forma de los datos sin llenar pantallas y pantallas con información que no es relevante. Aunque, cuando exista la necesidad de ver todos los … [Leer más...] acerca de Pandas: Mostrar todos los elementos de un DataFrame
NumPy: Insertar valores en matrices de NumPy
La inserción de valores en listas de Python no es una tarea sencilla, pero en NumPy se cuenta con la función np.insert(). Una función con la que es posible insertar valores en matrices de NumPy de una forma bastante sencilla.La función np.insert()Dentro de la librería NumPy se puede encontrar la función np.insert() con la que es posible insertar valores dentro de un … [Leer más...] acerca de NumPy: Insertar valores en matrices de NumPy
Pandas: Contabilizar los registros que cumplen una condición en un DataFrame
La semana pasada hemos visto cómo se pueden contabilizar las veces que aparecen los valores nulos (NaN) en un DataFrame de Pandas. En esta ocasión vamos a generalizar el proceso para poder contabilizar los registros que cumplen una condición, sea esta sencilla o toda la compleja que necesitemos usar.Conjunto de datos de ejemploPara trabajar se puede usar el mismo … [Leer más...] acerca de Pandas: Contabilizar los registros que cumplen una condición en un DataFrame
NumPy: Concatenar matrices en NumPy con np.concatenate()
Cuando necesitamos unir el contenido de varias matrices en NumPy se puede recurrir a la función np.concatenate(). Una función con la que es posible concatenar matrices en NumPy tanto por filas como por columnas.La función np.concatenate()En el caso de que necesitemos concatenar dos o más vectores o matrices de NumPy se puede recurrir a la función np.concatenate(). Una … [Leer más...] acerca de NumPy: Concatenar matrices en NumPy con np.concatenate()
Pandas: Contar los valores nulos en DataFrame
Es posible que al importar un conjunto de datos en un DataFrame de Pandas este tenga algunos valores nulos, generalmente representados por NaN. La existencia de este tipo de valores en los datos es un problema. Cualquier operación en la que se usen estos valores da como resultado NaN, salvo cuando es posible indicar que se ignoren. Por eso es aconsejable saber cómo contar los … [Leer más...] acerca de Pandas: Contar los valores nulos en DataFrame



