Noticias

Novedades en pandas 1.0

El pasado día 29 de enero de 2020 se lanzó oficialmente la versión 1.0.0 de Pandas, lo que indica el grado de madurez que ha alcanzado esta librería. En esta entrada vamos a ver algunas de las novedades que trae Pandas 1.0.

Pandas es librería para la limpieza, exploración y manipulación de datos más popular en Python. Al extender las funcionalidades de los vectores de NumPy con la posibilidad de dar nombres tanto a las filas como a columnas y agregar métodos que facilitan las tareas más habituales con los conjuntos de datos. Siendo uno de los motivos por lo que Python es hoy uno de los lenguajes favoritos para los científicos de datos.

Actualización

En primer lugar, es necesario comprobar qué versión de Pandas tenemos instalado y si es necesario actualizar la última versión. Para esto simplemente debemos escribir en una sesión de Python

import pandas as pd

pd.__version__

Si la versión es anterior a la 1.0.0 actualizaremos escribiendo en la terminal.

pip install --upgrade pandas

Con lo que la librería se actualizará a la última versión de Pandas.

Mejoras en la exportación de DataFrame en Pandas 1.0

A la hora de crear informes ya es bastante habitual trabajar con markdow, como por ejemplo se hace en Jupyter Notebook. Por lo que en Pandas 1.0 se incluye un nuevo método (to_markdown()) en los objetos DataFrame que permite exportar estos a tablas markdow. Facilitando así mover estas a documentos redactados en este formato. Algo que se puede ver en el siguiente ejemplo.

df = pd.DataFrame({
    'C1': [1, 2, 3, 4],
    'C2': ['A', 'B', 'C', 'D'],
    'C3': [True, False, True, False]
})

df.to_markdown()

|    |   C1 | C2   | C3    |
|---:|-----:|:-----|:------|
|  0 |    1 | A    | True  |
|  1 |    2 | B    | False |
|  2 |    3 | C    | True  |
|  3 |    4 | D    | False |

Valores nulos con `pd.NA`

Con anterioridad a Pandas 1.0 se podía indicar un valor nulo con np.nan, None o pd.NaT. Ahora es posible utilizar además el valor pd.NA, siendo este ultimo un más consistente que los anteriores ya que los resultados son independientemente del tipo de dato y operación. A diferencia los anteriores cualquier operación que involucre a un valor pd.NA dará como resultado un pd.NA. Por ejemplo, algo que se puede apreciar al utilizar operadores lógicos.

np.nan == np.nan # False
pd.NaT == pd.NaT # False
None == None     # True
pd.NA == pd.NA   # <NA>

Conclusiones

En esta entrada hemos visto algunas de las novedades que trae la versión 1.0 de Pandas. Una versión importante ya que supone el primer cambio en el número de versión mayor.

Imagen de Michael Gaida en Pixabay

Daniel Rodríguez

Next Calculadora de probabilidades de ganar a la lotería »

Previous « Truco Python: identificar diptongos o triptongos en una cadena de texto en Python

Published by

Daniel Rodríguez

Tags: Pandas

6 años ago

Analytics Lane lanza ScoreFlow, un SaaS para construir y desplegar scorecards de crédito
En Analytics Lane seguimos evolucionando nuestras herramientas y damos un paso más con el lanzamiento…
Analytics Lane lanza la versión 1.3 del laboratorio con nuevas herramientas de evaluación de modelos y utilidades prácticas
Seguimos ampliando el laboratorio de Analytics Lane con el lanzamiento de la versión 1.3, disponible…
Analytics Lane lanza la versión 1.2 del laboratorio con nuevas herramientas de ajuste de curvas y cálculo matricial
Seguimos iterando sobre el laboratorio de Analytics Lane y lanzamos la versión 1.2, disponible en:https://www.analyticslane.com/lab/es…

Las fórmulas con DNI, o cómo dividir cualquier cosa entre cualquier otra cosa puede acabar publicado en un titular serio – El bestiario de los indicadores económicos absurdos (parte 5)

En las cuatro entregas anteriores recorrimos los disparates más folclóricos del género: faldas que predicen…

2 días ago

Noticias

Analytics Lane lanza ScoreFlow, un SaaS para construir y desplegar scorecards de crédito

En Analytics Lane seguimos evolucionando nuestras herramientas y damos un paso más con el lanzamiento…

3 días ago

Ciencia de datos

DBSCAN y la selección de ε: teoría, intuición y aplicación práctica

Cuando hablamos de clustering, lo primero que viene a la mente suele ser k-means. Pero…

4 días ago

Opinión

El bestiario de los indicadores económicos absurdos: El zoo patrio

Cualquier país desarrollado tiene sus propios indicadores folclóricos. España, por motivos que tienen mucho que…

1 semana ago

Sin categoría

Por qué el banco te ofrece un 3% TAE y no es lo que parece

Entras a la web de tu banco. En la página principal, un banner llamativo: “Depósito…

2 semanas ago

Noticias

Analytics Lane lanza la versión 1.3 del laboratorio con nuevas herramientas de evaluación de modelos y utilidades prácticas

Seguimos ampliando el laboratorio de Analytics Lane con el lanzamiento de la versión 1.3, disponible…