• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad
    • Tiendas afiliadas
      • AliExpress
      • Amazon
      • Banggood
      • GeekBuying
      • Lenovo

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • Python
  • Pandas
  • NumPy
  • Matlab
  • Julia
  • JavaScript
  • Excel

Formatos condicionales en Pandas

abril 17, 2020 Por Daniel Rodríguez 2 comentarios
Tiempo de lectura: 5 minutos

DataFrame con estilos personalizados

Una característica bastante desconocida de Pandas es la posibilidad de cambiar el formato de los DataFrame. Incluso de forma condicional. Lo que se puede hacer utilizando los diferentes métodos que se encuentran dentro de la propiedad style de los DataFrame. Siendo esta una opción que resulta interesante a la hora de la creación de informes ya hace innecesario salir de Python para aplicar formatos condicionales a las tablas. A continuación vamos a ver como aplicar los formatos condicionales en Pandas.

Dando formato a un DataFrame con estilo

Para poder dar formato a un documento primero se tiene que crear un DataFrame de ejemplo. Lo que se puede hacer con el siguiente código en el que hemos incluido valores NaN e infinitos.

import pandas as pd
import numpy as np

df = pd.DataFrame({'id': np.linspace(1, 6, 6)})
df = pd.concat([df, pd.DataFrame(np.random.randn(6, 4), columns=list('ABCD'))],axis=1)
df.iloc[0, 2] = np.nan
df.iloc[2, 3] = np.PINF
df.iloc[4, 4] = np.NINF
df.iloc[5, 2] = np.nan
df
DataFrame básico
DataFrame básico

En este caso el DataFrame se muestra en un notebook de la siguiente forma

Cambiar el formato decimal

Por defecto los valores en los DataFrame se muestran con seis cifras decimales. Si esto es no aporta información o es insuficiente, es posible indicar a Pandas que el DataFrame se muestre con un formato diferente. Para lo que se debe usar el método format() de la propiedad style del DataFrame. Así para indicar que solo se muestran dos decimales solo se tiene que escribir la siguiente línea de código

df.style.format("{:.2f}")
DataFrame con formato de dos decimales
DataFrame con formato de dos decimales

En donde se ha indicado que se use un formato de tipo real con dos decimales.

Publicidad


Sacar porcentajes en los DataFrame

Si los datos del DataFrame se tiene que expresar como porcentajes no es necesario multiplicar los valores por cien, ya que se le puede indicar en lugar de reales se puede indicar que el formato sea de tipo decimal. Así para obtener decimales en todas las columnas de DataFrame se puede usar

df.style.format("{:.1%}")
DataFrame con formato tipo porcentaje
DataFrame con formato tipo porcentaje

Aplicar el formato solo a algunas columnas

En la mayoría de los casos no es necesario que todas las columnas del DataFrame tengan el mismo formato. Por ejemplo, en los ID no es necesario decimales y puede existir columnas que sean porcentajes y otras no. En estos casos se le puede indicar mediante un diccionario cuales son las columnas sobre las que se aplica el formato. Por ejemplo, para hacer que en la columna Id aparezcan números enteros, en la columna A reales con dos decimales y en la columna C porcentajes se puede usar escribir la siguiente línea de código

df.style.format({'id':'{:.0f}', 'A':'{:.2f}', 'C': '{:.1%}'}, na_rep='-')
DataFrame con formato diferente en cada columna
DataFrame con formato diferente en cada columna

Además, en este caso se ha utilizado la propiedad na_rep con la que es posible reemplazar los valores NaN por un símbolo. En este caso una línea.

Resaltar valores

También puede ser interesante resaltar algunos valores como pueden ser los máximos o los mínimos. Para lo que se puede utilizar la propiedad highlight_max y highlight_min respectivamente. Al utilizarse por defecto se resaltan en amarillo los valores máximos en cada una de las columnas.

df.style.highlight_max()
DataFrame resaltando el máximo en cada columna
DataFrame resaltando el máximo en cada columna

Aunque también se puede indicar mediante la propiedad axis que se busquen los máximos o mínimos en cada una de las filas.

Publicidad


df.style.highlight_max(axis=1)
DataFrame resaltando el máximo en cada fila
DataFrame resaltando el máximo en cada fila

Barras en las celdas

Otra forma que se suele emplear bastante para ver los valores relativos en las celdas son las barras. Para esto en los DataFrame de Pandas se puede usar el método bar. Al aplicarlo en cada una de las celdas de las columnas se mostrarán barras relativas entre el valor mínimo y máximo de cada columna.

df.style.bar(subset=['id', 'A'], color='blue')
DataFrame con barras en algunas columnas
DataFrame con barras en algunas columnas

Estilos personalizados

Además de los métodos que incorpora Pandas también se pueden crear estilos personalizados mediante apply y applymap. Al usar apply se aplica una función a cada una de las columnas la cual puede modificar el estilo de la celda. Por otro lado, si se quiere aplicar una función a cada uno de los elementos se debería usar la propiedad applymap. Por ejemplo, para resaltar los valores mínimos, en lugar de highlight_min, se puede usar el comando.

df.style.apply(lambda x : ['background-color: green' if v else '' for v in x == x.min()])
DataFrame con estilos personalizados
DataFrame con estilos personalizados

Por otro lado, para marcar en rojo los valores negativos se puede usar:

df.style.applymap(lambda x : 'color: red' if x < 0 else 'color: black')
DataFrame con negativos en color rojo
DataFrame con negativos en color rojo

Combinación de formatos

Una de las grandes ventajas de estos métodos es que se pueden llamar más de uno en un DataFrame, con lo que se puede conseguir formatos condicionales en Pandas tan complejos como sea necesario. Por ejemplo, se puede combinar todo lo que se ha mostrado en la entrada.

df.style.\
    apply(lambda x : ['background-color: green' if v else '' for v in x == x.max()]).\
    applymap(lambda x : 'color: red' if x < 0 else 'color: black').\
    bar(subset=['id'], color='blue').\
    format({'id':'{:.0f}'})
ataFrame combinación de formatos
ataFrame combinación de formatos

Conclusiones

En esta entrada se ha realizado una introducción a los formatos condicionales en Pandas. Una opción que nos ofrece esta librería para poder mostrar los datos de una forma completamente personalizada.

Publicidad


¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 0 / 5. Votos emitidos: 0

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicaciones relacionadas

  • Codificación JSON
    Archivos JSON con Python: lectura y escritura
  • Tablas dinámicas en Python con pandas
    Tablas dinámicas en Python con pandas
  • Generar figuras de alta resolución en Matplotlib
    Generar figuras de alta resolución en Matplotlib
  • Visualización de datos en Python con Seaborn
    Visualización de datos en Python con Seaborn
  • Personalización de gráficos en Seaborn: Cambiar colores, estilos y etiquetas
    Personalización de gráficos en Seaborn: Cambiar colores,…
  • pandas
    Reemplazo condicional de valores en Pandas

Publicado en: Python Etiquetado como: Pandas

Interacciones con los lectores

Comentarios

  1. andres molina dice

    abril 23, 2021 a las 4:23 am

    buenas
    como seria el formato de miles y millones?

    Responder
    • Daniel Rodríguez dice

      abril 23, 2021 a las 9:12 am

      Simplemente se tiene que indicar que se desea usar el separador de miles con una coma, esto es, solamente se tiene que hacer

      df.style.format('{:,}')

      Lo que se pude combinar la limitación de decimales, por ejemplo, para fijar dos se pude usar:

      df.style.format('{:,.2f}')

      Responder

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Publicidad




Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Facebook
  • GitHub
  • Instagram
  • Pinterest
  • RSS
  • Twitter
  • Tumblr
  • YouTube

Publicidad

Entradas recientes

El método de Hare-Niemeyer y su implementación en Python

septiembre 29, 2023 Por Daniel Rodríguez

Redimensionar una partición de disco LVM con espacio no asignado en Linux

septiembre 27, 2023 Por Daniel Rodríguez

¿Cómo saber la versión de Pandas o cualquier otra librería en Python?

septiembre 25, 2023 Por Daniel Rodríguez

Publicidad

Es tendencia

  • Unir y combinar dataframes con pandas en Python publicado el septiembre 10, 2018 | en Python
  • ¿Cómo cambiar el nombre de las columnas en Pandas? publicado el mayo 6, 2019 | en Python
  • Ecuaciones multilínea en Markdown publicado el septiembre 14, 2022 | en Herramientas
  • Numpy básico: valores mínimos y máximos en arrays Numpy publicado el octubre 23, 2019 | en Python
  • pandas Pandas: Cambiar los tipos de datos en los DataFrames publicado el julio 15, 2021 | en Python

Publicidad

Lo mejor valorado

4.9 (22)

Seleccionar filas y columnas en Pandas con iloc y loc

4.7 (12)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.6 (15)

Archivos JSON con Python: lectura y escritura

4.5 (10)

Diferencias entre var y let en JavaScript

4.3 (12)

Ordenación de diccionarios en Python mediante clave o valor

Publicidad

Comentarios recientes

  • Daniel Rodríguez en ¿Cómo eliminar columnas y filas en un dataframe pandas?
  • Miguel en ¿Cómo eliminar columnas y filas en un dataframe pandas?
  • alberto en Resolver problema de credenciales en Bitbucket
  • Pablo en Aplicar el método D’Hondt en Excel
  • Agapito en Creación de un EXE desde un archivo Python en Windows

Publicidad

Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2023 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto