• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad
    • Tiendas afiliadas
      • AliExpress
      • Amazon
      • Banggood
      • GeekBuying
      • Lenovo

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • Python
  • Pandas
  • NumPy
  • Matlab
  • Julia
  • Excel
  • IA Generativa

Pandas: Encontrar la posición y valores de máximos y mínimos en un DataFrame

junio 21, 2021 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 4 minutos

pandas

Los objetos DataFrame de Pandas disponen de los métodos max() e idxmax() con los que es posible obtener respectivamente el máximo de los valores y la posición de estos. Algo que se puede hacer tanto por filas como por columnas. De forma análoga a estos, también existen los métodos min() e idxmin() con los que es posible los valores mínimos y su posición. En esta entrada vamos a ver cómo usar estos métodos para obtener la posición y valores de máximos y mínimos en un DataFrame.

Creación de un conjunto de datos

Antes de continuar con los métodos para identificar los máximos, mínimos y su posición es necesario crear un conjunto de datos de prueba. Para ello se puede recurrir al método randint(), después de fijar la semilla de cara a poder reproducir los resultados, para crear una matriz y luego convertirla en un DataFrame. Algo que se puede conseguir con un código como el siguiente:

import numpy as np
import pandas as pd

np.random.seed(0)
df = pd.DataFrame(np.random.randint(0, 100,
                                    size=(4, 5)),
                  columns=list('ABCDE'))

 df.loc[1, 'A'] = np.NaN
 df.loc[2, 'C'] = np.NaN

Nótese que en el objeto se han introducido dos valores NaN, esto es para ver cómo se puede con este tipo de valores. El código anterior generar como resultado el siguiente DataFrame

Tutorial de Mypy para Principiantes
En Analytics Lane
Tutorial de Mypy para Principiantes

       A   B     C   D   E
 0  44.0  47  64.0  67  67
 1   NaN  83  21.0  36  87
 2  70.0  88   NaN  12  58
 3  65.0  39  87.0  46  88

Publicidad


Uso básico del método max()

Al utilizar el método max() sobre el objeto DataFrame que se ha creado anteriormente se obtienen como resultado los valores máximo por columna, ignorando los NaN.

df.max()
A 70.0
B 88.0
C 87.0
D 67.0
E 88.0

Esto es así porque el método se aplica por defecto a las columnas. En el caso de necesitar obtener los máximos por fila solamente hay que indicar el eje sobre el que se desea obtener los valores máximos. Esto es, pasando como el parámetro axis igual a 1.

df.max(axis=1)
0 67.0
1 87.0
2 88.0
3 88.0

Nótese que en este caso los índices son los de las filas, no los de las colman como en el caso anterior. Finalmente, si lo que se desea en obtener el máximo total solamente se tienen que usar dos veces el método max()

df.max().max()
88.0

Tener en cuenta los valores nulos

Por defecto el método max() no tiene en cuenta los valores nulos, esto es porque el valor de la propiedad skipna es por defecto None. En el caso de que queramos tener en cuenta los valores NaN, es decir, buscar los valores máximos solamente en las filas o columnas que tengan todos sus elementos distingos de NaN, solamente hay que poner este valor a verdadero. Lo que se muestra en el siguiente ejemplo.

df.max(axis=1, skipna=False)
0 67.0
1 NaN
2 NaN
3 88.0

Obteniendo como resultado un objeto en el que el segundo y tercer valor son NaN. Lo que se produce porque la presencia de por lo menos un valor NaN en la fila hace que el resultado sea necesariamente este.

Publicidad


Obtener la posición de los valores máximos

En algunos casos no es necesario obtener el valor máximo, sino que la posición en la que este se encuentra. Para lo que se dispone del método idxmax(). Un método que tiene las mismas propiedades vistas para max(). Así, para obtener los índices en los que se encuentra el máximo de cada columna solamente se tienen que escribir

df.idxmax()
A 2
B 2
C 3
D 0
E 3

Mientras que en el caso de buscar los índices en las filas se tiene que asignar la propiedad axis a 1.

df.idxmax(axis=1)
0 D
1 E
2 B
3 E

En donde se puede ver que devuelve el nombre de la columna en la que se encuentra el máximo. Al igual que en el caso de max() el método idxmax() ignora los valores NaN y de forma análoga también se puede indicar que los tenga en cuenta. Lo que procura como resultado que solamente se obtendría la posición del máximo cuando toda la fila o columna tenga valores no nulos, obteniendo como resultado NaN en el resto de los casos. A modo de ejemplo se puede ver el resultado cuando se asigna esta propiedad

df.idxmax(axis=1, skipna=False)
0 D
1 NaN
2 NaN
3 E

Posición y valores mínimos en un DataFrame

Cuando se necesita localizar los mínimos de un DataFrame se puede recurrir a los métodos min() e idxmin() los cuales funcionan exactamente igual y tiene las mismas propiedades que max() e idxmax() respectivamente.

Publicidad


Conclusiones

En esta entrada hemos visto cómo localizar la posición y valores de máximos y mínimos en un DataFrame. Tarea que se puede realizar fácilmente gracias a la existencia de los métodos min(), max(), idxmin() e idxmax() de los objetos DataFrame.

¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 5 / 5. Votos emitidos: 3

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicaciones relacionadas

  • Tutorial de Mypy para Principiantes
  • Semana sin nuevas publicaciones
  • Combinar gráficos con FacetGrid: Cómo analizar tendencias complejas en múltiples paneles con Seaborn
  • Introducción a igraph en R (Parte 6): Centralidad de Katz en grafos
  • Cómo modificar los mensajes de commit en Git
  • Optimización de memoria en Pandas: Usar tipos de datos personalizados para manejar grandes conjuntos de datos
  • Introducción a igraph en R (Parte 7): Centralidad de Bonacich
  • ¡Analytics Lane cumple siete años!
  • Sincronizar múltiples ejes con twinx(): Comparación de datos con diferentes escalas en un solo gráfico con Matplotlib

Publicado en: Python Etiquetado como: Pandas

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Bluesky
  • Facebook
  • GitHub
  • Instagram
  • Mastodon
  • Pinterest
  • RSS
  • Telegram
  • Tumblr
  • Twitter
  • YouTube

Publicidad

Entradas recientes

Variables globales en Python: Problemas y cómo evitarlos

mayo 12, 2025 Por Daniel Rodríguez

Los valores numéricos en los ordenadores: Entendiendo enteros, flotantes y más

mayo 9, 2025 Por Daniel Rodríguez

Introducción a igraph en R (Parte 8): PageRank

mayo 7, 2025 Por Daniel Rodríguez

Publicidad

Es tendencia

  • Método del codo (Elbow method) para seleccionar el número óptimo de clústeres en K-means publicado el junio 9, 2023 | en Ciencia de datos
  • Seleccionar la opción para compactar la base de datos en Microsoft SQL Server Manager Studio Reducir el tamaño en SQL Server de una base de datos publicado el febrero 10, 2023 | en Herramientas
  • Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas publicado el mayo 10, 2019 | en Python
  • Diferencias entre CPU, GPU, TPU y NPU publicado el abril 19, 2023 | en Herramientas
  • Variables globales en Python: Problemas y cómo evitarlos publicado el mayo 12, 2025 | en Python

Publicidad

Lo mejor valorado

4.9 (24)

Seleccionar filas y columnas en Pandas con iloc y loc

4.6 (16)

Archivos JSON con Python: lectura y escritura

4.4 (14)

Ordenación de diccionarios en Python mediante clave o valor

4.7 (13)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.5 (10)

Diferencias entre var y let en JavaScript

Publicidad

Comentarios recientes

  • Daniel Rodríguez en Tutorial de Mypy para Principiantes
  • Javier en Tutorial de Mypy para Principiantes
  • javier en Problemas con listas mutables en Python: Cómo evitar efectos inesperados
  • soldado en Numpy básico: encontrar la posición de un elemento en un Array de Numpy
  • plataformas AéReas en Numpy básico: encontrar la posición de un elemento en un Array de Numpy

Publicidad


Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2025 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto