• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad
    • Tiendas afiliadas
      • AliExpress
      • Amazon
      • Banggood
      • GeekBuying
      • Lenovo

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • Python
  • Pandas
  • NumPy
  • Matlab
  • Julia
  • JavaScript
  • Excel

Diferencias entre loc e iloc en Pandas

febrero 6, 2023 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

pandas

La selección de elementos en los DataFrames de Pandas se puede realizar mediante dos métodos: loc e iloc. Aunque, en algunos casos, pueden parecer intercambiables, no es así. Existen importantes diferencias entre loc e iloc. Conocer estas permite seleccionar la opción más adecuada en cada caso.

Principal diferencia entre loc e iloc

La principal diferencia que existe entre loc e iloc es que en loc se usan las etiquetas (los nombres asignados tanto a las filas como a las columnas) mientras que en iloc se usan los índices de los elementos (la posición en la fila o la columna, comenzado a contar en 0). Algo que se puede usar para recordar cual se debe usar, al trabajar con índices se debe emplear el que comienza por i.

Seleccionar los elementos de un DataFrame con loc e iloc

Para analizar las diferencias entre loc e iloc se puede crear un conjunto de datos aleatorio en el que se asignan nombres tanto a las filas como a las columnas. Por ejemplo, como el del siguiente código.

import pandas as pd
import numpy as np

np.random.seed(0)

df = pd.DataFrame(np.random.rand(5, 3).round(2),
                  columns=['Col1', 'Col2', 'Col3'],
                  index=['A', 'B', 'C', 'D', 'E'])

df
   Col1  Col2  Col3
A  0.55  0.72  0.60
B  0.54  0.42  0.65
C  0.44  0.89  0.96
D  0.38  0.79  0.53
E  0.57  0.93  0.07

Selección de filas con loc

Ahora, para seleccionar la fila que se ha etiquetado como 'A' se debe usar la loc con el nombre de la fila entre corchetes.

df.loc['A']
Col1    0.55
Col2    0.72
Col3    0.60

Si se desea seleccionar más de una fila se puede usar una lista con todos los nombres de todas las filas que se desee.

Publicidad


df.loc[['A', 'C']]
   Col1  Col2  Col3
A  0.55  0.72  0.60
C  0.44  0.89  0.96

También se puede seleccionar un rango. Para ello se pondrá el nombre de la primera fila, dos puntos y el de la última que se desee mostrar.

df.loc['B':'D']
   Col1  Col2  Col3
B  0.54  0.42  0.65
C  0.44  0.89  0.96
D  0.38  0.79  0.53

Nótese que, en este caso, a diferencia de los rangos definidos en Python, la última fila también se incluirá en la selección.

Selección de filas con iloc

La misma selección de elementos que se ha realizado en la sección anterior se puede hacer con iloc, solamente que ahora se debe indicar el índice y no el nombre. Así, para seleccionar la primera fila se indicará con un 0.

df.iloc[0]
Col1    0.55
Col2    0.72
Col3    0.60

Al igual que antes se puede usar una lista para seleccionar más de un elemento.

df.iloc[[1, 2]]
   Col1  Col2  Col3
A  0.55  0.72  0.60
C  0.44  0.89  0.96

También se puede usar rangos separando los índices con dos puntos. Solo que, a diferencia de loc, el último índice no se incluirá en la selección, por lo que se debe indicar el siguiente.

Publicidad


df.iloc[1:4]
   Col1  Col2  Col3
B  0.54  0.42  0.65
C  0.44  0.89  0.96
D  0.38  0.79  0.53

Nótese que en antes con loc se usó 'B':'D' y ahora ha sido necesario indicar 1:4 para obtener el mismo resultado. Una diferencia importante entre loc e iloc.

Selección de columnas con loc e iloc

Tanto loc como iloc admiten como segundo parámetro la columna o columnas que se desea seleccionar. Usando la misma sintaxis que para las filas. Si se desea obtener los valores de todas las filas se debe pasar dos puntos como primer parámetro. Así, para obtener los valores de la segunda columna del conjunto de datos con loc se debería hacer.

df.loc[:, 'Col2']
A    0.72
B    0.42
C    0.89
D    0.79
E    0.93

Mientras que para obtener los mismos resultados con iloc el comando sería el siguiente.

df.iloc[:, 1]

Siendo posible emplear todo lo visto hasta ahora para seleccionar un subconjunto de filas o columnas. Por ejemplo, para seleccionar un rango de filas y un listado de columnas con loc se puede usar.

df.loc['A':'C', ['Col2', 'Col3']]
   Col2  Col3
A  0.72  0.60
B  0.42  0.65
C  0.89  0.96

Comando que tiene su equivalente con iloc.

df.iloc[0:3, [1, 2]]

Conclusiones

Se ha visto la principal diferencia que existe entre loc e iloc a la hora de seleccionar los elementos. Mientras que en con loc se deben indicar los nombres con iloc se deben usar los índices. Con lo que se puede crear una regla nemotécnica para recordar cuál es el que se debe usar en cada caso: para trabajar con índices se usa iloc.

Publicidad


¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 5 / 5. Votos emitidos: 1

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicaciones relacionadas

  • DataFrame con estilos personalizados
    Formatos condicionales en Pandas
  • Selección condicional con Pandas
    Selección condicional con Pandas
  • pandas
    Pandas: Cómo crear un DataFrame vacío y agregar datos
  • pandas
    Pandas: Aplicar una función a las filas o columnas de un…
  • ¿Cómo eliminar columnas o filas multi-índice en un dataframe de Pandas?
    ¿Cómo eliminar columnas o filas multi-índice en un dataframe…
  • Numpy básico: seleccionar filas y columnas en matrices Numpy
    Numpy básico: seleccionar filas y columnas en matrices Numpy

Publicado en: Python Etiquetado como: Pandas

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Publicidad




Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Facebook
  • GitHub
  • Instagram
  • Pinterest
  • RSS
  • Twitter
  • Tumblr
  • YouTube

Publicidad

Entradas recientes

El método de Hare-Niemeyer y su implementación en Python

septiembre 29, 2023 Por Daniel Rodríguez

Redimensionar una partición de disco LVM con espacio no asignado en Linux

septiembre 27, 2023 Por Daniel Rodríguez

¿Cómo saber la versión de Pandas o cualquier otra librería en Python?

septiembre 25, 2023 Por Daniel Rodríguez

Publicidad

Es tendencia

  • ¿Cómo cambiar el nombre de las columnas en Pandas? publicado el mayo 6, 2019 | en Python
  • Seleccionar filas y columnas en Pandas con iloc y loc publicado el junio 21, 2019 | en Python
  • ¿Cómo eliminar columnas y filas en un dataframe pandas? publicado el marzo 25, 2019 | en Python
  • Archivos Guardar y leer archivos CSV con Python publicado el junio 15, 2018 | en Python
  • Instantáneas de VirtualBox (Snapshots) publicado el marzo 27, 2019 | en Herramientas

Publicidad

Lo mejor valorado

4.9 (22)

Seleccionar filas y columnas en Pandas con iloc y loc

4.7 (12)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.6 (15)

Archivos JSON con Python: lectura y escritura

4.5 (10)

Diferencias entre var y let en JavaScript

4.3 (12)

Ordenación de diccionarios en Python mediante clave o valor

Publicidad

Comentarios recientes

  • Daniel Rodríguez en ¿Cómo eliminar columnas y filas en un dataframe pandas?
  • Miguel en ¿Cómo eliminar columnas y filas en un dataframe pandas?
  • alberto en Resolver problema de credenciales en Bitbucket
  • Pablo en Aplicar el método D’Hondt en Excel
  • Agapito en Creación de un EXE desde un archivo Python en Windows

Publicidad

Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2023 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto