loc e iloc en PandasLa selección de elementos en los DataFrames de Pandas se puede realizar mediante dos métodos: loc e iloc. Aunque, en algunos casos, pueden parecer intercambiables, no es así. Existen importantes diferencias entre loc e iloc. Conocer estas permite seleccionar la opción más adecuada en cada caso.
loc e ilocLa principal diferencia que existe entre loc e iloc es que en loc se usan las etiquetas (los nombres asignados tanto a las filas como a las columnas) mientras que en iloc se usan los índices de los elementos (la posición en la fila o la columna, comenzado a contar en 0). Algo que se puede usar para recordar cual se debe usar, al trabajar con índices se debe emplear el que comienza por i.
loc e ilocPara analizar las diferencias entre loc e iloc se puede crear un conjunto de datos aleatorio en el que se asignan nombres tanto a las filas como a las columnas. Por ejemplo, como el del siguiente código.
import pandas as pd
import numpy as np
np.random.seed(0)
df = pd.DataFrame(np.random.rand(5, 3).round(2),
columns=['Col1', 'Col2', 'Col3'],
index=['A', 'B', 'C', 'D', 'E'])
df Col1 Col2 Col3 A 0.55 0.72 0.60 B 0.54 0.42 0.65 C 0.44 0.89 0.96 D 0.38 0.79 0.53 E 0.57 0.93 0.07
locAhora, para seleccionar la fila que se ha etiquetado como 'A' se debe usar la loc con el nombre de la fila entre corchetes.
df.loc['A']
Col1 0.55 Col2 0.72 Col3 0.60
Si se desea seleccionar más de una fila se puede usar una lista con todos los nombres de todas las filas que se desee.
df.loc[['A', 'C']]
Col1 Col2 Col3 A 0.55 0.72 0.60 C 0.44 0.89 0.96
También se puede seleccionar un rango. Para ello se pondrá el nombre de la primera fila, dos puntos y el de la última que se desee mostrar.
df.loc['B':'D']
Col1 Col2 Col3 B 0.54 0.42 0.65 C 0.44 0.89 0.96 D 0.38 0.79 0.53
Nótese que, en este caso, a diferencia de los rangos definidos en Python, la última fila también se incluirá en la selección.
ilocLa misma selección de elementos que se ha realizado en la sección anterior se puede hacer con iloc, solamente que ahora se debe indicar el índice y no el nombre. Así, para seleccionar la primera fila se indicará con un 0.
df.iloc[0]
Col1 0.55 Col2 0.72 Col3 0.60
Al igual que antes se puede usar una lista para seleccionar más de un elemento.
df.iloc[[1, 2]]
Col1 Col2 Col3 A 0.55 0.72 0.60 C 0.44 0.89 0.96
También se puede usar rangos separando los índices con dos puntos. Solo que, a diferencia de loc, el último índice no se incluirá en la selección, por lo que se debe indicar el siguiente.
df.iloc[1:4]
Col1 Col2 Col3 B 0.54 0.42 0.65 C 0.44 0.89 0.96 D 0.38 0.79 0.53
Nótese que en antes con loc se usó 'B':'D' y ahora ha sido necesario indicar 1:4 para obtener el mismo resultado. Una diferencia importante entre loc e iloc.
loc e ilocTanto loc como iloc admiten como segundo parámetro la columna o columnas que se desea seleccionar. Usando la misma sintaxis que para las filas. Si se desea obtener los valores de todas las filas se debe pasar dos puntos como primer parámetro. Así, para obtener los valores de la segunda columna del conjunto de datos con loc se debería hacer.
df.loc[:, 'Col2']
A 0.72 B 0.42 C 0.89 D 0.79 E 0.93
Mientras que para obtener los mismos resultados con iloc el comando sería el siguiente.
df.iloc[:, 1]
Siendo posible emplear todo lo visto hasta ahora para seleccionar un subconjunto de filas o columnas. Por ejemplo, para seleccionar un rango de filas y un listado de columnas con loc se puede usar.
df.loc['A':'C', ['Col2', 'Col3']]
Col2 Col3 A 0.72 0.60 B 0.42 0.65 C 0.89 0.96
Comando que tiene su equivalente con iloc.
df.iloc[0:3, [1, 2]]
Se ha visto la principal diferencia que existe entre loc e iloc a la hora de seleccionar los elementos. Mientras que en con loc se deben indicar los nombres con iloc se deben usar los índices. Con lo que se puede crear una regla nemotécnica para recordar cuál es el que se debe usar en cada caso: para trabajar con índices se usa iloc.
En la era del dato, las organizaciones se enfrentan al reto de gestionar volúmenes masivos…
En la serie Creación de una API REST con Express y TypeScript construimos una API…
Durante la Segunda Guerra Mundial, la Fuerza Aérea de Estados Unidos quería reforzar sus aviones…
En muchas situaciones —ya sea para grabar un tutorial, tomar capturas de pantalla profesionales, probar…
Imagínate en una sala con un grupo de personas, por ejemplo, en una oficina, un…
En el trabajo diario con ordenadores, es común encontrarse con tareas repetitivas: realizar copias de…
This website uses cookies.