Python

Numpy básico: el método numpy.where()

En esta entrada se va a explicar el funcionamiento del método numpy.where() con el que se puede seleccionar elementos en base a una condición. Simplemente en una línea de código. El método numpy.where() puede evitar la necesidad de crear un bucle para crear un nuevo vector en base a una condición. Permitiendo así crear código más compacto.

Uso básico de `numpy.where()`

La forma más fácil de utilizar el método numpy.where() es como se muestra a continuación.

import numpy as np

np.where([True, False, True, False], [1, 2, 3, 4], [5, 6, 7, 8])

array([1, 6, 3, 8])

El primer parámetro es un vector de valores lógicos, verdadero o falso. A continuación, se inyectan dos vectores. La salida de la función es un nuevo vector con los elementos del primer o segundo vector en base a lo que indique el primer parámetro. El método funciona de la siguiente manera: si la condición para el elemento i es cierta se selecciona el elemento correspondiente del primer vector, en caso contrario del segundo. Esto es lo que se puede ver en ejemplo, en el primer y tercer caso se selecciona el elemento del primer vector, mientras que el resto de los casos del segundo.

Un ejemplo trivial de uso del método numpy.where() puede ser la creación de un nuevo vector con los registros más grandes de otros dos. Esto se puede conseguir como se muestra a continuación.

data_1 = np.array([1, 3, 2, 1])
data_2 = np.array([3, 2, 1, 3])

np.where(data_1 > data_2, data_1, data_2)

array([3, 3, 2, 3])

Los elementos sobre los que se itera no tienen porqué ser necesariamente vectores, también pueden ser un escalar. Lo que se puede utilizar para seleccionar para poner un valor en ciertas condiciones. Por ejemplo, para reemplazar los valores por debajo de un mínimo por dicho valor.

np.where(data_1 > 1, data_1, 2)

array([0, 3, 2, 0])

Uso avanzado de `numpy.where()`

Los ejemplos vistos hasta ahora son triviales, pero la condición lógica puede ser todo lo compleja que se desee. Pudiéndose utilizar cualquier operador lógico. Por ejemplo, a continuación, se muestra como seleccionar los elementos del primer vector cuando estos se encuentra en un rango y en caso contrario los del otro.

data_1 = np.array([9, 17, 15, 20])
data_2 = np.array([20, 5, 13, 18])

np.where((data_1 > 10) & (data_1 < 15), data_1, data_2)

array([20,  5, 13, 18])

Pudiendo aumentar la complejidad de las condiciones tanto como sea necesario en cada uno de los casos.

Conclusiones

El método numpy.where() de Numpy es una excelente herramienta para reemplazar los bucles a la hora de aplicar condiciones a vectores. Permitiendo así tener crear un código más compacto y legible.

Imágenes: Pixabay (Marit Welker)

Daniel Rodríguez

Next Tiempo de elección: predicción de resultados electorales »

Previous « Aumentar el rendimiento de Python con Cython

Published by

Daniel Rodríguez

Tags: NumPy

7 años ago

Cómo comparar datos con barras en Matplotlib: agrupadas, apiladas y porcentuales
Tienes los datos de ventas de tres productos en dos años distintos y quieres saber…
Subplots en Matplotlib: cómo organizar múltiples gráficos en una sola figura
Llevas un rato analizando datos y tienes cuatro gráficos abiertos en ventanas separadas: ventas, usuarios,…
Cómo comparar tendencias con gráficos de líneas en Matplotlib: guía práctica paso a paso
Tienes los datos de tráfico web de los últimos cinco meses desglosados por canal: orgánico,…

Customer Lifetime Value: la fórmula clásica que todo analista debería dominar

El Customer Lifetime Value (CLV) es, probablemente, la métrica más importante que puede calcular una…

7 horas ago

Noticias

Analytics Lane lanza la versión 1.4 del laboratorio con nuevas herramientas de conversión y modelos avanzados de CLV

Seguimos ampliando el laboratorio de Analytics Lane con el lanzamiento de la versión 1.4, que…

4 días ago

Opinión

La liga internacional, o cuando Harvard y Johns Hopkins suman peras con manzanas – El bestiario de los indicadores económicos absurdos (parte 6)

Hemos llegado a la sexta entrega de la serie. Si las cuatro primeras fueron las…

5 días ago

Noticias

Lanzamos el video de ScoreFlow: crea scorecards de crédito de forma ágil y sin IT

En Analytics Lane seguimos apostando por desarrollar herramientas que simplifiquen el trabajo de analistas y…

6 días ago

Ciencia de datos

Data Leakage en Credit Scoring: El Error que Invalida tu Modelo

Imagina que construyes un scorecard con un Gini de 0,85. Un resultado extraordinario, muy por…

1 semana ago

Opinión

Las fórmulas con DNI, o cómo dividir cualquier cosa entre cualquier otra cosa puede acabar publicado en un titular serio – El bestiario de los indicadores económicos absurdos (parte 5)

En las cuatro entregas anteriores recorrimos los disparates más folclóricos del género: faldas que predicen…

2 semanas ago

This website uses cookies.

Numpy básico: el método numpy.where()

Uso básico de numpy.where()

Uso avanzado de numpy.where()