Python

NumPy: Obtener la frecuencia de los valores en un vector de NumPy en Python

La función unique() de NumPy devuelve por defecto los valores únicos que se encuentra en un vector. Aunque también se puede obtener la frecuencia de aparición de estos valores. Para ello solamente se tiene que usar la propiedad return_counts, cuando se le asigna el valor True la función en lugar de devolver un array de NumPy con los elementos únicos devolverá una tupla en la que el primer elemento será el vector de valores únicos y el segundo la veces que se observa cada uno de ellos. Lo que se muestra en el siguiente ejemplo donde los valores únicos se guardan en la variable unique y la frecuencia de cada uno de estos valores en la variable counts:

import numpy as np

array = np.array([1, 2, 2, 2, 3, 3, 4, 5])

(unique, counts) = np.unique(array, return_counts=True)

print(f'Únicos:     {unique}')
print(f'Frecuencia: {counts}')
Únicos:     [1 2 3 4 5]
Frecuencia: [1 3 2 1 1]

En donde se puede apreciar que el vector de ejemplo el valor que más veces se observa es 2 tres veces y 3 dos veces, apareciendo el resto de los valores solamente una vez.

Este es un truco sencillo, pero que puede ser de gran utilidad cuando tengamos un problema similar entre manos.

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez
Tags: NumPy

Recent Posts

DBSCAN y la selección de ε: teoría, intuición y aplicación práctica

Cuando hablamos de clustering, lo primero que viene a la mente suele ser k-means. Pero…

16 horas ago

El bestiario de los indicadores económicos absurdos: El zoo patrio

Cualquier país desarrollado tiene sus propios indicadores folclóricos. España, por motivos que tienen mucho que…

6 días ago

Por qué el banco te ofrece un 3% TAE y no es lo que parece

Entras a la web de tu banco. En la página principal, un banner llamativo: “Depósito…

1 semana ago

Analytics Lane lanza la versión 1.3 del laboratorio con nuevas herramientas de evaluación de modelos y utilidades prácticas

Seguimos ampliando el laboratorio de Analytics Lane con el lanzamiento de la versión 1.3, disponible…

2 semanas ago

Augurios deportivos y portadas malditas, o cuando The Economist predice mejor al revés – El bestiario de los indicadores económicos absurdos (parte 3)

Cerramos la serie internacional con la categoría más estrambótica de todas: indicadores que predicen el…

2 semanas ago

El Binning en Credit Scoring: El Arte de Discretizar Variables

Si el WOE y el IV son la base matemática del credit scoring, el binning…

2 semanas ago

This website uses cookies.