Una de las entradas más visitadas del blog desde hace años es la dedicada a cómo obtener valores únicos de una columna con Pandas. Es un truco simple, pero fundamental, que usamos constantemente al explorar o limpiar datos.
Por eso, he querido arrancar con este tema la nueva serie especial de verano en el canal de YouTube. En un video breve, de unos 12 minutos, explico cinco formas distintas de obtener valores únicos, comparo los resultados de cada una y comento cuándo conviene usar una u otra según el caso.
Para ilustrarlo, utilizo el clásico conjunto de datos Titanic, que puedes cargar fácilmente desde Seaborn. Así puedes replicar todo sin complicaciones, directamente desde tu entorno de trabajo.
En el video te muestro:
.unique() y qué tipo de objeto devuelve.nunique() puede ser tu aliado para análisis rápidos.value_counts() para ir un paso más allá.drop_duplicates() puede ser más útilY si aún no leíste la entrada original, aquí la tienes: Obtención de valores únicos de una columna con Pandas
Si el video te resulta útil, no olvides suscribirte al canal, dejar tu “me gusta” y contarme en los comentarios qué otros trucos te gustaría ver explicados. ¡Se vienen más videos este verano!
Si el WOE y el IV son la base matemática del credit scoring, el binning…
Seguimos iterando sobre el laboratorio de Analytics Lane y lanzamos la versión 1.2, disponible en:https://www.analyticslane.com/lab/es…
En la primera entrega vimos cómo se puede medir la economía mirando lo que la…
Tienes los datos de tráfico web de los últimos cinco meses desglosados por canal: orgánico,…
La economía es una de las pocas disciplinas donde puedes proponer que el largo de…
Imagina que construyes un modelo de credit scoring y obtienes un Gini de 0,65. Un…
This website uses cookies.