Una de las entradas más visitadas del blog desde hace años es la dedicada a cómo obtener valores únicos de una columna con Pandas. Es un truco simple, pero fundamental, que usamos constantemente al explorar o limpiar datos.
Por eso, he querido arrancar con este tema la nueva serie especial de verano en el canal de YouTube. En un video breve, de unos 12 minutos, explico cinco formas distintas de obtener valores únicos, comparo los resultados de cada una y comento cuándo conviene usar una u otra según el caso.
Para ilustrarlo, utilizo el clásico conjunto de datos Titanic, que puedes cargar fácilmente desde Seaborn. Así puedes replicar todo sin complicaciones, directamente desde tu entorno de trabajo.
En el video te muestro:
.unique()
y qué tipo de objeto devuelve.nunique()
puede ser tu aliado para análisis rápidos.value_counts()
para ir un paso más allá.drop_duplicates()
puede ser más útilY si aún no leíste la entrada original, aquí la tienes: Obtención de valores únicos de una columna con Pandas
Si el video te resulta útil, no olvides suscribirte al canal, dejar tu “me gusta” y contarme en los comentarios qué otros trucos te gustaría ver explicados. ¡Se vienen más videos este verano!
En ciencia de datos y estadística, los promedios y porcentajes son herramientas fundamentales para resumir…
Las bases de datos son el corazón de casi cualquier sistema de información moderno. Ya…
En ciencia de datos, pocas cosas llaman más la atención de los científicos de datos…
Calcular adecuadamente el tamaño de la muestra es una parte esencial en el diseño de…
Hoy en día, cuando pensamos en ciencia de datos, lo primero que nos viene a…
Ampliar el espacio de almacenamiento en un sistema Linux es una tarea habitual y crítica…
This website uses cookies.