• Ir al contenido principal
  • Skip to secondary menu
  • Ir a la barra lateral primaria
  • Ir al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Noticias
    • Opinión
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Boletín
  • Contacto
  • Acerca de Analytics Lane
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad
    • Tiendas afiliadas
      • AliExpress
      • Amazon
      • GearBest
      • GeekBuying
      • JoyBuy

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Criptografía
  • Python
  • Matlab
  • R
  • Julia
  • JavaScript
  • Herramientas
  • Opinión
  • Noticias

Convertir un diccionario en DataFrame en Python

diciembre 10, 2018 Por Daniel Rodríguez Dejar un comentario

Los diccionarios son unas estructuras de datos muy flexibles que relacionan una clave con un valor. En Python la clave puede ser cualquier tipo de dato inmutable y el valor puede ser cualquier tipo de dato. La principal diferencia entre los diccionarios y las listas o tuplas es el cómo se acceden a los valores. Mientras que en las listas o tuplas se accede mediante índices en los diccionarios se accede mediante la clave. En ciertas ocasiones puede que los datos se encuentren en un diccionario y sea necesario convertirlos en un DataFrame. En esta entrada se va a explicar como convertir un diccionario en DataFrame en Python con Pandas.

Convertir un diccionario básico en un DataFrame

El problema básico es convertir un diccionario en que el valor es un tipo de dato primitivo. Es decir, este no es una lista, tupla, conjunto o diccionario, sino que es un número o una cadena de caracteres. Por ejemplo, partiendo del siguiente conjunto de datos generado en Mockaroo.

clients = {
    "Waldon Astling": 1.83,
    "Catherine MacTerlagh": 0.15,
    "Gusty Wondraschek": 9.19,
    "Lois Vaan": 1.28,
    "Baird Eberts": 0.82,
    "Amalia Flieg": 2.88,
    "Leontine Wildbore": 9.44,
    "Rikki Chasteney": 7.01,
    "Augustine Papierz": 0.22,
    "Maynord Lawrance": 0.33
}

El diccionario se puede convertir en un DataFrame utilizando el siguiente código.

import pandas as pd

df = pd.DataFrame([[key, clients[key]] for key in clients.keys()], columns=['Name', 'Amount'])
df

En este únicamente se recorre el diccionario al mismo tiempo que se puebla el DataFrame. Al ejecutar el código se obtiene la siguiente tabla como resultado.

Resultado de convertir un diccionario en DataFrame
Resultado de convertir un diccionario en DataFrame

Convertir un diccionario cuyo valor es otro diccionario.

Ahora se puede aumentar la apuesta, el valor del diccionario es otro diccionario. Por ejemplo, convertir el siguiente diccionario.

clients = {
    "Waldon Astling": {
        "id": 1,
        "email": "[email protected]",
        "gender": "Male",
        "ip_address": "188.125.74.119",
        "money": 1.83
    },
    "Catherine MacTerlagh": {
        "id": 2,
        "email": "[email protected]",
        "gender": "Female",
        "ip_address": "142.102.151.95",
        "money": 0.15
    },
    "Gusty Wondraschek": {
        "id": 3,
        "email": "[email protected]",
        "gender": "Female",
        "ip_address": "25.253.221.98",
        "money": 9.19
    },
    "Lois Vaan": {
        "id": 4,
        "email": "[email protected]",
        "gender": "Female",
        "ip_address": "1.196.39.50",
        "money": 1.28
    },
    "Baird Eberts": {
        "id": 5,
        "email": "[email protected]",
        "gender": "Male",
        "ip_address": "88.230.140.148",
        "money": 0.82
    },
    "Amalia Flieg": {
        "id": 6,
        "email": "[email protected]",
        "gender": "Female",
        "ip_address": "203.219.142.196",
        "money": 2.88
    },
    "Leontine Wildbore": {
        "id": 7,
        "email": "[email protected]",
        "gender": "Female",
        "ip_address": "255.74.26.131",
        "money": 9.44
    },
    "Rikki Chasteney": {
        "id": 8,
        "email": "[email protected]",
        "gender": "Female",
        "ip_address": "90.29.53.76",
        "money": 7.01
    },
    "Augustine Papierz": {
        "id": 9,
        "email": "[email protected]",
        "gender": "Female",
        "ip_address": "43.165.166.247",
        "money": 0.22
    },
    "Maynord Lawrance": {
        "id": 10,
        "email": "[email protected]",
        "gender": "Male",
        "ip_address": "174.230.82.205",
        "money": 0.33
    }
}

En este caso es necesario realizar el proceso en fases, en un primer lugar se ha de convertir las llaves y en segundo lugar convertir uno a uno los elementos del segundo diccionario. Esto se puede conseguir empleando el siguiente código.

df = pd.DataFrame([key for key in clients.keys()], columns=['Name'])
df['id'] = [value['id'] for value in clients.values()]
df['email'] = [value['email'] for value in clients.values()]
df['gender'] = [value['gender'] for value in clients.values()]
df['ip_address'] = [value['ip_address'] for value in clients.values()]
df['money'] = [value['money'] for value in clients.values()]
df

A partir de lo que se obtiene la siguiente tabla como resultado.

Resultado de convertir un diccionario con un diccionario en los valores en un DataFrame
Resultado de convertir un diccionario con un diccionario en los valores en un DataFrame

Validar la existencia del valor en el segundo diccionario

El código visto anteriormente presenta un problema cuando no existe una clave en el diccionario valor. En tal caso el código terminará en un error sin realizar la transformación. Para evitar este problema es necesario comprobar si cada una de las claves existe antes de añadirla al DataFrame. Una forma fácil de hacer el mediante el operador in, comprobando si la llave se encuentra en el listado. Este proceso es el que se muestra en las siguientes líneas de código.

df = pd.DataFrame([key for key in clients.keys()], columns=['Name'])
df['id'] = [value['id'] if 'id' in value.keys() else None for value in clients.values()]
df['email'] = [value['email'] if 'email' in value.keys() else None for value in clients.values()]
df['gender'] = [value['gender'] if 'gender' in value.keys() else None for value in clients.values()]
df['ip_address'] = [value['ip_address'] if 'ip_address' in value.keys() else None for value in clients.values()]
df['money'] = [value['money'] if 'money' in value.keys() else None for value in clients.values()]
df

Conclusiones

En esta entrada se ha visto cómo transformar un diccionario en Python en un DataFrame. Este truco permite convertir una estructura de datos en otra para emplear la más adecuada en cada momento.

Imágenes: Pixabay (Steve Buissinne)

¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 0 / 5. Votos emitidos: 0

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Contenido relacionado

Archivado en:Python Etiquetado con:pandas

Interacciones con los lectores

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Publicidad


Barra lateral primaria

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

¡Síguenos en redes sociales!

  • facebook
  • github
  • telegram
  • pinterest
  • rss
  • tumblr
  • twitter
  • youtube

Publicidad

Tiendas afiliadas

Ayúdanos realizando tus compras sin coste adicional con los enlaces de la tienda. ¡Gracias!

Entradas recientes

Creación de un certificado Let’s Encrypt en Windows con Win-Acme

enero 22, 2021 Por Daniel Rodríguez Dejar un comentario

Aplicaciones de Node en producción con PM2

enero 20, 2021 Por Daniel Rodríguez Dejar un comentario

SQLite en Python

enero 18, 2021 Por Daniel Rodríguez Dejar un comentario

Publicidad

Es tendencia

  • ¿Cómo eliminar columnas y filas en un dataframe pandas? bajo Python
  • Intercambiar archivos en VirtualBox bajo Herramientas
  • Numpy básico: encontrar la posición de un elemento en un Array de Numpy bajo Python
  • Seleccionar filas y columnas en Pandas con iloc y loc bajo Python
  • Excel en Python Guardar y leer archivos Excel en Python bajo Python

Publicidad

Lo mejor valorado

5 (3)

Ordenar una matriz en Matlab en base a una fila o columna

5 (3)

Automatizar el análisis de datos con Pandas-Profiling

5 (5)

Diferencias entre var y let en JavaScript

5 (6)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

5 (3)

Unir y combinar dataframes con pandas en Python

Publicidad

Comentarios recientes

  • Daniel Rodríguez en Calculadora de probabilidades de ganar a la lotería
  • abel en Calculadora de probabilidades de ganar a la lotería
  • David Arias en Diferencias entre regresión y clasificación en aprendizaje automático
  • Juan Aguilar en Archivos JSON con Python: lectura y escritura
  • Camilo en Contar palabras en una celda Excel

Publicidad

Footer

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Noticias
  • Opinión

Programación

  • JavaScript
  • Julia
  • Matlab
  • Python
  • R

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Lo más popular
  • Tienda

Tiendas Afiliadas

  • AliExpress
  • Amazon
  • BangGood
  • GearBest
  • Geekbuying
  • JoyBuy

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Tiendas afiliadas

Ayúdanos realizando tus compras sin coste adicional con los enlaces de la tienda. ¡Gracias!

Amazon

2018-2020 Analytics Lane · Términos y condiciones · Política de Cookies · Política de Privacidad · Herramientas de privacidad · Contacto