• Saltar al contenido principal
  • Skip to secondary menu
  • Saltar a la barra lateral principal
  • Saltar al pie de página
  • Inicio
  • Secciones
    • Ciencia de datos
    • Criptografía
    • Herramientas
    • Machine Learning
    • Noticias
    • Opinión
    • Productividad
    • Programación
      • JavaScript
      • Julia
      • Matlab
      • Python
      • R
  • Programación
    • JavaScript
    • Julia
    • Matlab
    • Python
    • R
  • Noticias
  • Boletín
  • Contacto
  • Tienda
    • Libros
    • Equipamiento de oficina
    • Equipamiento en movilidad
    • Tiendas afiliadas
      • AliExpress
      • Amazon
      • Banggood
      • GeekBuying
      • Lenovo

Analytics Lane

Ciencia e ingeniería de datos aplicada

  • Ciencia de datos
  • Machine Learning
  • Python
  • Pandas
  • NumPy
  • Matlab
  • Julia
  • JavaScript
  • Excel

Pandas: Cómo crear un DataFrame vacío y agregar datos

noviembre 16, 2020 Por Daniel Rodríguez 2 comentarios
Tiempo de lectura: 3 minutos

pandas

El objeto DataFrame es uno de los elementos clave de la librería Pandas. En esta entrada vamos a ver las opciones que existen para crear un DataFrame vacío y agregar datos. Lo que nos enseñara además algunos de los métodos que existen para modificar el contenido de un DataFrame.

Creación de un DataFrame vacío

Un DataFrame vacío se puede crear utilizando el constructor DataFrame de Pandas sin ningún parámetro. Algo que nos devuelve un objeto sin columnas ni índices.

import pandas as pd

df = pd.DataFrame()
Empty DataFrame
Columns: []
Index: []

Ahora para agregar datos, solamente se tiene que asignar a una nueva serie los datos que deseemos. Por ejemplo, se puede crear un DataFrame con nombre, apellidos y géneros de unos usuarios.

df['first_name'] = ['Josy', 'Vaughn', 'Neale', 'Teirtza']
df['last_name'] = ['Clarae', 'Halegarth', 'Georgievski', 'Teirtza']
df['gender'] = ['Female', 'Male', 'Male', 'Female']
  first_name    last_name  gender
0       Josy       Clarae  Female
1     Vaughn    Halegarth    Male
2      Neale  Georgievski    Male
3    Teirtza      Teirtza  Female

Como se puede ver en el ejemplo, no es necesario definir columnas antes de usar estas, algo es muy útil cuando se desea agregar nuevas series a un DataFrame existente.

Creación de un DataFrame vacío con columnas

Quizás en la mayoría de los casos no vamos a querer partir de un DataFrame completamente vacío. Sino que ya conoceremos el nombre de las series que queremos usar en este. Así se puede crear un DataFrame vacío con columnas indicando mediante el parámetro columns los nombres de estas. Por ejemplo, para el caso anterior se puede crear.

Publicidad


df = pd.DataFrame(columns=['first_name', 'last_name', 'gender'])
Empty DataFrame
Columns: [first_name, last_name, gender]
Index: []

Ahora, se puede agregar registro a registro al DataFrame utilizando para ellos el método append. Un método al que es necesario pasarle un diccionario con los valores e indicar la opción ignore_index a verdadero. Así se puede agregar registros al DataFrame de la siguiente manera.

df = df.append({'first_name': 'Josy', 'last_name':'Clarae', 'gender':'Female'}, ignore_index=True)
df = df.append({'first_name': 'Vaughn', 'last_name':'Halegarth', 'gender':'Male'}, ignore_index=True)
  first_name  last_name  gender
0       Josy     Clarae  Female
1     Vaughn  Halegarth    Male

Creación de un DataFrame vacío con columnas e índices

También es posible crear un DataFrame vacío en Pandas con las columnas e índices ya asignados. En este caso todos los registros del DataFrame serán NaN, ya que no tendrán ningún valor asignado.

df = pd.DataFrame(columns=['first_name', 'last_name', 'gender'],
                  index=range(3))
  first_name last_name gender
0        NaN       NaN    NaN
1        NaN       NaN    NaN
2        NaN       NaN    NaN

En este caso la forma más fácil de asignar los registros es mediante la propiedad iloc de los DataFrames. Una propiedad con la que se puede asignar fila a fila utilizando listas o tuplas. Así se puede rellenar los datos del objeto que acabamos de crear de la siguiente manera.

df.iloc[0] = ('Josy', 'Clarae', 'Female')
df.iloc[1] = ['Vaughn', 'Halegarth', 'Male']
df.iloc[2] = ('Neale', 'Georgievski', 'Male')
  first_name    last_name  gender
0       Josy       Clarae  Female
1     Vaughn    Halegarth    Male
2      Neale  Georgievski    Male

Donde se puede ver que asignar una lista o una tupla a las filas es algo indiferente a efectos prácticos.

Conclusiones

En la entrada de hoy hemos visto cómo crear un DataFrame vacío y agregar datos en Pandas de tres modos diferentes. Creando un DataFrame vacío, un DataFrame con columnas y un DataFrame con columnas e índices. Agregando además los datos de una forma diferente en cada caso. ¿Cuál de los tres métodos os parece más adecuado? Podéis dejar vuestras opiniones en los comentarios.

Publicidad


¿Te ha parecido de utilidad el contenido?

¡Puntúalo entre una y cinco estrellas!

Puntuación promedio 4.2 / 5. Votos emitidos: 5

Ya que has encontrado útil este contenido...

¡Síguenos en redes sociales!

¡Siento que este contenido no te haya sido útil!

¡Déjame mejorar este contenido!

Dime, ¿cómo puedo mejorar este contenido?

Publicaciones relacionadas

  • pandas
    Pandas: Convertir una columna en el índice
  • ¿Cómo cambiar el nombre de las columnas en Pandas?
    ¿Cómo cambiar el nombre de las columnas en Pandas?
  • NumPy
    NumPy: Crear matrices vacías en NumPy y adjuntar filas o…
  • pandas
    Diferencias entre loc e iloc en Pandas
  • pandas
    Pandas: Iterar sobre las columnas de un DataFrame
  • Seleccionar filas y columnas en Pandas con iloc y loc
    Seleccionar filas y columnas en Pandas con iloc y loc

Publicado en: Python Etiquetado como: Pandas

Interacciones con los lectores

Comentarios

  1. Chris dice

    abril 18, 2022 a las 10:16 am

    Estoy buscando un tutorial que muestre como manejar tablas, listas o data frames, o como se llamen en Python, de manera DINÁMICA. Quiero poder hacer operaciones con filas y columnas de forma DINÁMICA. Quiero poder añadir y borrar filas y columnas de forma DINÁMICA. El tutorial, print([‘Pepe’],[‘José’],[‘Ana’]) ya me lo sé de memoria y no vale para nada. Borra a Pepe de la lista y añade a Borja Mari. No me vale.
    ¿Alguien sabe dónde puedo encontrar un tutorial que explique el funcionamiento de Python, de forma DINÁMICA?
    Por favor que conteste a ese comentario con una dirección web.

    Muchas gracias por su atención y su comprensión.

    Responder
    • Daniel Rodríguez dice

      abril 18, 2022 a las 11:16 am

      Python es un lenguaje de programación, por lo que lo normal es trabajar con los datos mediante código. Aún así, existen herramientas como Mito con la que se puede realizar análisis básicos sin la necesidad de codificar, generando el código necesario de una forma visual tal como se explica en esta publicación https://www.analyticslane.com/2021/11/15/analisis-de-datos-en-python-al-estilo-excel-con-mito/ y en este video https://youtu.be/zKx75giw5PQ.

      Responder

Deja una respuesta Cancelar la respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

I accept the Terms and Conditions and the Privacy Policy

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Publicidad




Barra lateral principal

Suscríbete a nuestro boletín

Suscríbete al boletín semanal para estar al día de todas las publicaciones.

Política de Privacidad

Analytics Lane en redes sociales

  • Amazon
  • Facebook
  • GitHub
  • Instagram
  • Pinterest
  • RSS
  • Twitter
  • Tumblr
  • YouTube

Publicidad

Entradas recientes

El método de Hare-Niemeyer y su implementación en Python

septiembre 29, 2023 Por Daniel Rodríguez

Redimensionar una partición de disco LVM con espacio no asignado en Linux

septiembre 27, 2023 Por Daniel Rodríguez

¿Cómo saber la versión de Pandas o cualquier otra librería en Python?

septiembre 25, 2023 Por Daniel Rodríguez

Publicidad

Es tendencia

  • Unir y combinar dataframes con pandas en Python publicado el septiembre 10, 2018 | en Python
  • ¿Cómo cambiar el nombre de las columnas en Pandas? publicado el mayo 6, 2019 | en Python
  • Ecuaciones multilínea en Markdown publicado el septiembre 14, 2022 | en Herramientas
  • Numpy básico: valores mínimos y máximos en arrays Numpy publicado el octubre 23, 2019 | en Python
  • pandas Pandas: Cambiar los tipos de datos en los DataFrames publicado el julio 15, 2021 | en Python

Publicidad

Lo mejor valorado

4.9 (22)

Seleccionar filas y columnas en Pandas con iloc y loc

4.7 (12)

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

4.6 (15)

Archivos JSON con Python: lectura y escritura

4.5 (10)

Diferencias entre var y let en JavaScript

4.3 (12)

Ordenación de diccionarios en Python mediante clave o valor

Publicidad

Comentarios recientes

  • Daniel Rodríguez en ¿Cómo eliminar columnas y filas en un dataframe pandas?
  • Miguel en ¿Cómo eliminar columnas y filas en un dataframe pandas?
  • alberto en Resolver problema de credenciales en Bitbucket
  • Pablo en Aplicar el método D’Hondt en Excel
  • Agapito en Creación de un EXE desde un archivo Python en Windows

Publicidad

Footer

Analytics Lane

  • Acerca de Analytics Lane
  • Boletín de noticias
  • Contacto
  • Libros
  • Lo más popular
  • Noticias
  • Tienda
  • Tiendas afiliadas

Secciones

  • Ciencia de datos
  • Criptografía
  • Herramientas
  • Machine Learning
  • Opinión
  • Productividad
  • Programación
  • Reseñas

Sobre de Analytics Lane

En Analytics Lane tratamos de explicar los principales conceptos de la ciencia e ingeniería de datos con un enfoque práctico. Los principales temas tratados son ciencia de datos, ingeniería de datos, inteligencia artificial, machine learning, deep learning y criptografía. Además, también se habla de los principales lenguajes de programación y herramientas utilizadas por los científicos e ingenieros de datos.

Copyright © 2018-2023 Analytics Lane ·Términos y condiciones ·Política de Cookies ·Política de Privacidad ·Herramientas de privacidad ·Contacto