
La importación y exportación de datos desde archivos son tareas que se realizan con bastante asiduidad. Por ello, en Python, librerías como pandas incorporan herramientas para el manejo de archivos CSV o en formato Microsoft Excel. Pero, si los datos no se encuentran en un formato estándar, estas herramientas pueden no ser las adecuadas. Por lo tanto, puede ser necesario manejar los archivos directamente. En esta entrada se va a mostrar cómo leer y escribir archivos en Python.
Tabla de contenidos
Abrir un archivo para leer o escribir en Python
Antes de leer o escribir archivos con Python es necesario es necesario abrir una conexión. Lo que se puede hacer con el comando open()
, al que se le ha de indicar el nombre del archivo. Por defecto la conexión se abre en modo lectura, con lo que no es posible escribir en el archivo. Para poder escribir es necesario utilizar la opción "w"
con la que se eliminará cualquier archivo existente y creará uno nuevo. Otra opción que se puede utilizar es "a"
, con la que se añadirá nuevo contenido al archivo existente. Las opciones se pueden ver en el siguiente código.
# Abre el archivo para escribir y elimina los archivos anteriores si existen fic = open("text.txt", "w") # Abre el archivo para agregar contenido fic = open("text.txt", "a") # Abre el archivo en modo lectura fic = open("text.txt", "r")
En todos los casos, una vez finalizado las operaciones de lectura y escritura con los archivos, una buena práctica es cerrar el acceso. Para lo que se debe utilizar el método close()
.
Escribir archivos de texto en Python
Antes guardar un archivo es necesario disponer de un vector con las cadenas de texto que se desean guardar. Para ello se puede crear un vector al que se le puede llamar data
.
data = ["Línea 1", "Línea 2", "Línea 3", "Línea 4", "Línea 5"]
Para escribir el contenido de este vector en un archivo se puede hacer de dos maneras: línea a línea o de una sola vez.
Escribir el archivo línea a línea
El método más fácil directo para volcar el vector en un archivo es escribir el contenido línea a línea. Para ello se puede iterar sobre el archivo y utilizar el método write
de archivo. Este proceso es lo que se muestra en el siguiente ejemplo.
fic = open("text_1.txt", "w") for line in data: fic.write(line) fic.write("\n") fic.close()
Nótese que los elementos de vector no finalizan con el carácter salto de línea. Por lo tanto, es necesario añadir este después de escribir cada línea. Ya que, de lo contrario, todos los elementos se escribirían en una única línea en el archivo de salida.
Una forma de escribir el archivo línea a línea sin que sea necesario incluir el salto de línea es con la función print
. Para lo es necesario incluir la opción file
con la conexión al archivo. Esta opción se puede ver en el siguiente ejemplo.
fic = open("text_2.txt", "w") for line in data: print(line, file=fic) fic.close()
Escribir el archivo de una vez
Finalmente, en el caso de que los dato se encuentren en un objeto iterable se puede utilizar el método writelines
para volcar este de golpe. Aunque es necesario tener en cuenta que este método no agrega el salto de línea, por lo que puede ser necesario agregarlo con antelación.
fic = open("text_3.txt", "w") fic.writelines("%s\n" % s for s in data) fic.close()
En el ejemplo se puede apreciar que se ha iterado sobre el vector para agregar el salto de línea para cada elemento.
Leer archivos de texto en Python
La lectura de los archivos, al igual que la escritura, se puede hacer de dos maneras: línea a línea o de una sola vez.
Leer el archivo de una vez
El procedimiento para leer los archivos de texto más sencillo es hacerlo de una vez con el método readlines
. Una vez abierto el archivo solamente se ha de llamar a este método para obtener el contenido. Por ejemplo, se puede usar el siguiente código.
fic = open('text_1.txt', "r") lines = fic.readlines() fic.close()
En esta ocasión lines
es un vector en el que cada elemento es una línea del archivo. Alternativamente, en lugar del método readlines
se puede usar la función list
para leer los datos.
fic = open('text_1.txt', "r") lines = list(fic) fic.close()
Leer el archivo línea a línea
En otras ocasiones puede ser necesario leer el archivo línea a línea. Esto se puede hacer simplemente iterando sobre el fichero una vez abierto. En casa iteración se podrá hacer con cada línea cualquier operación que sea necesaria. En el siguiente ejemplo cada una de las líneas se agrega a un vector.
fic = open('text_1.txt', "r") lines = [] for line in fic: lines.append(line) fic.close()
Eliminar los saltos de línea en el archivo importado
Los tres métodos que se han visto para leer los archivos importan el salto de línea. Por lo que puede ser necesario eliminarlo antes de trabajar con los datos. Esto se puede conseguir de forma sencilla con el método rstrip
de las cadenas de texto de Python. Lo que se puede hacer iterando sobre el vector.
[s.rstrip('\n') for s in lines]
Conclusiones
Hoy se ha visto cómo leer y escribir archivos en Python utilizando solamente las funciones estándar del lenguaje. Explicando tres métodos tanto para escribir los archivos como para leerlos. Aunque normalmente para la lectura de archivos CSV en Python lo más fácil es utilizar pandas, puede ser que sea necesario procesar los datos de una forma no estándar. En estas situaciones es cuando los visto en esta entrada es bastante útil.
Imágenes: Pixabay (StockSnap)
Deja una respuesta