R

Archivos comprimidos en R

Hace algún tiempo me di cuenta de la cantidad de proyectos de análisis de datos en los que la información se encuentra en archivo de textos. En cada ocasión que cargo el proyecto leo los datos y trabajo con ellos. El uso de este formato es ideal, son independientes tanto de la plataforma como de la herramienta utilizada en análisis. Permitiendo que sean usados por miembros del equipo, aunque utilicen herramientas diferentes a las nuestras. Pero tienen un problema, ocupan un gran espacio. Lo que es un problema tanto para su almacenamiento como para el envío de estos a través de las redes. Para su transmisión una practica habitual es comprimir los mismo, ya que no es complicado conseguir factores de mayores de 1 a 10, y descomprimirlos al recibir los datos para trabajar.

Una de las capacidades poco conocidas de R es la de poder trabajar directamente con los archivos comprimidos. Así podemos ahorrar espacio a la hora de almacenar nuestros proyectos o reducir los datos que se tienen que trasmitir cuando estos se encuentran en ubicaciones remotas. Para un archivo en formato CSV comprimido con gzip solamente se ha de utilizar el comando gzfile antes de llamar a read.csv. Esto es lo que se muestra en la siguiente línea:

data <- read.csv(gzfile('file.csv.bz'))

Además de gzip R también soporta los formatos bzip2 y xz, para los que se ha de utilizar las funciones bzfile y xzfile respectivamente.

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez

Recent Posts

Data Lake y Data Warehouse: diferencias, usos y cómo se complementan en la era del dato

En la era del dato, las organizaciones se enfrentan al reto de gestionar volúmenes masivos…

3 días ago

Documentar tu API de Express con TypeScript usando OpenAPI (Swagger)

En la serie Creación de una API REST con Express y TypeScript construimos una API…

5 días ago

Curiosidad: El sesgo de supervivencia, o por qué prestar atención sólo a los que “llegaron” puede engañarte

Durante la Segunda Guerra Mundial, la Fuerza Aérea de Estados Unidos quería reforzar sus aviones…

1 semana ago

Cómo abrir una ventana de Chrome con tamaño y posición específicos desde la línea de comandos en Windows

En muchas situaciones —ya sea para grabar un tutorial, tomar capturas de pantalla profesionales, probar…

2 semanas ago

La Paradoja del Cumpleaños, o por qué no es tan raro compartir fecha de nacimiento

Imagínate en una sala con un grupo de personas, por ejemplo, en una oficina, un…

2 semanas ago

Programador de tareas de Windows: Guía definitiva para automatizar tu trabajo (BAT, PowerShell y Python)

En el trabajo diario con ordenadores, es común encontrarse con tareas repetitivas: realizar copias de…

3 semanas ago

This website uses cookies.