Python

Análisis de datos en Python al estilo Excel con Mito

Mito es una interfaz para el análisis de datos basaos en JupyterLab con un funcionamiento similar al de las hojas de cálculo. Permitiendo llevar a cabo complejos análisis en pocos segundos, creando además de forma automática código Python con el que repetir las operaciones en cualquier conjunto de datos similar. Lo que permite crear análisis de datos en Python al estilo de Excel.

Algunas de las operaciones que se pueden realizar con Mito de forma visual sobre cualquier conjunto de datos se incluye la unión, el filtrado, la ordenación, la visualización, el uso de fórmulas y la creación de tablas resumen.

Instalación de Mito

Para instalar Mito es necesario tener Python 3.6 o posterior y ejecutar en la terminal los siguientes comandos:

python -m pip install mitoinstaller
python -m mitoinstaller install

Una vez hecho esto se puede abrir JupyterLab y abrir Mito ejecutado en una celda las siguientes instrucciones:

import mitosheet
mitosheet.sheet()

En el caso de que ya se disponga de un DataFrame en memoria sobre el que se desee trabajar solamente hay que pasar este como parámetro a la función mitosheet.sheet(), en caso contrario se puede importar desde la propia herramienta cualquier archivo.

Mito en funcionamiento

La mejor forma de ver cómo funciona esta herramienta y las ventajas que ofrece es mediante un video como el siguiente.

Como se muestra en el video, una vez realizadas todas las operaciones necesarias sobre el conjunto de datos se obtiene el código Python con los pasos. Incluyendo en este desde la carga de datos a las transformaciones más complejas. Lo que facilita la automatización de estos análisis. Así, en el caso de que sea necesario repetir estos el futuro con un conjunto de datos similar, solamente se tiene que copiar el código y apartarlo.

Conclusiones

En esta ocasión hemos visto Mito, una interfaz para el análisis de datos basados en JupyterLab con la que es posible llevar a cabo análisis de datos en Python al estilo de Excel. Con lo que se puede ahorrar mucho tiempo en las tareas diarias de análisis de datos, sin perder por ello la potencia que tiene Python.

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez
Tags: Pandas

Recent Posts

Curiosidad: La maldición de la dimensionalidad, o por qué añadir más datos puede empeorar tu modelo

En el mundo del análisis de datos solemos escuchar una idea poderosa: cuantos más datos,…

4 días ago

Error npm ERR! code EACCES al instalar paquetes en Node.js: Cómo solucionarlo paso a paso

¿Te has encontrado con este error al intentar instalar paquetes con npm? npm ERR! code…

6 días ago

Curiosidad: La Paradoja de Simpson, o por qué no siempre debes fiarte de los promedios

En ciencia de datos y estadística, los promedios y porcentajes son herramientas fundamentales para resumir…

2 semanas ago

Copias de seguridad automáticas en SQL Server con rotación de archivos

Las bases de datos son el corazón de casi cualquier sistema de información moderno. Ya…

2 semanas ago

Curiosidad: La Ley de Twyman y la trampa de los datos “interesantes”

En ciencia de datos, pocas cosas llaman más la atención de los científicos de datos…

3 semanas ago

Cómo calcular el tamaño de la muestra para encuestas

Calcular adecuadamente el tamaño de la muestra es una parte esencial en el diseño de…

3 semanas ago

This website uses cookies.