Python

Análisis de datos en Python al estilo Excel con Mito

Mito es una interfaz para el análisis de datos basaos en JupyterLab con un funcionamiento similar al de las hojas de cálculo. Permitiendo llevar a cabo complejos análisis en pocos segundos, creando además de forma automática código Python con el que repetir las operaciones en cualquier conjunto de datos similar. Lo que permite crear análisis de datos en Python al estilo de Excel.

Algunas de las operaciones que se pueden realizar con Mito de forma visual sobre cualquier conjunto de datos se incluye la unión, el filtrado, la ordenación, la visualización, el uso de fórmulas y la creación de tablas resumen.

Instalación de Mito

Para instalar Mito es necesario tener Python 3.6 o posterior y ejecutar en la terminal los siguientes comandos:

python -m pip install mitoinstaller
python -m mitoinstaller install

Una vez hecho esto se puede abrir JupyterLab y abrir Mito ejecutado en una celda las siguientes instrucciones:

import mitosheet
mitosheet.sheet()

En el caso de que ya se disponga de un DataFrame en memoria sobre el que se desee trabajar solamente hay que pasar este como parámetro a la función mitosheet.sheet(), en caso contrario se puede importar desde la propia herramienta cualquier archivo.

Mito en funcionamiento

La mejor forma de ver cómo funciona esta herramienta y las ventajas que ofrece es mediante un video como el siguiente.

Como se muestra en el video, una vez realizadas todas las operaciones necesarias sobre el conjunto de datos se obtiene el código Python con los pasos. Incluyendo en este desde la carga de datos a las transformaciones más complejas. Lo que facilita la automatización de estos análisis. Así, en el caso de que sea necesario repetir estos el futuro con un conjunto de datos similar, solamente se tiene que copiar el código y apartarlo.

Conclusiones

En esta ocasión hemos visto Mito, una interfaz para el análisis de datos basados en JupyterLab con la que es posible llevar a cabo análisis de datos en Python al estilo de Excel. Con lo que se puede ahorrar mucho tiempo en las tareas diarias de análisis de datos, sin perder por ello la potencia que tiene Python.

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez
Tags: Pandas

Recent Posts

Descubriendo anomalías con HBOS (Histogram-Based Outlier Score)

Las anomalías, también conocidas como ”outliers”, son puntos que se desvían significativamente de la mayoría…

24 horas ago

Mejorando la calidad del código Python con comas finales: Un detalle que marca la diferencia

A la hora de escribir código los detalles importan, incluso los aparentemente insignificantes. Uno de…

3 días ago

Obtener los datos de cotización de acciones en Python

En el ámbito financiero, acceder a datos precisos es esencial para poder realizar análisis acertados.…

5 días ago

Introducción al Análisis de Componentes Principales (PCA)

El Análisis de Componentes Principales (PCA) es una técnica ampliamente utilizado en aprendizaje automático. Se…

1 semana ago

Seis años de Analytics Lane

Hace exactamente seis años, el dos de mayo de 2018, nació Analytics Lane con sus…

1 semana ago

Cómo ignorar certificados SSL inválidos con wget

Los certificados SSL que no han sido emitidos por una autoridad de certificación o caducados…

1 semana ago

This website uses cookies.