Análisis de datos en Python al estilo Excel con Mito

Mito es una interfaz para el análisis de datos basaos en JupyterLab con un funcionamiento similar al de las hojas de cálculo. Permitiendo llevar a cabo complejos análisis en pocos segundos, creando además de forma automática código Python con el que repetir las operaciones en cualquier conjunto de datos similar. Lo que permite crear análisis de datos en Python al estilo de Excel.

Algunas de las operaciones que se pueden realizar con Mito de forma visual sobre cualquier conjunto de datos se incluye la unión, el filtrado, la ordenación, la visualización, el uso de fórmulas y la creación de tablas resumen.

Instalación de Mito

Para instalar Mito es necesario tener Python 3.6 o posterior y ejecutar en la terminal los siguientes comandos:

python -m pip install mitoinstaller
python -m mitoinstaller install

Una vez hecho esto se puede abrir JupyterLab y abrir Mito ejecutado en una celda las siguientes instrucciones:

import mitosheet
mitosheet.sheet()

En el caso de que ya se disponga de un DataFrame en memoria sobre el que se desee trabajar solamente hay que pasar este como parámetro a la función mitosheet.sheet(), en caso contrario se puede importar desde la propia herramienta cualquier archivo.

Mito en funcionamiento

La mejor forma de ver cómo funciona esta herramienta y las ventajas que ofrece es mediante un video como el siguiente.

Como se muestra en el video, una vez realizadas todas las operaciones necesarias sobre el conjunto de datos se obtiene el código Python con los pasos. Incluyendo en este desde la carga de datos a las transformaciones más complejas. Lo que facilita la automatización de estos análisis. Así, en el caso de que sea necesario repetir estos el futuro con un conjunto de datos similar, solamente se tiene que copiar el código y apartarlo.

Conclusiones

En esta ocasión hemos visto Mito, una interfaz para el análisis de datos basados en JupyterLab con la que es posible llevar a cabo análisis de datos en Python al estilo de Excel. Con lo que se puede ahorrar mucho tiempo en las tareas diarias de análisis de datos, sin perder por ello la potencia que tiene Python.

Daniel Rodríguez

Next Eagle: primer procesador cuántico de 127 qubit de IBM »

Previous « Reflexionar en GTD

Share

Published by

Daniel Rodríguez

Tags: Pandas

5 años ago

Cómo comparar datos con barras en Matplotlib: agrupadas, apiladas y porcentuales
Tienes los datos de ventas de tres productos en dos años distintos y quieres saber…
Subplots en Matplotlib: cómo organizar múltiples gráficos en una sola figura
Llevas un rato analizando datos y tienes cuatro gráficos abiertos en ventanas separadas: ventas, usuarios,…
Cómo comparar tendencias con gráficos de líneas en Matplotlib: guía práctica paso a paso
Tienes los datos de tráfico web de los últimos cinco meses desglosados por canal: orgánico,…

Recent Posts

Ciencia de datos

Segmentación RFM: cómo clasificar tu cartera de clientes antes de calcular el CLV

En un artículo anterior vimos la fórmula clásica del CLV junto a sus limitaciones. Una…

2 días ago

Opinión

Los récords con asterisco, o la épica del titular sin contexto – El bestiario de los indicadores económicos absurdos (parte 8 y final)

Y llegamos al final de una serie que había programado para ser de tres entradas.…

7 días ago

Ciencia de datos

PSI: Cómo Saber Cuándo tu Modelo de Credit Scoring se ha Degradado

Un modelo de credit scoring no es un artefacto estático. Se construye en un momento…

1 semana ago

Opinión

Los indicadores que se autocumplen, o cuando medir es modificar – El bestiario de los indicadores económicos absurdos (parte 7)

En las seis entregas anteriores hemos paseado por casi todos los géneros del disparate económico:…

2 semanas ago

Ciencia de datos

Customer Lifetime Value: la fórmula clásica que todo analista debería dominar

El Customer Lifetime Value (CLV) es, probablemente, la métrica más importante que puede calcular una…

2 semanas ago

Noticias

Analytics Lane lanza la versión 1.4 del laboratorio con nuevas herramientas de conversión y modelos avanzados de CLV

Seguimos ampliando el laboratorio de Analytics Lane con el lanzamiento de la versión 1.4, que…

3 semanas ago

L

This website uses cookies.