Python

Análisis de datos en Python al estilo Excel con Mito

Mito es una interfaz para el análisis de datos basaos en JupyterLab con un funcionamiento similar al de las hojas de cálculo. Permitiendo llevar a cabo complejos análisis en pocos segundos, creando además de forma automática código Python con el que repetir las operaciones en cualquier conjunto de datos similar. Lo que permite crear análisis de datos en Python al estilo de Excel.

Algunas de las operaciones que se pueden realizar con Mito de forma visual sobre cualquier conjunto de datos se incluye la unión, el filtrado, la ordenación, la visualización, el uso de fórmulas y la creación de tablas resumen.

Instalación de Mito

Para instalar Mito es necesario tener Python 3.6 o posterior y ejecutar en la terminal los siguientes comandos:

python -m pip install mitoinstaller
python -m mitoinstaller install

Una vez hecho esto se puede abrir JupyterLab y abrir Mito ejecutado en una celda las siguientes instrucciones:

import mitosheet
mitosheet.sheet()

En el caso de que ya se disponga de un DataFrame en memoria sobre el que se desee trabajar solamente hay que pasar este como parámetro a la función mitosheet.sheet(), en caso contrario se puede importar desde la propia herramienta cualquier archivo.

Mito en funcionamiento

La mejor forma de ver cómo funciona esta herramienta y las ventajas que ofrece es mediante un video como el siguiente.

Como se muestra en el video, una vez realizadas todas las operaciones necesarias sobre el conjunto de datos se obtiene el código Python con los pasos. Incluyendo en este desde la carga de datos a las transformaciones más complejas. Lo que facilita la automatización de estos análisis. Así, en el caso de que sea necesario repetir estos el futuro con un conjunto de datos similar, solamente se tiene que copiar el código y apartarlo.

Conclusiones

En esta ocasión hemos visto Mito, una interfaz para el análisis de datos basados en JupyterLab con la que es posible llevar a cabo análisis de datos en Python al estilo de Excel. Con lo que se puede ahorrar mucho tiempo en las tareas diarias de análisis de datos, sin perder por ello la potencia que tiene Python.

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez
Tags: Pandas

Recent Posts

Analytics Lane lanza la versión 1.2 del laboratorio con nuevas herramientas de ajuste de curvas y cálculo matricial

Seguimos iterando sobre el laboratorio de Analytics Lane y lanzamos la versión 1.2, disponible en:https://www.analyticslane.com/lab/es…

3 días ago

Cómo comparar tendencias con gráficos de líneas en Matplotlib: guía práctica paso a paso

Tienes los datos de tráfico web de los últimos cinco meses desglosados por canal: orgánico,…

6 días ago

Calibración vs Discriminación en Credit Scoring: diferencias clave y cómo evaluarlas

Imagina que construyes un modelo de credit scoring y obtienes un Gini de 0,65. Un…

2 semanas ago

Ley de Benford: cómo detectar datos manipulados con ejemplos reales

En un mundo donde los datos se han convertido en el lenguaje dominante de la…

3 semanas ago

This website uses cookies.