Python

Python es un lenguaje de programación interpretado con una filosofía basada en la legibilidad del código. Un lenguaje que gracias posee un gran ecosistema de librerías para la ciencia de datos. Por lo que es uno de los más populares en la actualidad entre los científicos de datos. Además, es uno de los lenguajes más deseados y adorados por los programadores según las encuestas de Stack Overflow.

Python es un lenguaje de programación interpretado de propósito general que obliga al uso de una sintaxis clara, gracias a la cual el código es altamente legible. Siendo un lenguaje potente y fácil de aprender. Además, permite utilizar múltiples paradigmas de programación. Lo que permite usar desde programación orientada a objetos, pasando por programación imperativa o funcional.

Los paquetes de Python más utilizados por los científicos son:

NumPy: permite el tratamiento de datos basados en matrices,
Pandas: ideal para la manipulación de datos heterogéneos mediante objetos DataFrame,
SciPy: implementa tareas habituales en computación científica,
Matplotlib: facilita la visualización de datos y scikit-learn creación de modelos de aprendizaje automático.

Las publicaciones de esta sección versan sobre estas librerías y las bases del lenguaje.

Seleccionar filas y columnas en Pandas con iloc y loc

junio 21, 2019 Por Daniel Rodríguez 4 comentarios
Tiempo de lectura: 5 minutos

En los DataFrames de Pandas existen diferentes formas de seleccionar los registros de las filas y columnas. Siendo dos de las más importantes iloc y loc. La primera permite seleccionar los elementos en base a la posición, mientras que la segunda permite seleccionar mediante etiquetas o declaraciones condicionales. Esta entrada en un tutorial en el que se explicaran los … [Leer más...] acerca de Seleccionar filas y columnas en Pandas con iloc y loc

Automatizar el análisis de datos con Pandas-Profiling

junio 12, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 4 minutos

La librería Pandas-Profiling permite automatizar el análisis de datos en Python. Generando automáticamente informes de los conjuntos de datos contenidos en objetos DataFrame.IntroducciónUna de las primeras tareas a realizar cuando recibimos un nuevo conjunto de datos es un análisis exploratorio del mismo. En el que se incluyen tareas como determinar el rango de cada … [Leer más...] acerca de Automatizar el análisis de datos con Pandas-Profiling

Introducción a la programación funcional en Python

junio 3, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 4 minutos

A la hora de crear código en Python es habitual utilizar un paradigma imperativo. Indicando de forma detallada la secuencia de tareas que el ordenador debe de ejecutar. Otro paradigma que con el que se puede escribir código en Python es la programación funcional. Un paradigma que se basa en la utilización de funciones, que permite obtener código más fácil de probar y entender. … [Leer más...] acerca de Introducción a la programación funcional en Python

5 libros de Python para ciencia de datos

mayo 21, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 2 minutos

A continuación, se muestra una recopilación de cinco libros de Python para ciencia de datos. Cualquiera de ellos es una excelente referencia, dependiendo del área y el nivel del lector.Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent SystemsEste es un excelente libro para introducirse en Aprendizaje … [Leer más...] acerca de 5 libros de Python para ciencia de datos

Procesado de archivos CSV enormes en Python

mayo 17, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

La librearía pandas de Python ofrece una colección de fantásticas herramientas para la manipulación y análisis de datos. Siendo una de las piezas clave de la enorme popularidad de Python entre los científicos de datos. Pero los objetos de pandas se manejan en memoria y, por lo tanto, cuando el tamaño de los datos crece es complicado poder trabajar con ellos. Por ejemplo, cuando … [Leer más...] acerca de Procesado de archivos CSV enormes en Python

Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

mayo 10, 2019 Por Daniel Rodríguez 27 comentarios
Tiempo de lectura: 5 minutos

Los objetos DataFrame de Pandas son una herramienta fantástica para trabajar con datos. Permitiendo realizar múltiples tareas de una forma rápida y sencilla. Una de las más habituales es filtrar, poder seleccionar un subconjunto de los datos en base a los valores de uno o varias columnas. En esta entrada se explicarán diferentes formas de realizar el filtrado de DataFrame con … [Leer más...] acerca de Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas

Obtención de valores únicos de una columna con Pandas

mayo 8, 2019 Por Daniel Rodríguez 2 comentarios
Tiempo de lectura: 2 minutos

En muchas ocasiones al trabajar con un DataFrame de Pandas puede que una de las columnas contenta los valores de una etiqueta. La que posiblemente tendrá muchos registros repetidos. Por lo que puede ser interesante obtener el listado de valores únicos de la columna. Afortunadamente los objetos DataFrame de la librería Pandas cuentan con un método para obtener estos. A … [Leer más...] acerca de Obtención de valores únicos de una columna con Pandas

¿Cómo cambiar el nombre de las columnas en Pandas?

mayo 6, 2019 Por Daniel Rodríguez 2 comentarios
Tiempo de lectura: 3 minutos

En los DataFrame de Pandas los nombres de las columnas permiten identificar rápidamente el contenido de estas. Por eso saber como cambiar el nombre de las columnas en Pandas puede ser importante ya que en muchas ocasiones puede que se incluyan en el archivo de datos. O simplemente sean nombres crípticos que se desea cambiar. Además de las columnas también se puede asignar un … [Leer más...] acerca de ¿Cómo cambiar el nombre de las columnas en Pandas?

Diferentes formas de ordenar dataframes en pandas

abril 29, 2019 Por Daniel Rodríguez 2 comentarios
Tiempo de lectura: 5 minutos

Una vez importado un conjunto de datos en pandas puede ser interesante ordenar el contenido de estos. Lo más habitual es ordenarlo en base a los valores de una o varias columnas. Para ordenar dataframes en pandas se pueden utilizar los métodos nativos de estos objetos. Lo que permite hacer esta tarea de un forma sencilla y eficiente.En esta entrada se va a utilizar el … [Leer más...] acerca de Diferentes formas de ordenar dataframes en pandas

Cómo leer y escribir archivos en Python

abril 26, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 4 minutos

La importación y exportación de datos desde archivos son tareas que se realizan con bastante asiduidad. Por ello, en Python, librerías como pandas incorporan herramientas para el manejo de archivos CSV o en formato Microsoft Excel. Pero, si los datos no se encuentran en un formato estándar, estas herramientas pueden no ser las adecuadas. Por lo tanto, puede ser necesario … [Leer más...] acerca de Cómo leer y escribir archivos en Python

Seis comandos mágicos de Jupyter Notebooks

abril 12, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 3 minutos

Los Jupyter Notebooks son una herramienta web con la que se puede ejecutar código de forma interactiva, almacenar los resultados y documentar el proceso. Actualmente es muy popular para explicar las técnicas y los procedimientos empleados en tareas de análisis de datos. Una de las características más poderosas de Jupyter Notebooks son los comandos mágicos. Los que son accesos … [Leer más...] acerca de Seis comandos mágicos de Jupyter Notebooks

5 extensiones para Jupyter Notebook con los que mejorar la productividad

abril 5, 2019 Por Daniel Rodríguez Deja un comentario
Tiempo de lectura: 4 minutos

Jupyter Notebook es una excelente herramienta en la que es posible integrar código interactivo con ecuaciones, gráficas y documentación. Por lo que es una solución ampliamente utilizada en entornos educativos, para tareas de exploración de datos y la documentación de algoritmos. Aún así es posible que falten algunas funcionalidades con las que mejorar nuestra productividad a la … [Leer más...] acerca de 5 extensiones para Jupyter Notebook con los que mejorar la productividad