Continuamos la serie de tutoriales básicos sobre Numpy explicando cómo seleccionar elementos en un Array de Numpy. Tanto en vectores unidimensionales como de más dimensiones. Posiblemente la selección de elementos es una de las tareas que se realiza con mayor frecuencia con los objetos de Numpy.Para utilizar como ejemplo durante el resto de la entrada se creará un Array de … [Leer más...] acerca de Numpy básico: seleccionar elementos en un Array de Numpy
Python
Python es un lenguaje de programación interpretado con una filosofía basada en la legibilidad del código. Un lenguaje que gracias posee un gran ecosistema de librerías para la ciencia de datos. Por lo que es uno de los más populares en la actualidad entre los científicos de datos. Además, es uno de los lenguajes más deseados y adorados por los programadores según las encuestas de Stack Overflow.
Python es un lenguaje de programación interpretado de propósito general que obliga al uso de una sintaxis clara, gracias a la cual el código es altamente legible. Siendo un lenguaje potente y fácil de aprender. Además, permite utilizar múltiples paradigmas de programación. Lo que permite usar desde programación orientada a objetos, pasando por programación imperativa o funcional.
Los paquetes de Python más utilizados por los científicos son:
- NumPy: permite el tratamiento de datos basados en matrices,
- Pandas: ideal para la manipulación de datos heterogéneos mediante objetos DataFrame,
- SciPy: implementa tareas habituales en computación científica,
- Matplotlib: facilita la visualización de datos y scikit-learn creación de modelos de aprendizaje automático.
Las publicaciones de esta sección versan sobre estas librerías y las bases del lenguaje.
Numpy básico: encontrar la posición de un elemento en un Array de Numpy
Hace unos días se explicó cómo crear Array de Numpy a partir de otros objetos de Python. En esta ocasión se va a ver cómo encontrar la posición de un elemento buscnao el valor en un Array de Numpy. Lo que se hará mediante la función np.where().La función np.where()La función np.where() devuelve una tupla con la posición del los elementos diferentes de cero de objetos … [Leer más...] acerca de Numpy básico: encontrar la posición de un elemento en un Array de Numpy
Numpy básico: Creación de un Array de Numpy a partir de una listas o tuplas
En esta entrada se mostrará una de las tareas básicas a la hora de trabajar con Numpy: la creación de un Array de Numpy a partir de otro tipo de objetos. La tarea se puede llevar a cabo utilizando la función np.array() que se proporciona la librería Numpy.Uno básico de la función np.array()La función np.array() permite crear Array de Numpy a partir de otras estructura … [Leer más...] acerca de Numpy básico: Creación de un Array de Numpy a partir de una listas o tuplas
Novedades en pandas 0.25
El pasado 18 de julio de 2019 ha sido publicada la versión 0.25 de pandas. En esta entrada vamos a ver algunas de las novedades que trae esta versión.Actualización de pandas a la versión 0.25Antes de ver las novedades de pandas 0.25 es necesario comprobar que tenemos esta versión instalada en nuestro sistema. Para ellos se puede ejecutar el Python las siguientes líneas … [Leer más...] acerca de Novedades en pandas 0.25
Concatenar listas en Python
Las listas de Python son una pieza clave del lenguaje. En ellas se pueden almacenar cualquier tipo de dato de una forma ordenada. Por lo que son ampliamente utilizadas. A la hora de trabajar con ellas una tarea que es habitual es concatenar listas en Python. Algo, que como se mostrará a continuación, es trivial, pero es necesario conocer las alternativas … [Leer más...] acerca de Concatenar listas en Python
3 extensiones de Jupyter para reducir distracciones
Tres extensiones de Jupyter para reducir distraccionesEn una entrada anterior se mostraron algunas extensiones de para Jupyter Notebook destinadas a mejorar la productividad. Las cuales pertenecen a la colección nbextensions. Una colección en la que actualmente hay más de 60 extensiones disponibles. En la entrada de hoy se van a mostrar tres extensiones de Jupyter para … [Leer más...] acerca de 3 extensiones de Jupyter para reducir distracciones
Funciones lambda de Python
Las funciones lambda, a las que también se les conoce como funciones anónimas, es una forma de definir funciones en línea. No es una técnica propia de Python ya que se encuentran disponibles en muchos lenguajes de programación. Al definir las funciones en una línea estas se pueden aplicar a un conjunto de datos y unir posteriormente lo resultados. No siendo necesario asignar un … [Leer más...] acerca de Funciones lambda de Python
Seleccionar filas y columnas en Pandas con iloc y loc
En los DataFrames de Pandas existen diferentes formas de seleccionar los registros de las filas y columnas. Siendo dos de las más importantes iloc y loc. La primera permite seleccionar los elementos en base a la posición, mientras que la segunda permite seleccionar mediante etiquetas o declaraciones condicionales. Esta entrada en un tutorial en el que se explicaran los … [Leer más...] acerca de Seleccionar filas y columnas en Pandas con iloc y loc
Automatizar el análisis de datos con Pandas-Profiling
La librería Pandas-Profiling permite automatizar el análisis de datos en Python. Generando automáticamente informes de los conjuntos de datos contenidos en objetos DataFrame.IntroducciónUna de las primeras tareas a realizar cuando recibimos un nuevo conjunto de datos es un análisis exploratorio del mismo. En el que se incluyen tareas como determinar el rango de cada … [Leer más...] acerca de Automatizar el análisis de datos con Pandas-Profiling
Introducción a la programación funcional en Python
A la hora de crear código en Python es habitual utilizar un paradigma imperativo. Indicando de forma detallada la secuencia de tareas que el ordenador debe de ejecutar. Otro paradigma que con el que se puede escribir código en Python es la programación funcional. Un paradigma que se basa en la utilización de funciones, que permite obtener código más fácil de probar y entender. … [Leer más...] acerca de Introducción a la programación funcional en Python
5 libros de Python para ciencia de datos
A continuación, se muestra una recopilación de cinco libros de Python para ciencia de datos. Cualquiera de ellos es una excelente referencia, dependiendo del área y el nivel del lector.Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent SystemsEste es un excelente libro para introducirse en Aprendizaje … [Leer más...] acerca de 5 libros de Python para ciencia de datos
Procesado de archivos CSV enormes en Python
La librearía pandas de Python ofrece una colección de fantásticas herramientas para la manipulación y análisis de datos. Siendo una de las piezas clave de la enorme popularidad de Python entre los científicos de datos. Pero los objetos de pandas se manejan en memoria y, por lo tanto, cuando el tamaño de los datos crece es complicado poder trabajar con ellos. Por ejemplo, cuando … [Leer más...] acerca de Procesado de archivos CSV enormes en Python