La primera opción que suele venir a la cabeza cuando se necesita realizar una misma operación sobre diferentes valores es mediante el uso de un bucle. Lo que en Python se puede hacer mediante el uso de for o while. Esta es una forma natural de operar, primero se ejecuta la instrucción sobre el primer elemento, después sobre el segundo y así hasta que se termina. Si se conoce el … [Leer más...] acerca de Acelera el código mediante vectorización en Python: elimina los bucles para aumentar el rendimiento hasta 1800 veces
NumPy
NumPy es una librería para Python para el cálculo numérico y análisis de datos con la que es posible realizar estas operaciones de una forma fácil y sencilla, incluso al trabajar con grandes volúmenes de datos. Ofreciendo a los usuarios de Python, un lenguaje que no fue diseñado originalmente para el cálculo numérico, funcionalidades similares a las ofrecidas por otros lenguajes como MATLAB.
Al trabajar con NumPy básicamente se trabaja con la clase ndarray
, una clase con la que es posible crear objetos con los que se representan vectores y matrices, y una gran colección de funciones matemáticas de alto nivel para operar directamente sobre ellos. Lo que facilita escribir programas donde la mayoría de las operaciones funcionen en vectores o matrices en lugar de escalares.
Obtener los índices de los N valores máximos en NumPy
En NumPy existe la función np.max() para obtener el máximo de un vector o matriz y np.argmax() para obtener la posición del máximo. De forma análoga también existen las funciones np.min() y np.argmin() para el caso de querer obtener el mínimo o su posición. Pero, en el caso de que se desee obtener los índices de los N valores máximos en NumPy no existe una función directa y es … [Leer más...] acerca de Obtener los índices de los N valores máximos en NumPy
Diferencia entre dos fechas en Python
Posiblemente una de las mejores opciones para trabajar con fechas en Python sea el tipo de dato datetime64 de NumPy. El cual permite realizar operaciones con fechas como con números, pudiendo restar, sumar o dividir con días, semanas, meses o años. Veamos las opciones que ofrece datetime64 para calcular la diferencia entre dos fechas en Python.Creación de series con … [Leer más...] acerca de Diferencia entre dos fechas en Python
Cómo funciona k-modes e implementación en Python
La semana pasada publiqué un artículo donde explicaba el funcionamiento del algoritmo de k-means o k-medias junto a una implementación básica en Python. Este algoritmo es uno de los más utilizados para análisis de clúster. Aunque cuenta con un problema importante, al estar basado en la métrica euclídea solamente se puede utilizar cuando todas las características del conjunto de … [Leer más...] acerca de Cómo funciona k-modes e implementación en Python
Cómo funciona k-means e implementación en Python
El algoritmo de k-means o k-medias es uno de los más utilizados dentro del análisis de clúster. Algo que se puede explicar porque este es un algoritmo sencillo, fácil de interpretar y generalmente ofrece buenos resultados en la mayoría de los conjuntos de datos. Por lo que suele estar implementado en la mayoría de las librerías estadísticas y de aprendizaje automático como … [Leer más...] acerca de Cómo funciona k-means e implementación en Python
Calcular la moda en un vector de NumPy
La moda de un conjunto de datos es el valor que más se repite. Siendo una medida de la tendencia central que indica cuál es el valor que aparece con mayor frecuencia en una muestra o estudio. A pesar de su importancia, este no es uno de los estadísticos implementados de forma nativa en NumPy, posiblemente porque se puede calcular fácilmente. Veamos cómo se puede obtener la moda … [Leer más...] acerca de Calcular la moda en un vector de NumPy
Importar automáticamente las dependencias en Python con una línea
Python es uno de los mejores entornos de trabajo que existen actualmente para los científicos de datos. Existen múltiples librerías con las que realizar de una forma sencilla y eficiente una gran cantidad de tareas, como pueden ser NumPy, Pandas, Matplotlib, Seaborn o Scikit-Learn. Aunque la importación de todas las dependencias necesarias en un proyecto puede llegar a ser una … [Leer más...] acerca de Importar automáticamente las dependencias en Python con una línea
NumPy: Concatenar matrices con vectores en NumPy
Para unir el contenido de varias matrices de NumPy se puede recurrir a la función concatenate(), con la que fácilmente se puede concatenar matrices con matrices. Pero en el caso de que sea necesario concatenar matrices con vectores es necesario usar un truco para ello.Como no concatenar matrices con vectores en NumPyPosiblemente, después de aprender como se tiene que … [Leer más...] acerca de NumPy: Concatenar matrices con vectores en NumPy
Pandas: Cómo crear un DataFrame aleatorio
En algunos casos son necesarios los conjuntos de datos aleatorios, por ejemplo, para la evaluación del rendimiento de algoritmos. Al trabajar con Pandas muchas veces necesitamos en forma de DataFrame. Algo que directamente no se puede hacer, pero sí usando los generadores de números aleatorios de NumPy, para crear a partir de estos unos DataFrame. Veamos cómo se puede crear un … [Leer más...] acerca de Pandas: Cómo crear un DataFrame aleatorio
NumPy: Obtener los índices de los máximos de un vector
Para ordenar los elementos de un vector de NumPy existe el método sort(). Pero, en algunas ocasiones, puede que esto no sea los necesario, sino los índices de los máximos o mínimos de un vector. Por ejemplo, para seleccionar los elementos asociados en otro vector. En estas ocasiones se puede recurrir al método argsort() con el cual se puede obtener justamente este … [Leer más...] acerca de NumPy: Obtener los índices de los máximos de un vector
NumPy: Imprimir todos los elementos de un vector de NumPy
Al imprimir por pantalla una matriz de NumPy es posible que no aparezcan todos los elementos, solamente una parte de estos. Lo que es debido a una opción por defecto en la configuración de la librería. Veamos cómo se puede acceder a la configuración para cambiar esta opción de modo que sea posible imprimir todos los elementos de un vector de NumPy.Las opciones de impresión … [Leer más...] acerca de NumPy: Imprimir todos los elementos de un vector de NumPy
NumPy: Insertar valores en matrices de NumPy
La inserción de valores en listas de Python no es una tarea sencilla, pero en NumPy se cuenta con la función np.insert(). Una función con la que es posible insertar valores en matrices de NumPy de una forma bastante sencilla.La función np.insert()Dentro de la librería NumPy se puede encontrar la función np.insert() con la que es posible insertar valores dentro de un … [Leer más...] acerca de NumPy: Insertar valores en matrices de NumPy