Posiblemente una de las mejores opciones para trabajar con fechas en Python sea el tipo de dato datetime64 de NumPy. El cual permite realizar operaciones con fechas como con números, pudiendo restar, sumar o dividir con días, semanas, meses o años. Veamos las opciones que ofrece datetime64 para calcular la diferencia entre dos fechas en Python.Creación de series con … [Leer más...] acerca de Diferencia entre dos fechas en Python
NumPy
NumPy es una librería para Python para el cálculo numérico y análisis de datos con la que es posible realizar estas operaciones de una forma fácil y sencilla, incluso al trabajar con grandes volúmenes de datos. Ofreciendo a los usuarios de Python, un lenguaje que no fue diseñado originalmente para el cálculo numérico, funcionalidades similares a las ofrecidas por otros lenguajes como MATLAB.
Al trabajar con NumPy básicamente se trabaja con la clase ndarray
, una clase con la que es posible crear objetos con los que se representan vectores y matrices, y una gran colección de funciones matemáticas de alto nivel para operar directamente sobre ellos. Lo que facilita escribir programas donde la mayoría de las operaciones funcionen en vectores o matrices en lugar de escalares.
Cómo funciona k-modes e implementación en Python
La semana pasada publiqué un artículo donde explicaba el funcionamiento del algoritmo de k-means o k-medias junto a una implementación básica en Python. Este algoritmo es uno de los más utilizados para análisis de clúster. Aunque cuenta con un problema importante, al estar basado en la métrica euclídea solamente se puede utilizar cuando todas las características del conjunto de … [Leer más...] acerca de Cómo funciona k-modes e implementación en Python
Cómo funciona k-means e implementación en Python
El algoritmo de k-means o k-medias es uno de los más utilizados dentro del análisis de clúster. Algo que se puede explicar porque este es un algoritmo sencillo, fácil de interpretar y generalmente ofrece buenos resultados en la mayoría de los conjuntos de datos. Por lo que suele estar implementado en la mayoría de las librerías estadísticas y de aprendizaje automático como … [Leer más...] acerca de Cómo funciona k-means e implementación en Python
Calcular la moda en un vector de NumPy
La moda de un conjunto de datos es el valor que más se repite. Siendo una medida de la tendencia central que indica cuál es el valor que aparece con mayor frecuencia en una muestra o estudio. A pesar de su importancia, este no es uno de los estadísticos implementados de forma nativa en NumPy, posiblemente porque se puede calcular fácilmente. Veamos cómo se puede obtener la moda … [Leer más...] acerca de Calcular la moda en un vector de NumPy
Importar automáticamente las dependencias en Python con una línea
Python es uno de los mejores entornos de trabajo que existen actualmente para los científicos de datos. Existen múltiples librerías con las que realizar de una forma sencilla y eficiente una gran cantidad de tareas, como pueden ser NumPy, Pandas, Matplotlib, Seaborn o Scikit-Learn. Aunque la importación de todas las dependencias necesarias en un proyecto puede llegar a ser una … [Leer más...] acerca de Importar automáticamente las dependencias en Python con una línea
NumPy: Concatenar matrices con vectores en NumPy
Para unir el contenido de varias matrices de NumPy se puede recurrir a la función concatenate(), con la que fácilmente se puede concatenar matrices con matrices. Pero en el caso de que sea necesario concatenar matrices con vectores es necesario usar un truco para ello.Como no concatenar matrices con vectores en NumPyPosiblemente, después de aprender como se tiene que … [Leer más...] acerca de NumPy: Concatenar matrices con vectores en NumPy
Pandas: Cómo crear un DataFrame aleatorio
En algunos casos son necesarios los conjuntos de datos aleatorios, por ejemplo, para la evaluación del rendimiento de algoritmos. Al trabajar con Pandas muchas veces necesitamos en forma de DataFrame. Algo que directamente no se puede hacer, pero sí usando los generadores de números aleatorios de NumPy, para crear a partir de estos unos DataFrame. Veamos cómo se puede crear un … [Leer más...] acerca de Pandas: Cómo crear un DataFrame aleatorio
NumPy: Obtener los índices de los máximos de un vector
Para ordenar los elementos de un vector de NumPy existe el método sort(). Pero, en algunas ocasiones, puede que esto no sea los necesario, sino los índices de los máximos o mínimos de un vector. Por ejemplo, para seleccionar los elementos asociados en otro vector. En estas ocasiones se puede recurrir al método argsort() con el cual se puede obtener justamente este … [Leer más...] acerca de NumPy: Obtener los índices de los máximos de un vector
NumPy: Imprimir todos los elementos de un vector de NumPy
Al imprimir por pantalla una matriz de NumPy es posible que no aparezcan todos los elementos, solamente una parte de estos. Lo que es debido a una opción por defecto en la configuración de la librería. Veamos cómo se puede acceder a la configuración para cambiar esta opción de modo que sea posible imprimir todos los elementos de un vector de NumPy.Las opciones de impresión … [Leer más...] acerca de NumPy: Imprimir todos los elementos de un vector de NumPy
NumPy: Insertar valores en matrices de NumPy
La inserción de valores en listas de Python no es una tarea sencilla, pero en NumPy se cuenta con la función np.insert(). Una función con la que es posible insertar valores en matrices de NumPy de una forma bastante sencilla.La función np.insert()Dentro de la librería NumPy se puede encontrar la función np.insert() con la que es posible insertar valores dentro de un … [Leer más...] acerca de NumPy: Insertar valores en matrices de NumPy
NumPy: Concatenar matrices en NumPy con np.concatenate()
Cuando necesitamos unir el contenido de varias matrices en NumPy se puede recurrir a la función np.concatenate(). Una función con la que es posible concatenar matrices en NumPy tanto por filas como por columnas.La función np.concatenate()En el caso de que necesitemos concatenar dos o más vectores o matrices de NumPy se puede recurrir a la función np.concatenate(). Una … [Leer más...] acerca de NumPy: Concatenar matrices en NumPy con np.concatenate()
NumPy: Contar valores diferentes de cero con la función np.count_nonzero()
Al trabajar con vectores muchas veces queremos contar cuántos valores cumplen una condición, para lo que en NumPy se puede recurrir a la función np.count_nonzero(). Una función que cuenta cuántos de los valores son diferentes de cero, o falso en el caso de matrices con valores booleanos, de una manera fácil.La función np.count_nonzero()En NumPy es posible encontrar la … [Leer más...] acerca de NumPy: Contar valores diferentes de cero con la función np.count_nonzero()