El algoritmo de k-means o k-medias es uno de los más utilizados dentro del análisis de clúster. Algo que se puede explicar porque este es un algoritmo sencillo, fácil de interpretar y generalmente ofrece buenos resultados en la mayoría de los conjuntos de datos. Por lo que suele estar implementado en la mayoría de las librerías estadísticas y de aprendizaje automático como … [Leer más...] acerca de Cómo funciona k-means e implementación en Python
NumPy
NumPy es una librería para Python para el cálculo numérico y análisis de datos con la que es posible realizar estas operaciones de una forma fácil y sencilla, incluso al trabajar con grandes volúmenes de datos. Ofreciendo a los usuarios de Python, un lenguaje que no fue diseñado originalmente para el cálculo numérico, funcionalidades similares a las ofrecidas por otros lenguajes como MATLAB.
Al trabajar con NumPy básicamente se trabaja con la clase ndarray
, una clase con la que es posible crear objetos con los que se representan vectores y matrices, y una gran colección de funciones matemáticas de alto nivel para operar directamente sobre ellos. Lo que facilita escribir programas donde la mayoría de las operaciones funcionen en vectores o matrices en lugar de escalares.
Calcular la moda en un vector de NumPy
La moda de un conjunto de datos es el valor que más se repite. Siendo una medida de la tendencia central que indica cuál es el valor que aparece con mayor frecuencia en una muestra o estudio. A pesar de su importancia, este no es uno de los estadísticos implementados de forma nativa en NumPy, posiblemente porque se puede calcular fácilmente. Veamos cómo se puede obtener la moda … [Leer más...] acerca de Calcular la moda en un vector de NumPy
Importar automáticamente las dependencias en Python con una línea
Python es uno de los mejores entornos de trabajo que existen actualmente para los científicos de datos. Existen múltiples librerías con las que realizar de una forma sencilla y eficiente una gran cantidad de tareas, como pueden ser NumPy, Pandas, Matplotlib, Seaborn o Scikit-Learn. Aunque la importación de todas las dependencias necesarias en un proyecto puede llegar a ser una … [Leer más...] acerca de Importar automáticamente las dependencias en Python con una línea
NumPy: Concatenar matrices con vectores en NumPy
Para unir el contenido de varias matrices de NumPy se puede recurrir a la función concatenate(), con la que fácilmente se puede concatenar matrices con matrices. Pero en el caso de que sea necesario concatenar matrices con vectores es necesario usar un truco para ello.Como no concatenar matrices con vectores en NumPyPosiblemente, después de aprender como se tiene que … [Leer más...] acerca de NumPy: Concatenar matrices con vectores en NumPy
Pandas: Cómo crear un DataFrame aleatorio
En algunos casos son necesarios los conjuntos de datos aleatorios, por ejemplo, para la evaluación del rendimiento de algoritmos. Al trabajar con Pandas muchas veces necesitamos en forma de DataFrame. Algo que directamente no se puede hacer, pero sí usando los generadores de números aleatorios de NumPy, para crear a partir de estos unos DataFrame. Veamos cómo se puede crear un … [Leer más...] acerca de Pandas: Cómo crear un DataFrame aleatorio
NumPy: Obtener los índices de los máximos de un vector
Para ordenar los elementos de un vector de NumPy existe el método sort(). Pero, en algunas ocasiones, puede que esto no sea los necesario, sino los índices de los máximos o mínimos de un vector. Por ejemplo, para seleccionar los elementos asociados en otro vector. En estas ocasiones se puede recurrir al método argsort() con el cual se puede obtener justamente este … [Leer más...] acerca de NumPy: Obtener los índices de los máximos de un vector
NumPy: Imprimir todos los elementos de un vector de NumPy
Al imprimir por pantalla una matriz de NumPy es posible que no aparezcan todos los elementos, solamente una parte de estos. Lo que es debido a una opción por defecto en la configuración de la librería. Veamos cómo se puede acceder a la configuración para cambiar esta opción de modo que sea posible imprimir todos los elementos de un vector de NumPy.Las opciones de impresión … [Leer más...] acerca de NumPy: Imprimir todos los elementos de un vector de NumPy
NumPy: Insertar valores en matrices de NumPy
La inserción de valores en listas de Python no es una tarea sencilla, pero en NumPy se cuenta con la función np.insert(). Una función con la que es posible insertar valores en matrices de NumPy de una forma bastante sencilla.La función np.insert()Dentro de la librería NumPy se puede encontrar la función np.insert() con la que es posible insertar valores dentro de un … [Leer más...] acerca de NumPy: Insertar valores en matrices de NumPy
NumPy: Concatenar matrices en NumPy con np.concatenate()
Cuando necesitamos unir el contenido de varias matrices en NumPy se puede recurrir a la función np.concatenate(). Una función con la que es posible concatenar matrices en NumPy tanto por filas como por columnas.La función np.concatenate()En el caso de que necesitemos concatenar dos o más vectores o matrices de NumPy se puede recurrir a la función np.concatenate(). Una … [Leer más...] acerca de NumPy: Concatenar matrices en NumPy con np.concatenate()
NumPy: Contar valores diferentes de cero con la función np.count_nonzero()
Al trabajar con vectores muchas veces queremos contar cuántos valores cumplen una condición, para lo que en NumPy se puede recurrir a la función np.count_nonzero(). Una función que cuenta cuántos de los valores son diferentes de cero, o falso en el caso de matrices con valores booleanos, de una manera fácil.La función np.count_nonzero()En NumPy es posible encontrar la … [Leer más...] acerca de NumPy: Contar valores diferentes de cero con la función np.count_nonzero()
NumPy: ¿Qué es una matriz estructurada de NumPy y cómo trabajar con ellas en Python?
A la hora de crear una matriz de NumPy es posible definir el tipo de dato mediante la propiedad dtype, evitando de esta forma que este sea deducido a partir de los datos. Aunque inicialmente se pueda pensar en el uso de los tipos primitivos: enteros, reales o cadenas de texto, también es posible emplear estructuras definidas por el usuario. Creando en este último caso lo que se … [Leer más...] acerca de NumPy: ¿Qué es una matriz estructurada de NumPy y cómo trabajar con ellas en Python?
NumPy: ¿Cómo acceder al i-ésimo elemento de una matriz multidimensional de NumPy?
Una pregunta que me suele hacer de forma habitual los usuarios que comienzan con NumPy es cómo se puede acceder a un elemento en concreto. Pudiendo hacer referencia tanto a un escalar, una columna como una fila. Algo que es relativamente sencillo en cuanto se entiende el funcionamiento de las matrices multidimensionales de NumPy. Así que comprendamos estos objetos para saber … [Leer más...] acerca de NumPy: ¿Cómo acceder al i-ésimo elemento de una matriz multidimensional de NumPy?