En función de la densidad de ceros en una matriz estas se pueden clasificar como dispersas (“sparse”), en las que valores igual a cero son dominantes, o densas (“dense”), en las que hay pocos registros iguales a cero. En aprendizaje automático es habitual encontrar matrices dispersas. Por ejemplo, en características que representan propiedades binarias o recuentos de … [Leer más...] acerca de Matrices dispersas (“Sparse Matrix”)
Ley potencial y visitas Analytics Lane
La ley potencial es una relación entre magnitudes que se puede observar en diferentes fenómenos de carácter físico, biológico o debidos a la actividad humana. Los cuales se caracterizan por tener distribuciones sesgadas de los valores en los que un pequeño número de registros tienen valores más elevados. Además de tener invariancia de escala. Algunos fenómenos que siguen esta … [Leer más...] acerca de Ley potencial y visitas Analytics Lane
Numpy básico: localizar valores únicos en arrays Numpy
Una de las tareas más habituales con los conjuntos de datos es la identificación de los valores únicos. Por eso Numpy cuenta con una función para ello: unique(). En esta entrada se verá como utilizar esta función.La función unique()La función de Numpy que permite localizar valores únicos en arrays es unique(), la cual se puede utilizar de la siguiente … [Leer más...] acerca de Numpy básico: localizar valores únicos en arrays Numpy
Ordenar una matriz en Matlab en base a una fila o columna
En Matlab existe la función sort() para ordenar los elementos de un vector o matriz. Pero cuando es necesario ordenar una matriz en Matlab en base a los valores de una fila o columna no existe una función análoga. Para solucionar este problema es necesario utilizar el segundo valor que devuelve la función sort() y los métodos para seleccionar elementos en Matlab.La función … [Leer más...] acerca de Ordenar una matriz en Matlab en base a una fila o columna
Tiempo de elección: predicción del número de escaños y ganador
Recientemente hemos presentado un modelo que prededice el porcentaje de voto para el partido en el gobierno en las elecciones generales de España. El cual se basa en el “Time for Change”, un modelo que ha demostrado su precisión en las elecciones presidenciales de los EE. UU. En donde el porcentaje de votos es más importante para conocer al ganador de las elecciones. Pero en … [Leer más...] acerca de Tiempo de elección: predicción del número de escaños y ganador
Numpy básico: inicialización de arrays en Numpy
En esta entrada se va a ver como hacer una tarea básica, la inicialización de arrays en Numpy con diferentes valores. Una tarea que puede ser tediosa si no se conocen y utilizan las herramientas que provee Numpy para ello. Además, estas son operaciones necesarias antes de comenzar con diferentes análisis de datos.Inicialización de arrays con ceros con np.zeros()Numpy … [Leer más...] acerca de Numpy básico: inicialización de arrays en Numpy
Aprendizaje ensemble por votación mayoritaria
A la hora de crear un modelo de aprendizaje automático para clasificar las clases en una tarea dada existen múltiples familias de algoritmo. Se puede utilizar una regresión logística, unos árboles de decisión, unas máquinas de vectores de soporte (SVM), unos k-vecinos o redes neuronales. Pero no siempre se obtiene los resultados deseosos. En estas situaciones una solución puede … [Leer más...] acerca de Aprendizaje ensemble por votación mayoritaria
Tiempo de elección: predicción de resultados electorales
“Time for Change” es un modelo con el que es posible pronosticar los resultados de las elecciones presidenciales en los Estados Unidos. Llegando a predecir la victoria de Donald Trump en 2016. Siempre me he preguntado qué tan podría funcionar un modelo similar en otros procesos electorales. Por eso he creado un modelo, al que llamaré “Tiempo de elección”, con el que intentaré … [Leer más...] acerca de Tiempo de elección: predicción de resultados electorales
Numpy básico: el método numpy.where()
En esta entrada se va a explicar el funcionamiento del método numpy.where() con el que se puede seleccionar elementos en base a una condición. Simplemente en una línea de código. El método numpy.where() puede evitar la necesidad de crear un bucle para crear un nuevo vector en base a una condición. Permitiendo así crear código más compacto.Uso básico de numpy.where()La … [Leer más...] acerca de Numpy básico: el método numpy.where()
Aumentar el rendimiento de Python con Cython
Python es uno de los lenguajes de programación más populares de la actualidad. Lo que se puede apreciar es los diferentes tipos de desarrollos en los que se suele utilizar: la inteligencia artificial, el análisis de datos o la creación de páginas web. Pero tiene un problema, el código Python es lento en comparación con lenguajes compilados como C. Un problema que se puede … [Leer más...] acerca de Aumentar el rendimiento de Python con Cython
Diferencia entre listas y tuplas en Python
A la hora de comenzar con Python es habitual utilizar las listas y las tuplas de forma prácticamente indiferente. Aparentemente ambas son dos estructuras de datos que sirven para lo mismo. Pero esto no es así, existen importantes diferencias entre listas y tuplas en Python que es necesario conocer.La principal diferencia entre listas y tuplas en PythonLa principal … [Leer más...] acerca de Diferencia entre listas y tuplas en Python
Numpy básico: aplicar una función sobre una fila o columna de una Array de Numpy
Al tener una matriz de Numpy en memoria puede darse la situación de que sea necesario calcular una función sobre los elementos de una fila o columnas. Por ejemplo, algo tan básico como sumar todos los elementos por columna. En estas situaciones se puede utilizar la función np.apply_along_axis() , con la que se puede aplicar una función sobre una fila o columna de una Array de … [Leer más...] acerca de Numpy básico: aplicar una función sobre una fila o columna de una Array de Numpy