Una tarea bastante habitual cuando se trabaja con conjuntos de datos es ordenar los registros en base los valores de una o varias columnas. Por ejemplo, buscar los clientes con mayor número de visitas y, a igual número de visitas, ordenarlos por gasto. Lo que se pude conseguir fácilmente en R. Únicamente hay que combinar el uso de order() con with() para poder ordenar dataframe … [Leer más...] acerca de Cómo ordenar dataframe en base a múltiples columnas en R
NumPy: La función reshape de NumPy con ejemplos
El método que podemos usar en NumPy para redimensionar los vectores es la función reshape. Una función que es clave conocer para trabajar de forma eficaz con NumPy. Veamos a continuación como se puede usar la función reshape de NumPy a través de diferentes ejemplos.La función reshape de NumPyEn la documentación de NumPy se pude ver que la función reshape tiene la … [Leer más...] acerca de NumPy: La función reshape de NumPy con ejemplos
Semana sin publicaciones
Esta semana realizaremos una pausa en la publicación de entradas, por lo que no habrá nuevas publicaciones hasta el próximo lunes 5 de abril.Aprovecho la ocasión para recordaros que para estar al día de todas nuestras publicaciones os podéis dar de alta en el boletín de noticias. Boletín que se envía todos los lunes con las últimas publicaciones aparecidas en Analytics … [Leer más...] acerca de Semana sin publicaciones
UCB1 para un problema Bandido Multibrazo (Multi-Armed Bandit)
Las diferentes estrategias que hemos visto hasta ahora para resolver un problema tipo Bandido Multibrazo (Multi-Armed Bandit) se basan en la exploración aleatoria de los estados, como puede ser el caso de Epsilon-Greedy, o en un conocimiento previo de los mismos, como es el caso de valores iniciales optimistas. Lo que puede ser problemático en ciertas ocasiones. Epsilon-Greedy … [Leer más...] acerca de UCB1 para un problema Bandido Multibrazo (Multi-Armed Bandit)
Guardar archivos CSV en Node
La semana pasada hemos visto el uso del módulo csv-parser para procesar archivos CSV en Node. Lo que facilita la importación de este formato de archivo. Uno de los más utilizados para el intercambio de datos entres sistemas. Esta semana vamos a ver dos módulos (csv-writer y fast-csv) con los que podremos hacer el proceso inverso: guardar archivos CSV en Node.El módulo … [Leer más...] acerca de Guardar archivos CSV en Node
Novedades en Python 3.10: Switch-Case
Una de las características que personalmente más echo en falta al trabajar con Python es la falta de una estructura de control de flujo tipo Switch-Case. Algo que se solucionará con la salida de la versión 3.10 en octubre de 2021. La nueva versión de Python, entre otras mejoras, traerá una sintaxis tipo Switch-Case con la que se podría implementar de forma óptima estas … [Leer más...] acerca de Novedades en Python 3.10: Switch-Case
Imputación de valores nulos en Python
Uno de los problemas más habituales con el que podemos encontrarnos a la hora de trabajar con un conjunto de datos es la existencia de registros con valores nulos. Pudiendo ser necesario imputar un valor a estos registros para poder usarlos en un posterior análisis. Por eso en Scikit-learn existen varias clases con las que se puede realizar la imputación de valores nulos en … [Leer más...] acerca de Imputación de valores nulos en Python
Softmax para un problema Bandido Multibrazo (Multi-Armed Bandit)
Epsilon-Greedy es una estrategia que ofrece buenos resultados en la optimización de un problema Bandido Multibrazo (Multi-Armed Bandit). Aunque durante la fase de exploración selecciona todos los bandidos con la misma probabilidad. Algo que se puede optimizar seleccionando en esta fase los bandidos en base al valor de su recompensa esperada. Con lo que el agente solamente se … [Leer más...] acerca de Softmax para un problema Bandido Multibrazo (Multi-Armed Bandit)
Importar archivos CSV en Node con csv-parser
Los archivos de valores separados por comas (CSV) es uno de los formatos más utilizados para el intercambio de información entre sistemas. Incluyendo también aquellos en los que los valores son separados por otros caracteres. Ya que, al ser simplemente archivos de texto plano, es posible leerlos e interpretarlos sin la necesidad de un programa específico. De hecho, en el caso … [Leer más...] acerca de Importar archivos CSV en Node con csv-parser
Truco Python: Importar todas las hojas de un libro Excel con Pandas
Recientemente en los comentarios del blog se ha planteado el problema de cargar todas las hojas de un libro Excel en un único paso. Algo que no se puede hacer con Pandas, ya que el método read_excel() solamente puede importar una hoja. Algo que tiene sentido, ya que en un DataFrame es difícil combinar el contenido de más de una hoja de forma automática. En esta ocasión vamos a … [Leer más...] acerca de Truco Python: Importar todas las hojas de un libro Excel con Pandas
Valores iniciales optimistas para un problema Bandido Multibrazo (Multi-Armed Bandit)
En entradas anteriores hemos aprendido a abordar el problema del Bandido Multibrazo utilizando para ello la estrategia llamada Epsilon-Greedy. Estrategia con la que se obtienen mejores resultados que los de un test A/B. Aunque Epsilon-Greedy tiene un problema cuando el número de episodios a jugar es elevado, continúa explorando los peores bandidos con una probabilidad fija … [Leer más...] acerca de Valores iniciales optimistas para un problema Bandido Multibrazo (Multi-Armed Bandit)
Obtener la media móvil en R
La media móvil es una herramienta que se utiliza habitualmente en análisis de series temporales para eliminar las fluctuaciones a corto plazo. Lo que facilita la observación de las tendencias a largo plazo de la serie. Existen diferentes métodos para calcular la media móvil, siendo el más empleado es media móvil simple (Moving Average), en la que se utilizan la media aritmética … [Leer más...] acerca de Obtener la media móvil en R











