En una entrada anterior se explicó y analizó el funcionamiento de la estrategia martingala. Una de las más populares para intentar ganar en los casinos a la ruleta. Algo que se comprobó que no es cierto, en clara contraposición a lo que piensan intuitivamente muchos jugadores. Para comprobar la validez de las conclusiones al final de la entrada se realizó una simulación de … [Leer más...] acerca de Simulador martingala en Matlab con GUIDE
Los conceptos de sesgo y varianza en aprendizaje automáticos
El sesgo y varianza son dos conceptos importantes a la hora de medir el error en los modelos de aprendizaje automático. Por eso es necesario comprender su significado para evaluar correctamente lo que nos dicen.Sesgo y varianza en estadísticaLa estadística es un área en la que se intenta extraer conclusiones de las poblaciones utilizando únicamente los datos de una … [Leer más...] acerca de Los conceptos de sesgo y varianza en aprendizaje automáticos
La estrategia martingala
Hace tiempo un amigo me comentó que había descubierto una estrategia para ganar seguro en las ruletas de los casinos. Esta era la estrategia de la martingala. A simple vista no tiene ningún defecto, se hace una apuesta a un color y cuando se gana se recogen los beneficios y se hace otra apuesta. Pero, cuando se pierde simplemente se dobla la apuesta para cubrir las pérdidas … [Leer más...] acerca de La estrategia martingala
5 libros de Python para ciencia de datos
A continuación, se muestra una recopilación de cinco libros de Python para ciencia de datos. Cualquiera de ellos es una excelente referencia, dependiendo del área y el nivel del lector.Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent SystemsEste es un excelente libro para introducirse en Aprendizaje … [Leer más...] acerca de 5 libros de Python para ciencia de datos
Random Forest
El algoritmo de Random Forest (también conocido como Bosques Aleatorios) es ampliamente utilizado para la creación de modelos supervisados. Basado en una idea simple: combinar diferentes árboles de decisión. Permite obtener modelos con menor propensión al sobreajuste que un árbol de decisión.El fundamento de Random ForestRandom Forest es básicamente un algoritmo de … [Leer más...] acerca de Random Forest
Procesado de archivos CSV enormes en Python
La librearía pandas de Python ofrece una colección de fantásticas herramientas para la manipulación y análisis de datos. Siendo una de las piezas clave de la enorme popularidad de Python entre los científicos de datos. Pero los objetos de pandas se manejan en memoria y, por lo tanto, cuando el tamaño de los datos crece es complicado poder trabajar con ellos. Por ejemplo, cuando … [Leer más...] acerca de Procesado de archivos CSV enormes en Python
Seleccionar elementos en matrices de Matlab
El tipo de dato básico de Matlab es la matriz. Aunque con el tiempo se han introducido nuevos tipos de datos como las celdas o las tablas, la matriz es el más utilizado. Saber trabajar con estos tipos de datos es clave para obtener el máximo provecho de este entorno de trabajo. A continuación, se va a explicar cómo seleccionar elementos en matrices de Matlab utilizando la … [Leer más...] acerca de Seleccionar elementos en matrices de Matlab
GUI en Matlab para cargar una matriz
Recientemente me han planteado la idea de crear una venta de Matlab para introducir matrices utilizando campos de texto. Permitiendo que la ventana soporte una matriz de tamaño arbitrario. Lo que es un reto tanto en GUIDE como App Designer. En esta entrada se va a explicar una implementación de una GUI en Matlab para cargar una matriz. Para lo que se va a codificar desde cero … [Leer más...] acerca de GUI en Matlab para cargar una matriz
Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas
Los objetos DataFrame de Pandas son una herramienta fantástica para trabajar con datos. Permitiendo realizar múltiples tareas de una forma rápida y sencilla. Una de las más habituales es filtrar, poder seleccionar un subconjunto de los datos en base a los valores de uno o varias columnas. En esta entrada se explicarán diferentes formas de realizar el filtrado de DataFrame con … [Leer más...] acerca de Operaciones de filtrado de DataFrame con Pandas en base a los valores de las columnas
Obtención de valores únicos de una columna con Pandas
En muchas ocasiones al trabajar con un DataFrame de Pandas puede que una de las columnas contenta los valores de una etiqueta. La que posiblemente tendrá muchos registros repetidos. Por lo que puede ser interesante obtener el listado de valores únicos de la columna. Afortunadamente los objetos DataFrame de la librería Pandas cuentan con un método para obtener estos. A … [Leer más...] acerca de Obtención de valores únicos de una columna con Pandas
¿Cómo cambiar el nombre de las columnas en Pandas?
En los DataFrame de Pandas los nombres de las columnas permiten identificar rápidamente el contenido de estas. Por eso saber como cambiar el nombre de las columnas en Pandas puede ser importante ya que en muchas ocasiones puede que se incluyan en el archivo de datos. O simplemente sean nombres crípticos que se desea cambiar. Además de las columnas también se puede asignar un … [Leer más...] acerca de ¿Cómo cambiar el nombre de las columnas en Pandas?
Intercambiar archivos en VirtualBox
A la hora de trabajar con máquinas virtuales suele ser necesario intercambiar archivos entre el sistema operativos anfitrión y huésped. Por ejemplo, hay que transferir archivos que se encuentra en la máquina anfitrión para ser procesados en el huésped. Posteriormente, los resultados obtenidos de este procesado han de ser transferidos a la máquina anfitrión. Por lo que disponer … [Leer más...] acerca de Intercambiar archivos en VirtualBox











