El término análisis de clúster hace referencia a la familia de algoritmos que permiten agrupar registros similares de un conjunto de datos en grupos. A cada uno de estos grupos es a lo que se denomina un clúster. El objetivo final del análisis es asignar a cada clúster los registros que son similares entre sí. Al mismo tiempo que los registros del resto de clústeres son … [Leer más...] acerca de ¿Qué es el análisis de clúster?
Selección de una submuestra en Python con pandas
La generación de muestras aleatorias a partir de conjunto de datos es una tarea bastante habitual. Al realizar el entrenamiento de un modelo supervisado es habitual dejar un conjunto de datos para una validación posterior. También en algunos estudios estadísticos pueden realizarse únicamente con un conjunto de los datos originales. Por este motivo los objetos DataFrame de … [Leer más...] acerca de Selección de una submuestra en Python con pandas
Utilizar el portapapeles en Python con pandas
El portapapeles es una forma rápida de mover datos entre las aplicaciones abiertas en una sesión. Por ejemplo, es posible copiar el código publicado e insertarlo en un editor de texto. Otra aplicación es copiar una parte de los datos de una hoja de cálculo e insertarlos en otra o en una sesión de Python. Para esto último se puede utilizar la función read_clipboard() disponible … [Leer más...] acerca de Utilizar el portapapeles en Python con pandas
Convertir un diccionario en DataFrame en Python
Los diccionarios son unas estructuras de datos muy flexibles que relacionan una clave con un valor. En Python la clave puede ser cualquier tipo de dato inmutable y el valor puede ser cualquier tipo de dato. La principal diferencia entre los diccionarios y las listas o tuplas es el cómo se acceden a los valores. Mientras que en las listas o tuplas se accede mediante índices en … [Leer más...] acerca de Convertir un diccionario en DataFrame en Python
Creación de aplicaciones independientes en Matlab
En una entrada anterior se ha visto cómo crear aplicaciones gráficas con Matlab. Con esto se puede conseguir que otros usuarios sin conocimientos técnicos puedan acceder a las funcionalidades creadas. Aunque tiene un problema, cada usuario ha de disponer de una licencia de Matlab para ejecutar el código. Para solucionar esto se puede utilizar la toolbox MATLAB Compiler, con la … [Leer más...] acerca de Creación de aplicaciones independientes en Matlab
Integración de Kaggle con Google Data Studio
Acaba de anunciarse la integración de Kaggle en Google Data Studio. A partir de ahora será posible conectarse a los conjuntos de dato de Kaggle, analízalos y visualizarlos desde Data Studio mediante un nuevo conector (Kaggle Community Connector). El proceso es tan simple como localizar un conjunto de datos dentro de Kaggle, seleccionar un archivo, iniciar Data Studio y crear un … [Leer más...] acerca de Integración de Kaggle con Google Data Studio
Creación de aplicaciones en Matlab con App Designer
En Matlab existen dos entornos con los que es posible crear aplicaciones gráficas Guide y App Designer. El primero de ellos existe en la plataforma desde hace bastantes años y permite crear aplicaciones con facilidad. A partir del año 2016 las diferentes versiones de Matlab incluyen también el segundo de los entornos App Designer. La aparición de este ha supuesto un salto … [Leer más...] acerca de Creación de aplicaciones en Matlab con App Designer
Proteger las funciones escritas en Matlab para su distribución
El lenguaje de programación utilizado en Matlab es interpretado. Los algoritmos se escriben en archivos de texto plano y estos son directamente interpretados por Matlab. Esto puede ser un problema a la hora de distribuir a otros el código que hemos escrito. Puede ser que no nos interese que el receptor solamente pueda ejecutar la funcionalidad desarrollada sin acceder a la … [Leer más...] acerca de Proteger las funciones escritas en Matlab para su distribución
La exactitud y la precisión en modelos de clasificación
En los modelos de clasificación, unos de los indicadores que se utilizan para seleccionar uno u otro son la exactitud (en inglés “precision”) y la exhaustividad (en inglés “recall”). La exactitud y la exhaustividad son una forma simple de medir la calidad de las predicciones realizadas.La matriz de confusiónEn los problemas de clasificación los resultados se suelen … [Leer más...] acerca de La exactitud y la precisión en modelos de clasificación
100 primeras publicaciones en Analytics Lane
Ayer se publicó la entrada número 100 en Analytics Lane. Este es un hito que parecía inalcanzable cuando se inició el proyecto hace casi siete meses y se publicó la primera entrada. Para celebrar este hecho lanzamos un boletín semanal de noticias en el que se enviarán las ultimas publicaciones aparecidas en el blog. La suscripción al mismo es completamente gratuita y … [Leer más...] acerca de 100 primeras publicaciones en Analytics Lane
Cómo usar código C++ en R
Rcpp es un paquete disponible en el CRAN que permite emplear código C o C++ en proyectos R. Es una alternativa al la R API más sencilla, por lo que es muy popular. Esto se puede apreciar al comprobar que es utilizado por cerca de 1500 paquetes de los disponibles actualmente en el CRAN. Uno de los principales motivos para usar este paquete es el hecho de que un algoritmo escrito … [Leer más...] acerca de Cómo usar código C++ en R
Lanzamiento de la “Machine Learning University” de Amazon
Amazon acaba de lanzar la “Machine Learning University” para todos los usuarios. Estos son los mismos cursos que se utilizan internamente en Amazon para formar a sus ingenieros. Los cursos disponibles se dividen en cuatro categorías diferentes:Toma de decisiones de negociosDesarrolladorCientífico de datosIngeniero de datosLos materiales se encuentran disponibles de … [Leer más...] acerca de Lanzamiento de la “Machine Learning University” de Amazon










