El lenguaje de programación utilizado en Matlab es interpretado. Los algoritmos se escriben en archivos de texto plano y estos son directamente interpretados por Matlab. Esto puede ser un problema a la hora de distribuir a otros el código que hemos escrito. Puede ser que no nos interese que el receptor solamente pueda ejecutar la funcionalidad desarrollada sin acceder a la … [Leer más...] acerca de Proteger las funciones escritas en Matlab para su distribución
La exactitud y la precisión en modelos de clasificación
En los modelos de clasificación, unos de los indicadores que se utilizan para seleccionar uno u otro son la exactitud (en inglés “precision”) y la exhaustividad (en inglés “recall”). La exactitud y la exhaustividad son una forma simple de medir la calidad de las predicciones realizadas.La matriz de confusiónEn los problemas de clasificación los resultados se suelen … [Leer más...] acerca de La exactitud y la precisión en modelos de clasificación
100 primeras publicaciones en Analytics Lane
Ayer se publicó la entrada número 100 en Analytics Lane. Este es un hito que parecía inalcanzable cuando se inició el proyecto hace casi siete meses y se publicó la primera entrada. Para celebrar este hecho lanzamos un boletín semanal de noticias en el que se enviarán las ultimas publicaciones aparecidas en el blog. La suscripción al mismo es completamente gratuita y … [Leer más...] acerca de 100 primeras publicaciones en Analytics Lane
Cómo usar código C++ en R
Rcpp es un paquete disponible en el CRAN que permite emplear código C o C++ en proyectos R. Es una alternativa al la R API más sencilla, por lo que es muy popular. Esto se puede apreciar al comprobar que es utilizado por cerca de 1500 paquetes de los disponibles actualmente en el CRAN. Uno de los principales motivos para usar este paquete es el hecho de que un algoritmo escrito … [Leer más...] acerca de Cómo usar código C++ en R
Lanzamiento de la “Machine Learning University” de Amazon
Amazon acaba de lanzar la “Machine Learning University” para todos los usuarios. Estos son los mismos cursos que se utilizan internamente en Amazon para formar a sus ingenieros. Los cursos disponibles se dividen en cuatro categorías diferentes:Toma de decisiones de negociosDesarrolladorCientífico de datosIngeniero de datosLos materiales se encuentran disponibles de … [Leer más...] acerca de Lanzamiento de la “Machine Learning University” de Amazon
Diferencias entre regresión y clasificación en aprendizaje automático
Dentro del aprendizaje automático existen dos grandes familias de algoritmos: el aprendizaje supervisado y el aprendizaje no supervisado. En la primera de ellos los modelos son entrenados a partir de un conjunto de datos en el que la respuesta correcta es conocida. Siendo la finalidad del entrenamiento conseguir que los modelos reproduzcan este a partir de las características … [Leer más...] acerca de Diferencias entre regresión y clasificación en aprendizaje automático
Tablas dinámicas en Python con pandas
Es muy probable que la mayoría de los lectores tengan experiencia con las tablas dinámicas de Excel. Estas son un tipo especial de tablas en las que es posible resumir de forma dinámica el contenido de hojas calculo. A la hora de su definición es posible indicar los campos a utilizar como columna, como fila y los estadísticos que se mostraran en estas. Otro nombre por el que … [Leer más...] acerca de Tablas dinámicas en Python con pandas
El tipo de datos numérico en JavaScript
En los programas de cálculo numérico los tipos con los que suelen trabajar son los numéricos. Los más habituales son los enteros, reales y dobles, aunque también puede existir el tipo de dato complejo. En JavaScript, a diferencia de otros lenguajes de programación, solamente existe un tipo de dato numéricos que se corresponde con el formato de doble precisión de 64 bits … [Leer más...] acerca de El tipo de datos numérico en JavaScript
Medir y reducir el consumo de memoria en Python
La disponible memoria en los sistemas informáticos es un recurso limitado. En la implementación de un algoritmo esto se ha de tener en cuenta. Reducir el consumo de la memoria es clave para permitir que el programa se ejecute en sistemas con menos recursos. Además de mejorar el rendimiento en sistemas con más recursos. Para reducir el consumo de memoria en Python es necesario … [Leer más...] acerca de Medir y reducir el consumo de memoria en Python
La interpretación de las redes neuronales
Las redes neuronales profundas han demostrado ser una de las herramientas más potentes a la hora de realizar predicciones. Existen pocas técnicas en el aprendizaje automático que permitan alcanzar el nivel de precisión que ofrecen estas. Por eso no es de extrañar que el número de casos de éxito en los que son utilizadas no haga más que aumentar. Aún así, su utilización es … [Leer más...] acerca de La interpretación de las redes neuronales
Trabajar con datos en formato JSON en Matlab
JSON es un formato de texto ligero pensado para el intercambio de información entre aplicaciones. El origen de este se encuentra en la notación de objetos empleada en el lenguaje de programación JavaScript. Siendo su nombre el acrónimo de "JavaScript Object Notation" (Notación de Objeto de JavaScript). Por eso la mayoría de aplicaciones web publican los datos de las consultas … [Leer más...] acerca de Trabajar con datos en formato JSON en Matlab
Cuatro librerías para ciencia de datos en Python
Hoy en día Python es uno de los lenguajes de referencia para los científicos de datos. En él se pueden implementar desde los análisis de datos más básicos hasta los modelos de aprendizaje automático más avanzados. Permitiendo llevar estos posteriormente a directamente a producción de una forma fácil. Esta popularidad es debida a múltiples factores. Entre ellos se puede destacar … [Leer más...] acerca de Cuatro librerías para ciencia de datos en Python