En muchas técnicas de aprendizaje automático es necesario poder medir la separación entre los diferentes registros. Por ejemplo, en los métodos de análisis de clúster es necesario para obtener un grado de similitud entre los registros. La forma de hacer esto es utilizando las distancias. Asumiendo de esta forma que los datos son puntos en un espacio de n … [Leer más...] acerca de Distancias y métricas en aprendizaje automático
¿Qué es el Aprendizaje Automático?
El Aprendizaje Automático es el área de la Inteligencia Artificial cuyo objetivo es desarrollar técnicas que permitan a los ordenadores aprender patrones a partir de conjuntos de datos sin la necesidad de programar estos explícitamente. Introducción al aprendizaje automático La utilización del aprendizaje automático representa un cambio frente al desarrollo clásico de … [Leer más...] acerca de ¿Qué es el Aprendizaje Automático?
Diferencias entre Blockchain y Distributed Ledger
Hoy en día las criptomonedas están de moda. Provocando que se utilicen habitualmente términos como "Blockchain" (cadena de bloques) y "Distributed Ledger" (libro mayor distribuido). Generalmente se utilizan ambos términos como sinónimos, cuando no lo son. En esta entrada se intentaran explicar las diferencias que existen entre las tecnologías "Blockchain" y "Distributed … [Leer más...] acerca de Diferencias entre Blockchain y Distributed Ledger
Seis aplicaciones del Aprendizaje Automático en la Industria 4.0.
El termino Industria 4.0, o cuarta revolución industrial, hace referencia a la introducción de las tecnologías de la información en las fabricas. Siendo este el termino que se suele emplear para hacer referencia a la transformación digital dentro de la industria. Es un termino amplio que hace referencia a la utilización de sistemas ciberfísicos, Internet de las cosas (IoT), … [Leer más...] acerca de Seis aplicaciones del Aprendizaje Automático en la Industria 4.0.
Manipulación básica de series temporales con pandas
Pandas es una biblioteca para la manipulación y el análisis de datos en el lenguaje de programación Python. Siendo una de las librerías mas utilizadas por los científicos de datos que trabajan con este lenguaje. Entre sus capacidades se encuentra el manejo de objetos DataFrame para la manipulación de tablas, la capacidad de importación y exportación los datos en múltiples … [Leer más...] acerca de Manipulación básica de series temporales con pandas
Barras de progreso en R y alarma de finalización
En muchas ocasiones los programas que se ejecutan en un ordenador tardan un tiempo considerable en finalizar. Por ejemplo, las simulaciones de tipo Montecarlo o algunos procesos de optimización. En estas situaciones es una buena idea indicar al usuario el progreso de la tarea e idealmente el tiempo aproximado que falta para la finalización. Una de las mejores herramientas para … [Leer más...] acerca de Barras de progreso en R y alarma de finalización
Redimensionar los discos en VirtualBox
Las maquinas virtuales son herramientas muy útiles, permiten realizar pruebas sin la necesidad de dedicar hardware especifico. A medida que se utilizan las máquinas el espacio de los discos virtuales puede volverse escaso. Pudiendo provocar este problema la instalación de nuevos programas, actualizaciones o la carga de nuevos conjuntos de datos. Esto se puede suceder en tanto … [Leer más...] acerca de Redimensionar los discos en VirtualBox
Mocks en R con testthat
A la hora de escribir pruebas unitarias los Stubs y Mocks son herramientas clave. Se utilizan para imitar el comportamiento de objetos que devuelven resultados no determinísticos, depende de un estado difícil de crear o son lentos. Por ejemplo, una base de datos o un API. Los valores que se obtienen de estos dependerán de su estado y, por lo tanto, no se pude garantizar que sea … [Leer más...] acerca de Mocks en R con testthat
El valor de cliente
Los clientes no son todos iguales. En cualquier negocio existen clientes rentables, algunos que no lo son y otros pocos que son muy rentables. Poder identificar a qué tipo pertenece cada uno de los clientes, tanto actuales como potenciales, es crucial parar tomar de las mejores decisiones de marketing. La rentabilidad de un cliente se puede extraer de su valor. Uno de los … [Leer más...] acerca de El valor de cliente
Compactar maquinas VirtualBox con formato vdi y vmdk
Al trabajar con maquinas VirtualBox uno de los principales problemas es el aumento de tamaño de los discos virtuales. Es muy habitual que con el uso empiecen a crecer pudiendo ocupar un espacio muy valioso. Generalmente este espacio no se puede recuperar borrando archivos del sistema operativo anfitrión, por lo que es necesario compactar maquinas VirtualBox. Introducción Hoy … [Leer más...] acerca de Compactar maquinas VirtualBox con formato vdi y vmdk
Operaciones por filas o columnas con apply en R
A la hora de trabajar con R puede ser interesante obtener el mínimo o máximo de cada una de las columnas de una matriz. En otras ocasiones puede ser interesante obtener por ejemplo la media, mediana o desviación estándar. Las funciones nativas de R no funcionan de esta manera, ya que generalmente trabajan sobre todo la matriz. Por lo que en estas situaciones se ha de utilizar … [Leer más...] acerca de Operaciones por filas o columnas con apply en R
Guardar y leer archivos Excel en Python
Microsoft Excel es uno de los programas más utilizado para la visualización y análisis de datos en la empresa. La omnipresencia de este programa hace que muchos usuarios se decanten por el formato xlsx (o xls) para exportar sus conjuntos de datos. Por esto saber leer y escribir archivos Excel en Python es clave para trabajar de forma óptima en muchos entornos. A pesar de que … [Leer más...] acerca de Guardar y leer archivos Excel en Python