Los árboles de decisión son un de la familia de modelos de aprendizaje automático más utilizados. Se pueden utilizar tanto para resolver problemas de clasificación como de regresión. Una de sus principales ventajas es la facilidad con la que se puede interpretar los resultados en base a reglas. Permitiendo no solo obtener un resultado, sino que inspeccionar los motivos por los … [Leer más...] acerca de Visualización de árboles de decisión en Python con PyDotPlus
Rcpp 1.0 disponible en el CRAN
El paquete Rcpp que facilita la integración de código C/C++ en R, coincidiendo con su décimo aniversario, ha llegado a su versión 1.0. Este paquete permite extender los paquetes y proyectos de R con código escrito en C o C++, aumentado así las posibilidades.Rcpp es un paquete muy popular, esto se puede ver el hecho que cerca de 1500 paquetes de los disponibles en el CRAN lo … [Leer más...] acerca de Rcpp 1.0 disponible en el CRAN
10 librerías para machine learning en JavaScript
JavaScript es actualmente uno de los lenguajes de programación más populares. Su principal aplicación se encuentra en las aplicaciones web, utilizándose para dar funcionalidad a las páginas web dinámicas. Otro campo en el que está tomando fuerza es para la creación de aplicaciones móviles. Siendo el lenguaje utilizado en diferentes plataformas de desarrollo híbrido como es el … [Leer más...] acerca de 10 librerías para machine learning en JavaScript
Identificando celdas con espacios en blanco en Excel
Una de las mayores fuentes de error al trabajar con texto en Excel son los espacios en blanco. Al añadir un espacio en blanco al texto de una celda no se puede observar ninguna diferencia, pero las celdas pasan a ser diferentes. Esto se vuelve un problema al utilizar funciones de búsqueda, ya que podría no obtenerse un resultado. En esta entrada se va a ver como identificar las … [Leer más...] acerca de Identificando celdas con espacios en blanco en Excel
Trabajando con ramas en Git
En unas entradas anteriores se explicó como trabajar con Git y la plataforma GitHub para gestionar el código. En esta entrada se va a presentar una de las características más útiles de los sistemas de control de versiones: las ramas. Conocer y comprender el funcionamiento de las ramas en Git permite mejorar gestión de los cambios. Evitando que modificaciones experimentales … [Leer más...] acerca de Trabajando con ramas en Git
Comparación de los registros de listas desordenadas con Excel
Identificar los registros de una lista que no se encuentra en otra es una tarea tediosa. Especialmente cuando los registros no se encuentran ordenados. Por ejemplo, si se desea comparar la lista de los asistentes a dos eventos para identificar los que son nuevos, los que repiten y los que no repiten. Cuando las dos datos se encuentran en un archivo Excel la comparación de los … [Leer más...] acerca de Comparación de los registros de listas desordenadas con Excel
Sistemas de ecuaciones lineales con numpy
Un problema de cálculo que se puede resolver fácilmente con Python son los sistemas de ecuaciones lineales. Gracias a las matrices de numpy se puede conseguir el resultado poco más de un par de líneas. Por ejemplo, para resolver un sistema de ecuaciones lineales con numpy solamente se ha de utilizar el siguiente bloque de código:Al ejecutar el código se puede comprobar … [Leer más...] acerca de Sistemas de ecuaciones lineales con numpy
Almacenamiento de repositorios Git en la nube con GitHub
En una entrada anterior se explico el flujo de trabajo básico con Git. Se explico como crear un nuevo repositorio, agregar archivos, realizar un seguimiento de los cambios y sincronizar el repositorio local con uno remoto. Los repositorios remotos se pueden crear en otro disco, en una ubicación de red o en un servidor. Actualmente existen múltiples servicios que ofrecen la … [Leer más...] acerca de Almacenamiento de repositorios Git en la nube con GitHub
Introducción a los sistemas de control de versiones con Git
Una de las habilidades clave para cualquier profesional que trabaje con código es la gestión de este. Entre los que se encuentran también los científicos de datos. Para identificar los posibles errores es clave poder conocer qué cambios se han introducción en un proyecto y cuándo han tenido lugar. La herramienta clave para la realización de esta traerás son los sistemas de … [Leer más...] acerca de Introducción a los sistemas de control de versiones con Git
Ejecución de consultas SQL desde Excel
A la hora de trabajar con Excel una de las posibles fuentes de problemas es la importación de los datos. En muchas ocasiones estos se encuentran en bases de datos, por lo que se ha de llevar a cabo un proceso de extracción, transformación y carga. Para esto se puede realizar la extracción a un archivo CSV para posteriormente importarlo en un libro Excel. Un proceso que no es … [Leer más...] acerca de Ejecución de consultas SQL desde Excel
Tres riesgos para la adopción de Blockchain
Actualmente la tecnología Blockchain (cadena de bloques) tiene unos 10 años. En este tiempo se ha visto que puede ser una tecnología clave para facilitar las transacciones financieras en un futuro cercano. Aun así, como cualquier otra tecnología incipiente, existen ciertos riesgos para la adopción de Blockchain que pueden evitar su éxito masivo. A continuación, se explicarán … [Leer más...] acerca de Tres riesgos para la adopción de Blockchain
¿Por qué limitar el número de unidades en una oferta?
En algunos mercados es habitual encontrar ofertas comerciales en las que se limitan las unidades que un cliente puede adquirir. Esta limitación se fija para evitar que los primeros clientes puedan agotar el stock disponible. Unos clientes que ante las dimisiones de la oferta puedan realizar acopio de una gran cantidad de producto. Así se puede alegar que se desea llegar al … [Leer más...] acerca de ¿Por qué limitar el número de unidades en una oferta?