A la hora de escribir pruebas unitarias los Stubs y Mocks son herramientas clave. Se utilizan para imitar el comportamiento de objetos que devuelven resultados no determinísticos, depende de un estado difícil de crear o son lentos. Por ejemplo, una base de datos o un API. Los valores que se obtienen de estos dependerán de su estado y, por lo tanto, no se pude garantizar que sea … [Leer más...] acerca de Mocks en R con testthat
El valor de cliente
Los clientes no son todos iguales. En cualquier negocio existen clientes rentables, algunos que no lo son y otros pocos que son muy rentables. Poder identificar a qué tipo pertenece cada uno de los clientes, tanto actuales como potenciales, es crucial parar tomar de las mejores decisiones de marketing. La rentabilidad de un cliente se puede extraer de su valor. Uno de los … [Leer más...] acerca de El valor de cliente
Compactar maquinas VirtualBox con formato vdi y vmdk
Al trabajar con maquinas VirtualBox uno de los principales problemas es el aumento de tamaño de los discos virtuales. Es muy habitual que con el uso empiecen a crecer pudiendo ocupar un espacio muy valioso. Generalmente este espacio no se puede recuperar borrando archivos del sistema operativo anfitrión, por lo que es necesario compactar maquinas VirtualBox. Introducción Hoy … [Leer más...] acerca de Compactar maquinas VirtualBox con formato vdi y vmdk
Operaciones por filas o columnas con apply en R
A la hora de trabajar con R puede ser interesante obtener el mínimo o máximo de cada una de las columnas de una matriz. En otras ocasiones puede ser interesante obtener por ejemplo la media, mediana o desviación estándar. Las funciones nativas de R no funcionan de esta manera, ya que generalmente trabajan sobre todo la matriz. Por lo que en estas situaciones se ha de utilizar … [Leer más...] acerca de Operaciones por filas o columnas con apply en R
Guardar y leer archivos Excel en Python
Microsoft Excel es uno de los programas más utilizado para la visualización y análisis de datos en la empresa. La omnipresencia de este programa hace que muchos usuarios se decanten por el formato xlsx (o xls) para exportar sus conjuntos de datos. Por esto saber leer y escribir archivos Excel en Python es clave para trabajar de forma óptima en muchos entornos. A pesar de que … [Leer más...] acerca de Guardar y leer archivos Excel en Python
Tipos de análisis en minería de datos
En una entrada anterior se ha visto qué es la minería de datos y para que se utiliza. En esta entrada se van a estudiar los posibles tipos de análisis en minería de datos. Posibles análisis en minería de datos En minería de datos se pueden realizar diferentes tipos de análisis, los cuales se pueden clasificar en base a su complejidad. Estos básicamente se pueden dividir en … [Leer más...] acerca de Tipos de análisis en minería de datos
El proceso de la minería de datos
La minería de datos hace referencia a los análisis utilizados para la identificación de patrones desconocidos en grandes conjuntos de datos. Pudiendo ser los análisis tanto automáticos como semiautomáticos. Para poder implementar los análisis de la minería de datos es necesario conocer diferentes técnicas procedentes de áreas tales como la gestión de bases de datos, la … [Leer más...] acerca de El proceso de la minería de datos
La regresión logística
El algoritmo de regresión logística es uno de los más utilizados actualmente en aprendizaje automático. Siendo su principal aplicación los problemas de clasificación binaria. Es un algoritmo simple en el que se pueden interpretar fácilmente los resultados obtenidos e identificar por qué se obtiene un resultado u otro. A pesar de su simplicidad funciona realmente bien en muchas … [Leer más...] acerca de La regresión logística
Visualización de datos en Python con Seaborn
Seaborn es una librería para Python que permite generar fácilmente elegantes gráficos. Seaborn esta basada en matplotlib y proporciona una interfaz de alto nivel que es realmente sencilla de aprender. Dada su gran popularidad se encuentra instalada por defecto en la distribución Anaconda.La representación de datos es una tarea clave del análisis de datos. La utilización de … [Leer más...] acerca de Visualización de datos en Python con Seaborn
¿Cómo guardar las contraseñas en aplicaciones?
A la hora de crear una nueva aplicación multiusuario siempre llega el momento de manejar contraseñas para gestionar el acceso de los usuarios a la misma. En estos momentos llega la pregunta de cómo guardar las contraseñas de una forma que sea segura y confiable para los usuarios. En esta entrada se presentarán algunos de los métodos incorrectos más utilizados y se explicará una … [Leer más...] acerca de ¿Cómo guardar las contraseñas en aplicaciones?
Archivos JSON con Python: lectura y escritura
El formato de archivo JSON es uno de los más populares en los últimos años para serializar de datos. Los archivos de este formato se pueden obtener como resultados de la mayoría de las aplicaciones API REST y otras aplicaciones web. Debido a su gran popularidad es cada vez más probable que se necesite leer o escribir archivos JSON con Python.En Python el formato JSON se … [Leer más...] acerca de Archivos JSON con Python: lectura y escritura
Aprendizaje supervisado y aprendizaje no supervisado
Los modelos de aprendizaje automático se pueden dividir en dos grandes familias: aprendizaje supervisado y aprendizaje no supervisado. La principal diferencia entre estas dos familias se encuentra en los datos de entrenamiento. En el aprendizaje supervisado los resultados que se desean obtener del modelo son conocidos previamente. Siendo utilizados para guiar su entrenamiento. … [Leer más...] acerca de Aprendizaje supervisado y aprendizaje no supervisado