Para la exploración de datos los gráficos interactivos es una solución que facilita la tarea. Poder comprobar cómo cambian los resultados al modificar uno o varios parámetros facilitan la comprensión del efecto de estos. A continuación, se explicará cómo crear gráficos interactivos en Jupyter Notebook con Python.IntroducciónEn muchas ocasiones es interesante poder … [Leer más...] acerca de Creación de gráficos interactivos en Jupyter Notebook con Python
Uso de JDBC en R para conexión a base de datos
La utilización de JDBC en R para acceder a las bases de datos ofrecer grandes ventajas frente a la utilización de paquetes específicos. En primer lugar, al utilizar un API estándar es más fácil cambiar el motor de base de datos. Por otro lado, al utilizar una maquina virtual Java la solución se hace independientemente del sistema operativo.IntroducciónEn muchas … [Leer más...] acerca de Uso de JDBC en R para conexión a base de datos
Utilización de R desde Java con Rserve
Poder utilizar la potencia de R desde Java u otros lenguajes de programación puede facilitar el desarrollo de soluciones. Para esto, existe el paquete Rserve que permite crear un servicio en una máquina mediante el cual se puede ejecutar código R desde en remoto. Gracias a esto se puede llevar la potencia de análisis de R a otros lenguajes que no disponen de librerías … [Leer más...] acerca de Utilización de R desde Java con Rserve
Unir y combinar dataframes con pandas en Python
En muchas ocasiones nos podemos encontrar con que los conjuntos de datos no se encuentran agregados en una única tabla. Por ejemplo, los datos personales de los clientes y las transacciones estos han realizado. En estas situaciones la consolidación de los datos se puede realizar tengo una base de datos con SQL. Pero esto no es necesario, la consolidación también se puede … [Leer más...] acerca de Unir y combinar dataframes con pandas en Python
Google Dataset Search
Localizar conjuntos de datos públicos para los utlizar en modelos es una tarea ardua y complicada. Normalmente es necesario probar en diferentes repositorios para encontrar datos que se adapten a las necesidades puntuales de un proyecto.La solución a este problema se puede encontrar en el nuevo servicio que acaba de lanzar Google en fase beta: Google Dataset Search. Como su … [Leer más...] acerca de Google Dataset Search
Diferencias entre cifrado simétrico y asimétrico
Los métodos de encriptación se pueden dividir básicamente en dos: cifrado simétrico y cifrado asimétrico. En esta entrada se explicará de las diferencias básicas que existe entre estos dos métodos.CifradoAntes de analizar las diferencias entre el cifrado simétrico y asimétrico es necesario saber qué es cifrar. Según la Real Academia de la Lengua Española cifrar … [Leer más...] acerca de Diferencias entre cifrado simétrico y asimétrico
Disponibilidad de Python 3.7 en Anaconda
Anaconda acaba de anunciar la disponibilidad de los paquetes de Python 3.7 para todas las plataformas soportadas en su repositorio. Esto incluye representa 865 paquete en Linux, 864 en macOS y 779 en Windows. Además, también se ha también se ha anunciado la distribución de la nueva versión de Miniconda3 (v4.5.11) que incluye Python 3.7 en lugar de Python 3.6.Python 3.7 es … [Leer más...] acerca de Disponibilidad de Python 3.7 en Anaconda
Acelerar las funciones de Python con lru_cache
En esta entrada se va a ver cómo cachear los métodos para acelerar las funciones de Python con lru_cache.Al trabajar con funciones recursivas, como puede ser la sucesión de Fibonacci, es habitual llamar al mismo método con los mismos parámetros en repetidas ocasiones. Si el resultado del método se obtiene rápidamente esto no es un problema, pero si en el caso contrario. Una … [Leer más...] acerca de Acelerar las funciones de Python con lru_cache
Expansión de listas de valores en dataframes con pandas
En ciertas ocasiones, tras la importación de un conjunto de datos, puede ser que uno de los registros de un dataframe contenga listas de valores en lugar de un único valor. Generalmente, para poder trabajar con estos valores es necesario convertir las listas en series. Esta transformación es una tarea trivial cuando solamente se ha de realizar para un único registro. En el caso … [Leer más...] acerca de Expansión de listas de valores en dataframes con pandas
Reglas de asociación y market-basket analysis
Las reglas de asociación permiten encontrar patrones comunes en los elementos de grandes conjuntos de datos. Una de las principales aplicaciones de esta técnica es el análisis de la cesta de la compra (market-basket analysis). Mediante el cual se pude identificar los productos que se compra de forma conjunta en una tienda.Uno de los ejemplos más citado sobre los resultados … [Leer más...] acerca de Reglas de asociación y market-basket analysis
Ordenar los datos en R utilizando los valores de otra columna
En ciertas ocasiones es necesario ordenar los datos de un dataframe o matiz en base a los valores de una columna. Por ejemplo, cuando se tiene los datos de clientes y se desea ordenar por alguna variable como el gasto o la edad. En esta entrada se va a explicar cómo ordenar los datos en R en base a una columna.Creación de un conjunto de datos de ejemploEn primer lugar, … [Leer más...] acerca de Ordenar los datos en R utilizando los valores de otra columna
¿Qué es el Aprendizaje Profundo o Deep Learning?
El aprendizaje profundo (“Deep Learning”) es un área aprendizaje automático en que se estudian las redes neuronales profundas. Como se ha explicado en una entrada anterior el aprendizaje automático es a su vez un área de la inteligencia artificial. Por lo que los algoritmos de aprendizaje profundo solo a su vez algoritmos de inteligencia artificial. Historia de las redes … [Leer más...] acerca de ¿Qué es el Aprendizaje Profundo o Deep Learning?