Como científicos de datos es habitual trabajar con conjuntos de datos en los que existen campos confidenciales, a los que solamente deberían poder acceder un conjunto limitado de personas. Una de las mejores opciones en estas situaciones es protegerlos mediante cifrado. Al trabajar en R, en el CRAN se puede encontrar el paquete encryptr con el que se puede cifrar datos en … [Leer más...] acerca de Cifrar datos en R con encryptr
R
R nació como una implementación libre del S, un lenguaje de programación muy utilizado por la comunidad estadística. Actualmente es el lenguaje de programación más popular para el análisis estadístico. Gozando de una gran popularidad en campos como la minería de datos, la bioinformática y finanzas. Una gran parte de su popularidad es debido a que se puede extender fácilmente gracias a los más de 15.000 paquetes disponibles hoy en día en el CRAN. Por lo que casi siempre se puede encontrar un paquete que implementa el algoritmo necesario en cada momento
Ejemplo de uso: regresión lineal con rpy2
En una entrada reciente se ha realizado una introducción a la librería de Python rpy2 con la que es posible utilizar R en Python. La integración de R con Python permite acceder a todos los paquetes disponibles en R sin salir de Python. Obteniendo así un entorno mucho más productivo. En esta ocasión se va a ver un ejemplo de uso de rpy2. Realizando una regresión lineal con rpy2. … [Leer más...] acerca de Ejemplo de uso: regresión lineal con rpy2
Utilizar R desde Python con rpy2
Python dispone de un gran ecosistema para el cálculo numérico, el análisis estadístico y el aprendizaje automático. Siendo el entorno favorito de muchos científicos de datos. Por otro lado, R es también un gran entorno para el análisis estadístico que dispone de una amplia colección de paquetes. A pesar de ellos, cada uno tiene sus ventajas e inconvenientes. Por este motivo … [Leer más...] acerca de Utilizar R desde Python con rpy2
Cómo usar código C++ en R
Rcpp es un paquete disponible en el CRAN que permite emplear código C o C++ en proyectos R. Es una alternativa al la R API más sencilla, por lo que es muy popular. Esto se puede apreciar al comprobar que es utilizado por cerca de 1500 paquetes de los disponibles actualmente en el CRAN. Uno de los principales motivos para usar este paquete es el hecho de que un algoritmo escrito … [Leer más...] acerca de Cómo usar código C++ en R
Configurar la máquina virtual de Java en R
Existen múltiples paquetes de R que utilizan la máquina virtual de Java para trabajar. Una mala configuración de esta puede provocar que no funcione bien. A continuación se explican en un par de trucos para configurar la máquina virtual de Java en R y poder evitar problemas.IntroducciónJava es uno de los lenguajes de propósito general más populares en la actualidad. Una … [Leer más...] acerca de Configurar la máquina virtual de Java en R
Uso de JDBC en R para conexión a base de datos
La utilización de JDBC en R para acceder a las bases de datos ofrecer grandes ventajas frente a la utilización de paquetes específicos. En primer lugar, al utilizar un API estándar es más fácil cambiar el motor de base de datos. Por otro lado, al utilizar una maquina virtual Java la solución se hace independientemente del sistema operativo.IntroducciónEn muchas … [Leer más...] acerca de Uso de JDBC en R para conexión a base de datos
Utilización de R desde Java con Rserve
Poder utilizar la potencia de R desde Java u otros lenguajes de programación puede facilitar el desarrollo de soluciones. Para esto, existe el paquete Rserve que permite crear un servicio en una máquina mediante el cual se puede ejecutar código R desde en remoto. Gracias a esto se puede llevar la potencia de análisis de R a otros lenguajes que no disponen de librerías … [Leer más...] acerca de Utilización de R desde Java con Rserve
Ordenar los datos en R utilizando los valores de otra columna
En ciertas ocasiones es necesario ordenar los datos de un dataframe o matiz en base a los valores de una columna. Por ejemplo, cuando se tiene los datos de clientes y se desea ordenar por alguna variable como el gasto o la edad. En esta entrada se va a explicar cómo ordenar los datos en R en base a una columna.Creación de un conjunto de datos de ejemploEn primer lugar, … [Leer más...] acerca de Ordenar los datos en R utilizando los valores de otra columna
Barras de progreso en R y alarma de finalización
En muchas ocasiones los programas que se ejecutan en un ordenador tardan un tiempo considerable en finalizar. Por ejemplo, las simulaciones de tipo Montecarlo o algunos procesos de optimización. En estas situaciones es una buena idea indicar al usuario el progreso de la tarea e idealmente el tiempo aproximado que falta para la finalización. Una de las mejores herramientas para … [Leer más...] acerca de Barras de progreso en R y alarma de finalización
Mocks en R con testthat
A la hora de escribir pruebas unitarias los Stubs y Mocks son herramientas clave. Se utilizan para imitar el comportamiento de objetos que devuelven resultados no determinísticos, depende de un estado difícil de crear o son lentos. Por ejemplo, una base de datos o un API. Los valores que se obtienen de estos dependerán de su estado y, por lo tanto, no se pude garantizar que sea … [Leer más...] acerca de Mocks en R con testthat
Operaciones por filas o columnas con apply en R
A la hora de trabajar con R puede ser interesante obtener el mínimo o máximo de cada una de las columnas de una matriz. En otras ocasiones puede ser interesante obtener por ejemplo la media, mediana o desviación estándar. Las funciones nativas de R no funcionan de esta manera, ya que generalmente trabajan sobre todo la matriz. Por lo que en estas situaciones se ha de utilizar … [Leer más...] acerca de Operaciones por filas o columnas con apply en R
Creación de un CRAN corporativo
La distribución de las librerías en un entrono de trabajo son clave para el éxito. Disponer de la última versión de estas es imprescindible para poder realizar el trabajo de forma efectiva y evitar los errores ya conocidos. En R la forma más popular de instalar paquetes en los entornos de trabajo es a través del CRAN. El CRAN es abierto y esto puede no ser … [Leer más...] acerca de Creación de un CRAN corporativo