Python dispone de un gran ecosistema para el cálculo numérico, el análisis estadístico y el aprendizaje automático. Siendo el entorno favorito de muchos científicos de datos. Por otro lado, R es también un gran entorno para el análisis estadístico que dispone de una amplia colección de paquetes. A pesar de ellos, cada uno tiene sus ventajas e inconvenientes. Por este motivo … [Leer más...] acerca de Utilizar R desde Python con rpy2
R
R nació como una implementación libre del S, un lenguaje de programación muy utilizado por la comunidad estadística. Actualmente es el lenguaje de programación más popular para el análisis estadístico. Gozando de una gran popularidad en campos como la minería de datos, la bioinformática y finanzas. Una gran parte de su popularidad es debido a que se puede extender fácilmente gracias a los más de 15.000 paquetes disponibles hoy en día en el CRAN. Por lo que casi siempre se puede encontrar un paquete que implementa el algoritmo necesario en cada momento
Cómo usar código C++ en R
Rcpp es un paquete disponible en el CRAN que permite emplear código C o C++ en proyectos R. Es una alternativa al la R API más sencilla, por lo que es muy popular. Esto se puede apreciar al comprobar que es utilizado por cerca de 1500 paquetes de los disponibles actualmente en el CRAN. Uno de los principales motivos para usar este paquete es el hecho de que un algoritmo escrito … [Leer más...] acerca de Cómo usar código C++ en R
Configurar la máquina virtual de Java en R
Existen múltiples paquetes de R que utilizan la máquina virtual de Java para trabajar. Una mala configuración de esta puede provocar que no funcione bien. A continuación se explican en un par de trucos para configurar la máquina virtual de Java en R y poder evitar problemas.IntroducciónJava es uno de los lenguajes de propósito general más populares en la actualidad. Una … [Leer más...] acerca de Configurar la máquina virtual de Java en R
Uso de JDBC en R para conexión a base de datos
La utilización de JDBC en R para acceder a las bases de datos ofrecer grandes ventajas frente a la utilización de paquetes específicos. En primer lugar, al utilizar un API estándar es más fácil cambiar el motor de base de datos. Por otro lado, al utilizar una maquina virtual Java la solución se hace independientemente del sistema operativo.IntroducciónEn muchas … [Leer más...] acerca de Uso de JDBC en R para conexión a base de datos
Utilización de R desde Java con Rserve
Poder utilizar la potencia de R desde Java u otros lenguajes de programación puede facilitar el desarrollo de soluciones. Para esto, existe el paquete Rserve que permite crear un servicio en una máquina mediante el cual se puede ejecutar código R desde en remoto. Gracias a esto se puede llevar la potencia de análisis de R a otros lenguajes que no disponen de librerías … [Leer más...] acerca de Utilización de R desde Java con Rserve
Ordenar los datos en R utilizando los valores de otra columna
En ciertas ocasiones es necesario ordenar los datos de un dataframe o matiz en base a los valores de una columna. Por ejemplo, cuando se tiene los datos de clientes y se desea ordenar por alguna variable como el gasto o la edad. En esta entrada se va a explicar cómo ordenar los datos en R en base a una columna.Creación de un conjunto de datos de ejemploEn primer lugar, … [Leer más...] acerca de Ordenar los datos en R utilizando los valores de otra columna
Barras de progreso en R y alarma de finalización
En muchas ocasiones los programas que se ejecutan en un ordenador tardan un tiempo considerable en finalizar. Por ejemplo, las simulaciones de tipo Montecarlo o algunos procesos de optimización. En estas situaciones es una buena idea indicar al usuario el progreso de la tarea e idealmente el tiempo aproximado que falta para la finalización. Una de las mejores herramientas para … [Leer más...] acerca de Barras de progreso en R y alarma de finalización
Mocks en R con testthat
A la hora de escribir pruebas unitarias los Stubs y Mocks son herramientas clave. Se utilizan para imitar el comportamiento de objetos que devuelven resultados no determinísticos, depende de un estado difícil de crear o son lentos. Por ejemplo, una base de datos o un API. Los valores que se obtienen de estos dependerán de su estado y, por lo tanto, no se pude garantizar que sea … [Leer más...] acerca de Mocks en R con testthat
Operaciones por filas o columnas con apply en R
A la hora de trabajar con R puede ser interesante obtener el mínimo o máximo de cada una de las columnas de una matriz. En otras ocasiones puede ser interesante obtener por ejemplo la media, mediana o desviación estándar. Las funciones nativas de R no funcionan de esta manera, ya que generalmente trabajan sobre todo la matriz. Por lo que en estas situaciones se ha de utilizar … [Leer más...] acerca de Operaciones por filas o columnas con apply en R
Creación de un CRAN corporativo
La distribución de las librerías en un entrono de trabajo son clave para el éxito. Disponer de la última versión de estas es imprescindible para poder realizar el trabajo de forma efectiva y evitar los errores ya conocidos. En R la forma más popular de instalar paquetes en los entornos de trabajo es a través del CRAN. El CRAN es abierto y esto puede no ser … [Leer más...] acerca de Creación de un CRAN corporativo
Memoria de objetos en R
La memoria de nuestros ordenadores es un recurso limitado al que le hemos de prestar atención. Al trabajar realizando análisis de datos no es difícil que la memoria en R se termine, con lo que se han de eliminar algunas de las variables que ya no necesitamos para poder continuar. La primera idea seria borrar los objetos temporales que ya no utilizamos. En este proceso una buena … [Leer más...] acerca de Memoria de objetos en R
Recuperación de las semillas empleadas en procesos aleatorios
Al realizar procesos en lo que se utilizan número aleatorios es una buena práctica fijar la semilla utilizada para garantizar que se puedan reproducir los resultados. En R esto se suele realizar mediante la instrucción set.seed(). Una alternativa a esta práctica puede ser guardar la semilla empleada antes de inicial el proceso y posteriormente recuperarla cuando sea … [Leer más...] acerca de Recuperación de las semillas empleadas en procesos aleatorios











