Los diagramas de Venn es una gráfica en la que se muestran las relaciones entre diferentes colecciones de conjuntos. En estos diagramas los conjuntos se representan como regiones cerradas y las intersecciones indican el grado de relación. Veamos cómo se pueden crear fácilmente diagramas de Venn en R.Paquete eulerrPara la creación de los diagramas de Venn en R vamos a … [Leer más...] acerca de Truco R: Creación de diagramas de Venn en R
R
R nació como una implementación libre del S, un lenguaje de programación muy utilizado por la comunidad estadística. Actualmente es el lenguaje de programación más popular para el análisis estadístico. Gozando de una gran popularidad en campos como la minería de datos, la bioinformática y finanzas. Una gran parte de su popularidad es debido a que se puede extender fácilmente gracias a los más de 15.000 paquetes disponibles hoy en día en el CRAN. Por lo que casi siempre se puede encontrar un paquete que implementa el algoritmo necesario en cada momento
Crear imagen Docker con Shiny Server
A la hora de distribuir aplicaciones creadas con Shiny nos podemos plantar la idea de usar imágenes de Docker. Algo que nos permite evitar posibles problemas de incompatibilidad debido a no disponer de la versión correcta de R, Shiny o cualquier otro paquete en el servidor. Una vez creada la aplicación crear una imagen de Docker con Shiny Server es relativamente sencillo, por … [Leer más...] acerca de Crear imagen Docker con Shiny Server
La similitud de Jaro–Winkler
La similitud de Jaro–WinklerLa semana pasada hemos se ha visto cómo medir la diferencia entre dos cadenas de texto con la distancia de Levenshtein. Una distancia que mide el número de operaciones necesarias para convertir una cadena de caracteres en otra. Otra distancia que se puede utilizar para medir la similitud entre dos cadenas de texto es la de Jaro–Winkler. Una … [Leer más...] acerca de La similitud de Jaro–Winkler
La distancia de Levenshtein
Un problema con el que podemos enfrentarnos de forma relativamente habitual es medir el grado de similitud de dos registros. Cuando los registros con los que trabajamos contienen valores numéricos una de las primeras opciones es la distancia euclídea. Pero cuando trabajamos con cadenas de texto deberemos usar otros algoritmos como puede ser el caso de la distancia de … [Leer más...] acerca de La distancia de Levenshtein
Validación y distribución de los paquetes R (Creación de paquetes en R 8ª y última parte)
Una vez finalizada la escritura de nuestro paquete, incluida la escritura de las pruebas automáticas, la documentación y las viñetas es necesario distribuirlo. En el caso de que los paquetes sean públicos y cumplan las normas del CRAN es posible enviarlo a para su aprobación. Aunque este no es el único camino para distribuir el trabajo. Ya que se pueden distribuir como archivos … [Leer más...] acerca de Validación y distribución de los paquetes R (Creación de paquetes en R 8ª y última parte)
Incluir tutoriales: creación de viñetas (Creación de paquetes en R 7ª parte)
La semana pasada hemos visto cómo crear la documentación de nuestros paquetes de R mediante el uso de roxygen2. Documentación que es imprescindible a la hora de trabajar con cualquier librería. Pero, en la mayoría de los casos lo que realmente buscan los usuarios a la hora de empezar a usar un paquete nuevo es un tutorial con ejemplos en los que se enseñan algunos usos … [Leer más...] acerca de Incluir tutoriales: creación de viñetas (Creación de paquetes en R 7ª parte)
Documentación de los paquetes (Creación de paquetes en R 6ª parte)
La documentación de los paquetes es una tarea clave, ya que es la forma de explicar a los usuarios cómo utilizar las funciones y cual es la respuesta que se puede esperar. En un paquete de R la documentación de las funciones se incluye en los archivos Rd que se encuentra dentro de la carpeta man. Siendo esta la información que verán los usuarios cuando consulten la ayuda de las … [Leer más...] acerca de Documentación de los paquetes (Creación de paquetes en R 6ª parte)
Medir la cobertura de las pruebas automáticas (Creación de paquetes en R 5ª parte)
Un dato importante a la hora de trabajar con pruebas automáticas es saber que parte del código está cubierto y qué parte no. Ya que las parte que no esté cubierto por pruebas automáticas es más probable que aparezcan fallos durante las tareas de mantenimiento, o que tenga errores porque nunca se hubiese probado esa parte. Para esto en R también tenemos herramientas con las que … [Leer más...] acerca de Medir la cobertura de las pruebas automáticas (Creación de paquetes en R 5ª parte)
Pruebas avanzadas con testthat (Creación de paquetes en R 4ª parte)
La semana pasada se ha visto una pequeña introducción a la creación de pruebas automáticas en un paquete de R. Esta semana vamos a ver unos conceptos para crear pruebas avanzadas con testthat cómo son las funciones setup y teardown. En esta entrada no hablaremos de mocks ya que es un tema del que hemos hablado anteriormente en el blog. Si necesitamos probar servicios externos … [Leer más...] acerca de Pruebas avanzadas con testthat (Creación de paquetes en R 4ª parte)
Pruebas automáticas en R con testthat (Creación de paquetes en R 3ª parte)
Seguimos con nuestra serie en la que explicamos cómo crear un paquete R en la que se realizará una introducción a las pruebas automáticas. Incluir pruebas automáticas en nuestro código es clave para poder mantener a medida que crece. Las pruebas no solo permiten garantizar que el código funciona correctamente hoy en día, sino que permite garantizar que continuará funcionando … [Leer más...] acerca de Pruebas automáticas en R con testthat (Creación de paquetes en R 3ª parte)
El archivo DESCRIPTION (Creación de paquetes en R 2ª parte)
En la entrada de la semana pasada hemos creado la estructura de un paquete R con la ayuda de RStudio y el paquete devtools. En la entrada de esta semana vamos a ver como configurar el paquete modificando el archivo DESCRIPTION e incluir las primeras funciones.Esta entrada forma parte de la serie “Creación de paquetes en R” cuyo código se puede encontrar en el repositorio y … [Leer más...] acerca de El archivo DESCRIPTION (Creación de paquetes en R 2ª parte)
Creación de paquetes en R
Los paquetes de R son la mejor opción para distribuir y reutilizar de el código que escribimos es este lenguaje. Lo que nos permite aumentar nuestra productividad. Por eso hoy vamos a iniciar una serie de entradas en las que explicaremos los pasos para la creación de paquetes en R. Análoga a la serie publicada para el lenguaje Python. Una vez creados los paquetes podremos … [Leer más...] acerca de Creación de paquetes en R