R

Truco R: Creación de diagramas de Venn en R

Los diagramas de Venn es una gráfica en la que se muestran las relaciones entre diferentes colecciones de conjuntos. En estos diagramas los conjuntos se representan como regiones cerradas y las intersecciones indican el grado de relación. Veamos cómo se pueden crear fácilmente diagramas de Venn en R.

Paquete eulerr

Para la creación de los diagramas de Venn en R vamos a utilizar el paquete eulerr. Un paquete, que, si no tenemos instalado, se puede instalar desde el CRAN con el comando:

install.packages("eulerr")

Creación del diagrama de Venn

Ahora para crear el diagrama de Venn necesitamos un conjunto de datos en el que indicamos el tamaño de los conjuntos y las relaciones. Lo que se hace con listas de pares de clave-valor, en los que la clave es el nombre del conjunto y el valor su tamaño. Para indicar las relaciones se usa claves que son la concatenación de los nombres de dos grupos unidos con &. Esto es, si tenemos un conjunto llamado “uno” y otro llamado “dos” los valores se asignan directamente a los nombres y la intersección de los dos grupos se indica con la clave “uno&dos”.

Una vez importados los datos, solamente se tiene que llamar a la función euler() del paquete eulerr para crear el diagrama de Venn. Una vez hecho esto se puede sacar por pantalla con la función plot(). Tal como se muestra en el siguiente código.

library(eulerr)

data <- c(uno=100,
          dos=220,
          tres=150,
          "uno&dos"=24,
          "uno&tres"=10,
          "dos&tres"=22)
venn <- euler(data)

plot(venn)

Lo que genera un diagrama como el de la siguiente figura.

Diagramas de Venn generado con el código R del ejemplo

Conclusiones

Si necesitamos crear un diagramas de Venn, el paquete eulerr contiene una función con la que se puede crear una rápidamente. Usando para ello los valores reales.

Imagen de Theodor Moise en Pixabay

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez
Tags: Truco

Recent Posts

Curiosidad: La Paradoja de Simpson, o por qué no siempre debes fiarte de los promedios

En ciencia de datos y estadística, los promedios y porcentajes son herramientas fundamentales para resumir…

1 día ago

Copias de seguridad automáticas en SQL Server con rotación de archivos

Las bases de datos son el corazón de casi cualquier sistema de información moderno. Ya…

3 días ago

Curiosidad: La Ley de Twyman y la trampa de los datos “interesantes”

En ciencia de datos, pocas cosas llaman más la atención de los científicos de datos…

1 semana ago

Cómo calcular el tamaño de la muestra para encuestas

Calcular adecuadamente el tamaño de la muestra es una parte esencial en el diseño de…

1 semana ago

Curiosidad: El origen del análisis exploratorio de datos y el papel de John Tukey

Hoy en día, cuando pensamos en ciencia de datos, lo primero que nos viene a…

2 semanas ago

Cómo extender el tamaño de un disco en Rocky Linux 9 usando growpart y LVM

Ampliar el espacio de almacenamiento en un sistema Linux es una tarea habitual y crítica…

2 semanas ago

This website uses cookies.