El análisis de redes es una disciplina fundamental en muchas áreas del conocimiento, desde la sociología y la biología hasta la informática y la economía. La capacidad de representar y analizar relaciones entre entidades permite obtener información clave sobre las estructuras de los sistemas y comprender los comportamientos que se observan en diferentes sistemas. En este contexto, el paquete igraph de R es una de las herramientas más potentes, versátiles y fáciles de utilizar que existen para el análisis de redes.
En esta primera entrega de una serie sobre el paquete igraph de R, explicaremos qué es igraph, cómo instalarlo y cómo crear grafos básicos. En las siguientes publicaciones, profundizaremos en métricas de centralidad como el grado, intermediación, cercanía, PageRank y otras.
Tabla de contenidos
Antes de comenzar, debemos asegurarnos de que igraph está instalado en nuestro entorno de R. Si no lo tienes instalado, puedes hacerlo con el siguiente comando:
install.packages("igraph") Luego, como es habitual, se puede importar la librería en nuestra sesión de R usando el comando library:
library(igraph)
Un grafo es una estructura compuesta por nodos (vértices) y enlaces (aristas o edges). Un nodo representa una entidad dentro de la red, como una persona en una red social o una ciudad en una red de transporte. Los enlaces representan las conexiones o relaciones entre estas entidades.
En igraph, los diferentes tipos de grafos que se pueden construir son de los siguientes tipos:
Para crear un grafo en igraph, podemos usar la función graph(), que permite definir nodos y relaciones entre ellos.
Un nodo o vértice en un grafo representa una entidad dentro de la red. Puede ser cualquier cosa, desde una persona en una red social hasta una ciudad en una red de transporte, o incluso un gen en una red biológica. Los nodos son los puntos fundamentales del grafo, y las relaciones entre ellos se representan mediante aristas o enlaces.
Por ejemplo, en una red de amistades, cada persona sería un nodo, y las conexiones entre personas representan las amistades. En una red de transporte, cada ciudad sería un nodo, y las carreteras o rutas entre ellas serían las aristas.
Un edge o arista es una conexión entre dos nodos en un grafo. En un grafo no dirigido, la conexión es bidireccional, mientras que, en un grafo dirigido, la relación tiene un sentido específico. Por ejemplo, si tenemos un grafo de amigos, un edge entre “Ana” y “Carlos” significa que ambos son amigos. En cambio, en un grafo de seguidores de redes sociales, un edge dirigido de “Ana” a “Carlos” indicaría que Ana sigue a Carlos, pero no necesariamente al revés.
Para comenzar con con igraph podemos crear un grafo no dirigido con seis nodos y algunas conexiones entre ellos:
# Crear un grafo con seis nodos y enlaces definidos manualmente g <- graph(edges = c(1,2, 1,3, 2,4, 2,5, 3,6, 5,6), directed = FALSE) # Mostrar información sobre el grafo print(g)
Al ejecutar este código se obtiene como salida una representación de la red:
IGRAPH 87c633e U--- 6 6 --
+ edges from 87c633e:
[1] 1--2 1--3 2--4 2--5 3--6 5--6
La función graph() toma un vector de edges, que define las conexiones entre los nodos. En este caso, el vector c(1,2, 1,3, 2,4, 2,5, 3,6, 5,6) indica que:
1 está conectado con el nodo 2.1 está conectado con el nodo 3.2 está conectado con el nodo 4.2 está conectado con el nodo 5.3 está conectado con el nodo 6.5 está conectado con el nodo 6.Cada par de números representa una conexión entre dos nodos. En este ejemplo, como se ha fijado el parámetro directed = FALSE, se obtienen un grafo no dirigido, lo que significa que si un nodo A está conectado con un nodo B, la relación es bidireccional (es decir, también se puede decir que B está conectado con A).
Para visualizarlo, podemos usar la función plot():
# Dibujar el grafo plot(g, vertex.size=30, vertex.label.cex=1.2, edge.width=2, main="Grafo simple")
Con lo que se obtiene un gráfico como el que se muestra a continuación.
Podemos extraer información básica sobre el grafo con algunas funciones de igraph:
# Obtener el número de nodos y aristas vcount(g) # Número de vértices ecount(g) # Número de aristas # Obtener los nodos y aristas V(g) # Lista de nodos E(g) # Lista de aristas
En este ejemplo tanto el número de vértices como el de aristas es 6, la lista de nodos se muestra cómo:
+ 6/6 vertices, from 87c633e:
[1] 1 2 3 4 5 6
Mientras que la lista de aristas produce una salida como la siguiente:
+ 6/6 edges from 87c633e:
[1] 1--2 1--3 2--4 2--5 3--6 5--6
Si queremos crear un grafo dirigido, simplemente se debe cambiar el valor del parámetro directed = TRUE:
# Crear un grafo dirigido g_dir <- graph(edges = c(1,2, 1,3, 2,4, 2,5, 3,6, 5,6), directed = TRUE) plot(g_dir, vertex.size=30, vertex.label.cex=1.2, edge.width=2, main="Grafo dirigido")
Con lo que se obtiene un gráfico como el que se muestra a continuación.
En este ejemplo, a diferencia del anterior, se obtiene un grafo dirigido, lo que significa que si un nodo A está conectado con un nodo B, la relación no tiene por qué ser bidireccional (por defecto B no está conectado con A, se tendrá que crear una conexión para ello). Por eso, en el gráfico se muestran la dirección de las conexiones, cosa que no se mostaba en la figura anterior.
En igraph podemos crear grafos específicos sin definir manualmente las aristas. Algunos ejemplos:
# Grafo completo de 5 nodos g_completo <- make_full_graph(5) plot(g_completo, main="Grafo completo") # Grafo en estrella de 6 nodos g_estrella <- make_star(6) plot(g_estrella, main="Grafo estrella") # Grafo en anillo de 6 nodos g_anillo <- make_ring(6) plot(g_anillo, main="Grafo en anillo")
Los grados se pueden ver en las siguientes imágenes.
Los grafos en igraph pueden exportarse e importarse en distintos formatos de archivo, lo que facilita su almacenamiento y reutilización. Entre los formatos más utilizados se encuentran edgelist (lista de aristas, que puede guardarse en un archivo .csv) y GraphML (un formato basado en XML que permite conservar atributos de los nodos y las aristas).
Para guardar un grafo en formato GraphML, que mantiene la estructura y los atributos del grafo, se usa la función write.graph:
# Guardar un grafo en formato GraphML write.graph(g, file = "mi_grafo.graphml", format = "graphml")
Además del grafo, se debe pasar el nombre del archivo y el formato en el que se desea guardar los datos. Si se prefiere guardar el grafo en formato edgelist dentro de un archivo CSV, se puede hacer tal como se muestra a continuación:
# Guardar un grafo en formato edgelist (CSV) write.graph(g, file = "mi_grafo.csv", format = "edgelist")
Es importante notar que el formato edgelist solo almacena la estructura de conexiones del grafo, sin incluir atributos.
Para cargar un grafo desde un archivo en formato edgelist (.csv), se usa read.graph. Por defecto, los grafos cargados desde este formato son no dirigidos, a menos que se especifique lo contrario con directed=TRUE:
# Leer un grafo desde un archivo CSV (edgelist)
g_csv <- read.graph("mi_grafo.csv", format = "edgelist", directed = FALSE) Si se requiere importar un grafo desde un archivo GraphML, que conserva atributos, se utiliza:
# Leer un grafo desde un archivo GraphML
g_graphml <- read.graph("mi_grafo.graphml", format = "graphml") A la hora de escoger un formato u otro para trabajar es importante tener en cuenta los siguientes puntos:
.csv): Solo almacena las conexiones entre nodos (aristas), sin atributos adicionales..graphml): Conserva tanto la estructura del grafo como los atributos de los nodos y aristas.El análisis de redes tiene una amplia gama de aplicaciones en diferentes campos:
En esta primera entrega hemos aprendido los fundamentos del paquete igraph de R, incluyendo la creación y visualización de grafos. En la próxima entrega explicaremos la centralidad de grado, una de las métricas más importantes en el análisis de redes.
Si te interesa seguir explorando el análisis de grafos, asegúrate de probar los códigos presentados y experimentar con diferentes estructuras de redes. Además, te recomiendo explorar más a fondo las aplicaciones prácticas del análisis de redes en tu campo de interés.
Nota: La imagen de este artículo fue generada utilizando un modelo de inteligencia artificial.
El volumen de datos que las organizaciones generan y deben manejar crece día a día:…
Cuando escuchamos la palabra “azar”, pensamos en lo impredecible: una moneda que gira en el…
Una nueva vulnerabilidad crítica ha sido detectada en MLflow, la popular plataforma de código abierto…
En estadística, los valores atípicos —también llamados outliers— son esos datos que se alejan “demasiado”…
Vivimos en un mundo cada vez más digital, donde gestionamos decenas (o incluso cientos) de…
Aunque Python y JavaScript son lenguajes muy distintos en su propósito y ecosistema, no es…
This website uses cookies.