R

Introducción a igraph en R: Análisis de Redes desde Cero

El análisis de redes es una disciplina fundamental en muchas áreas del conocimiento, desde la sociología y la biología hasta la informática y la economía. La capacidad de representar y analizar relaciones entre entidades permite obtener información clave sobre las estructuras de los sistemas y comprender los comportamientos que se observan en diferentes sistemas. En este contexto, el paquete igraph de R es una de las herramientas más potentes, versátiles y fáciles de utilizar que existen para el análisis de redes.

En esta primera entrega de una serie sobre el paquete igraph de R, explicaremos qué es igraph, cómo instalarlo y cómo crear grafos básicos. En las siguientes publicaciones, profundizaremos en métricas de centralidad como el grado, intermediación, cercanía, PageRank y otras.

Instalación y carga del paquete igraph

Antes de comenzar, debemos asegurarnos de que igraph está instalado en nuestro entorno de R. Si no lo tienes instalado, puedes hacerlo con el siguiente comando:

install.packages("igraph")

Luego, como es habitual, se puede importar la librería en nuestra sesión de R usando el comando library:

library(igraph)

Conceptos básicos de grafos

Un grafo es una estructura compuesta por nodos (vértices) y enlaces (aristas o edges). Un nodo representa una entidad dentro de la red, como una persona en una red social o una ciudad en una red de transporte. Los enlaces representan las conexiones o relaciones entre estas entidades.

En igraph, los diferentes tipos de grafos que se pueden construir son de los siguientes tipos:

  • Dirigidos: las aristas tienen una dirección definida, es decir, la relación entre los nodos es asimétrica. Por ejemplo, en las redes sociales como Bluesky o Mastodon, un usuario puede seguir a otro sin que el seguimiento sea recíproco.
  • No dirigidos: las conexiones son bidireccionales, es decir, si existe un enlace entre dos nodos, la relación es mutua. Un ejemplo es una red social como Facebook, donde si A es amigo de B, entonces B también es amigo de A.
  • Ponderados: las aristas tienen un peso asociado, que puede representar la intensidad o frecuencia de la relación. Por ejemplo, en una red de transporte, el peso podría indicar la distancia entre dos estaciones.

Para crear un grafo en igraph, podemos usar la función graph(), que permite definir nodos y relaciones entre ellos.

¿Qué es un nodo en un grafo?

Un nodo o vértice en un grafo representa una entidad dentro de la red. Puede ser cualquier cosa, desde una persona en una red social hasta una ciudad en una red de transporte, o incluso un gen en una red biológica. Los nodos son los puntos fundamentales del grafo, y las relaciones entre ellos se representan mediante aristas o enlaces.

Por ejemplo, en una red de amistades, cada persona sería un nodo, y las conexiones entre personas representan las amistades. En una red de transporte, cada ciudad sería un nodo, y las carreteras o rutas entre ellas serían las aristas.

¿Qué es un edge en un grafo?

Un edge o arista es una conexión entre dos nodos en un grafo. En un grafo no dirigido, la conexión es bidireccional, mientras que, en un grafo dirigido, la relación tiene un sentido específico. Por ejemplo, si tenemos un grafo de amigos, un edge entre “Ana” y “Carlos” significa que ambos son amigos. En cambio, en un grafo de seguidores de redes sociales, un edge dirigido de “Ana” a “Carlos” indicaría que Ana sigue a Carlos, pero no necesariamente al revés.

Creación de un grafo simple

Para comenzar con con igraph podemos crear un grafo no dirigido con seis nodos y algunas conexiones entre ellos:

# Crear un grafo con seis nodos y enlaces definidos manualmente
g <- graph(edges = c(1,2, 1,3, 2,4, 2,5, 3,6, 5,6), directed = FALSE)

# Mostrar información sobre el grafo
print(g)

Al ejecutar este código se obtiene como salida una representación de la red:

IGRAPH 87c633e U--- 6 6 -- 
+ edges from 87c633e:
[1] 1--2 1--3 2--4 2--5 3--6 5--6

La función graph() toma un vector de edges, que define las conexiones entre los nodos. En este caso, el vector c(1,2, 1,3, 2,4, 2,5, 3,6, 5,6) indica que:

  • El nodo 1 está conectado con el nodo 2.
  • El nodo 1 está conectado con el nodo 3.
  • El nodo 2 está conectado con el nodo 4.
  • El nodo 2 está conectado con el nodo 5.
  • El nodo 3 está conectado con el nodo 6.
  • El nodo 5 está conectado con el nodo 6.

Cada par de números representa una conexión entre dos nodos. En este ejemplo, como se ha fijado el parámetro directed = FALSE, se obtienen un grafo no dirigido, lo que significa que si un nodo A está conectado con un nodo B, la relación es bidireccional (es decir, también se puede decir que B está conectado con A).

Para visualizarlo, podemos usar la función plot():

# Dibujar el grafo
plot(g, vertex.size=30, vertex.label.cex=1.2, edge.width=2, main="Grafo simple")

Con lo que se obtiene un gráfico como el que se muestra a continuación.

Representación del grafo simple creado en igraph

Propiedades básicas del grafo

Podemos extraer información básica sobre el grafo con algunas funciones de igraph:

# Obtener el número de nodos y aristas
vcount(g)  # Número de vértices
ecount(g)  # Número de aristas

# Obtener los nodos y aristas
V(g)  # Lista de nodos
E(g)  # Lista de aristas

En este ejemplo tanto el número de vértices como el de aristas es 6, la lista de nodos se muestra cómo:

+ 6/6 vertices, from 87c633e:
[1] 1 2 3 4 5 6

Mientras que la lista de aristas produce una salida como la siguiente:

+ 6/6 edges from 87c633e:
[1] 1--2 1--3 2--4 2--5 3--6 5--6

Grafo dirigido

Si queremos crear un grafo dirigido, simplemente se debe cambiar el valor del parámetro directed = TRUE:

# Crear un grafo dirigido
g_dir <- graph(edges = c(1,2, 1,3, 2,4, 2,5, 3,6, 5,6), directed = TRUE)
plot(g_dir, vertex.size=30, vertex.label.cex=1.2, edge.width=2, main="Grafo dirigido")

Con lo que se obtiene un gráfico como el que se muestra a continuación.

Representación del grafo dirigido creado en igraph

En este ejemplo, a diferencia del anterior, se obtiene un grafo dirigido, lo que significa que si un nodo A está conectado con un nodo B, la relación no tiene por qué ser bidireccional (por defecto B no está conectado con A, se tendrá que crear una conexión para ello). Por eso, en el gráfico se muestran la dirección de las conexiones, cosa que no se mostaba en la figura anterior. 

Tipos de grafos predefinidos

En igraph podemos crear grafos específicos sin definir manualmente las aristas. Algunos ejemplos:

# Grafo completo de 5 nodos
g_completo <- make_full_graph(5)
plot(g_completo, main="Grafo completo")

# Grafo en estrella de 6 nodos
g_estrella <- make_star(6)
plot(g_estrella, main="Grafo estrella")

# Grafo en anillo de 6 nodos
g_anillo <- make_ring(6)
plot(g_anillo, main="Grafo en anillo")

Los grados se pueden ver en las siguientes imágenes.

Ejemplo de grafo completo de 5 nodos creado con igraph
Ejemplo de grafo en estrella de 5 nodos creado con igraph
Ejemplo de grafo en anillo de 5 nodos creado con igraph

Exportación e importación de grafos en archivos

Los grafos en igraph pueden exportarse e importarse en distintos formatos de archivo, lo que facilita su almacenamiento y reutilización. Entre los formatos más utilizados se encuentran edgelist (lista de aristas, que puede guardarse en un archivo .csv) y GraphML (un formato basado en XML que permite conservar atributos de los nodos y las aristas).

Exportación de grafos

Para guardar un grafo en formato GraphML, que mantiene la estructura y los atributos del grafo, se usa la función write.graph:

# Guardar un grafo en formato GraphML
write.graph(g, file = "mi_grafo.graphml", format = "graphml")

Además del grafo, se debe pasar el nombre del archivo y el formato en el que se desea guardar los datos. Si se prefiere guardar el grafo en formato edgelist dentro de un archivo CSV, se puede hacer tal como se muestra a continuación:

# Guardar un grafo en formato edgelist (CSV)
write.graph(g, file = "mi_grafo.csv", format = "edgelist")

Es importante notar que el formato edgelist solo almacena la estructura de conexiones del grafo, sin incluir atributos.

Importación de grafos

Para cargar un grafo desde un archivo en formato edgelist (.csv), se usa read.graph. Por defecto, los grafos cargados desde este formato son no dirigidos, a menos que se especifique lo contrario con directed=TRUE:

# Leer un grafo desde un archivo CSV (edgelist)
g_csv <- read.graph("mi_grafo.csv", format = "edgelist", directed = FALSE)

Si se requiere importar un grafo desde un archivo GraphML, que conserva atributos, se utiliza:

# Leer un grafo desde un archivo GraphML
g_graphml <- read.graph("mi_grafo.graphml", format = "graphml")

Consideraciones adicionales

A la hora de escoger un formato u otro para trabajar es importante tener en cuenta los siguientes puntos:

  • Edgelist (.csv): Solo almacena las conexiones entre nodos (aristas), sin atributos adicionales.
  • GraphML (.graphml): Conserva tanto la estructura del grafo como los atributos de los nodos y aristas.
  • Si los datos provienen de otras fuentes, como matrices de adyacencia o listas de vértices, pueden convertirse antes de la importación/exportación.

Aplicaciones prácticas del análisis de redes

El análisis de redes tiene una amplia gama de aplicaciones en diferentes campos:

  • Redes sociales: se utiliza para estudiar la estructura de las relaciones entre personas, identificar líderes de opinión y analizar la difusión de información.
  • Biología: se aplica para estudiar las interacciones entre genes, proteínas y otros componentes biológicos.
  • Economía: se utiliza para analizar las relaciones entre empresas, la estructura de los mercados financieros y la propagación de shocks económicos.

Conclusiones

En esta primera entrega hemos aprendido los fundamentos del paquete igraph de R, incluyendo la creación y visualización de grafos. En la próxima entrega explicaremos la centralidad de grado, una de las métricas más importantes en el análisis de redes.

Si te interesa seguir explorando el análisis de grafos, asegúrate de probar los códigos presentados y experimentar con diferentes estructuras de redes. Además, te recomiendo explorar más a fondo las aplicaciones prácticas del análisis de redes en tu campo de interés.

Nota: La imagen de este artículo fue generada utilizando un modelo de inteligencia artificial.

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez

Recent Posts

Cómo crear un Data Lake en Azure paso a paso

El volumen de datos que las organizaciones generan y deben manejar crece día a día:…

1 día ago

¿Por qué el azar no es tan aleatorio como parece?

Cuando escuchamos la palabra “azar”, pensamos en lo impredecible: una moneda que gira en el…

3 días ago

Detectan vulnerabilidad crítica en MLflow que permite ejecución remota de código

Una nueva vulnerabilidad crítica ha sido detectada en MLflow, la popular plataforma de código abierto…

4 días ago

Curiosidad: ¿Por qué los datos “raros” son tan valiosos?

En estadística, los valores atípicos —también llamados outliers— son esos datos que se alejan “demasiado”…

1 semana ago

Cómo generar contraseñas seguras con Python (y entender su nivel de seguridad)

Vivimos en un mundo cada vez más digital, donde gestionamos decenas (o incluso cientos) de…

1 semana ago

Cómo ejecutar JavaScript desde Python: Guía práctica con js2py

Aunque Python y JavaScript son lenguajes muy distintos en su propósito y ecosistema, no es…

2 semanas ago

This website uses cookies.