R

Introducción a igraph en R (Parte 3): Centralidad de Intermediación (Betweenness) en Grafos

En el análisis de redes, la centralidad de un nodo es una medida clave para evaluar su importancia dentro de la estructura global del grafo. En la última entrega de esta serie, exploramos la centralidad de grado, que mide la cantidad de conexiones directas de un nodo. Esta semana, profundizaremos en otra medida fundamental para el análisis de redes: la centralidad de intermediación (betweenness centrality).

La centralidad de intermediación cuantifica cuántas veces un nodo actúa como intermediario en los caminos más cortos entre otros nodos de la red. Esta medida es especialmente útil para identificar nodos estratégicos en redes de comunicación, transporte y logística, entre otras aplicaciones.

Esta métrica permite comprender mejor la dinámica de la red y su estructura subyacente, ayudando a identificar los puntos críticos cuya eliminación o alteración podría impactar significativamente la conectividad del sistema. En esta entrada, explicaremos su definición matemática, sus aplicaciones prácticas y cómo calcularla utilizando la biblioteca igraph en R.

Explicación del concepto de centralidad de intermediación y su utilidad

La centralidad de intermediación de un nodo v se define matemáticamente como: C_B(v) = \sum_{s \neq v \neq t} \frac{\sigma_{st}(v)}{\sigma_{st}}, donde:

  • \sigma_{st} es el número total de caminos más cortos entre los nodos s y t.
  • \sigma_{st}(v) es el número de esos caminos que pasan a través del nodo v.

En términos sencillos, la centralidad de intermediación mide cuántas veces un nodo sirve de ”puente” en la red, facilitando el flujo de información o el tráfico entre otros nodos. Un nodo con una centralidad de intermediación alta es esencial para la comunicación eficiente dentro de la red.

Por ejemplo, en una red de transporte urbano, las estaciones con alta centralidad de intermediación suelen ser nodos de conexión clave donde convergen múltiples rutas. De manera similar, en redes sociales, ciertos usuarios pueden actuar como enlaces entre comunidades, permitiendo la difusión de información de manera eficiente.

Aplicación en diferentes tipos de redes

La centralidad de intermediación se utiliza en diversos contextos, y su importancia varía dependiendo del tipo de red que se analice.

Redes de comunicación

En redes de telecomunicaciones e Internet, los nodos con alta intermediación suelen representar a los routers o servidores críticos. Si un nodo con alta intermediación falla, podría interrumpir significativamente el tráfico de la red, causando congestión o pérdida de conectividad.

Por ejemplo, en la red troncal de Internet, ciertos nodos actúan como puntos de intercambio de tráfico entre diferentes proveedores de servicios. Si uno de estos nodos es comprometido o sufre una caída, el tráfico debe ser redirigido, lo que puede aumentar la latencia y afectar el rendimiento de la red.

Redes sociales

En plataformas como Bluesky, Facebook o LinkedIn, los usuarios con alta intermediación pueden actuar como puntos de unión entre diferentes comunidades. Estos usuarios suelen ser clave para la difusión de información, ya que permiten que contenidos y mensajes lleguen a audiencias diversas.

Por ejemplo, en Bluesky, ciertas cuentas con una gran cantidad de conexiones entre comunidades pueden facilitar la propagación de noticias o tendencias. En LinkedIn, los profesionales que están conectados con múltiples sectores pueden ayudar a difundir oportunidades de negocio y colaboración.

Redes de transporte y logística

En redes de transporte, como aeropuertos, o rutas de envío, los hubs con alta intermediación permiten la conexión entre diferentes regiones. Identificar estos nodos es crucial para optimizar rutas y minimizar interrupciones en la cadena de suministro.

Un ejemplo clásico es el aeropuerto de Frankfurt, que actúa como un punto de conexión esencial para vuelos entre América y Asia. Su alta centralidad de intermediación lo convierte en un nodo crítico para el tráfico aéreo internacional.

Cálculo con betweenness() en igraph

En igraph, podemos calcular la centralidad de intermediación con la función betweenness(). Veamos un ejemplo con un grafo simple:

library(igraph)

# Crear un grafo simple
g <- graph(edges = c(1,2, 1,3, 2,4, 2,5, 3,6, 5,6, 4,5), directed = FALSE)

# Calcular centralidad de intermediación
betweenness(g)

Lo que devuelve como resultado la centralidad de intermediación para cada uno de los nodos. En este caso, los valores más altos se muestran en el segundo y quinto nodo del grafo con un valor de 2.5. Por otro lado, el que menos es el cuarto con un valor de 0. En concreto los valores son

1.5 2.5 1.0 0.0 2.5 1.5

Para visualizar la centralidad en el grafo, podemos ajustar el tamaño de los nodos según su valor de intermediación:

# Asignar tamaños según intermediación
V(g)$size <- betweenness(g) * 5 + 10

# Graficar el grafo
plot(g, vertex.label.cex=1.2, edge.width=2, main="Centralidad de Intermediación")

El figura, que se muestra a continuación, se puede ver claramente que los nodos con mayor centralidad de intermediación son el segundo y el quinto, desempeñando un papel crucial en la conectividad de la red.

Grafo en el que el tamaño de cada uno de los nodos es proporcional a la centralidad de intermediación mostrando claramente cuales son los nodos más importantes.

Normalización y comparación con otras métricas de centralidad

Para comparar la centralidad de intermediación entre redes de diferentes tamaños, se utiliza la versión normalizada de la métrica: C_B^{norm}(v) = \frac{C_B(v)}{(n-1)(n-2)/2}, donde n es el número total de nodos en la red. Esta normalización permite comparar valores de diferentes redes sin verse afectados por el tamaño del grafo.

En igraph, se puede calcular la versión normalizada de la centralidad de intermediación con el parámetro normalized = TRUE:

betweenness(g, normalized = TRUE)

Obteniendo como resultado:

0.15 0.25 0.10 0.00 0.25 0.15

La única diferencia en este caso es que los valores están normalizados, lo que permite comparar redes de distintos tamaños de manera más efectiva.

Comparación de la centralidad de intermediación con otras métricas:

  • Centralidad de grado mide la cantidad de conexiones directas de un nodo, mientras que la centralidad de intermediación se enfoca en su papel estructural dentro de la red. (Explicada en la segunda entrega de la serie).
  • Centralidad de cercanía indica qué tan rápido un nodo puede acceder a los demás en la red, mientras que la intermediación revela qué nodos facilitan esas conexiones. (Se abordará en la cuarta entrega de la serie).
  • Centralidad de eigenvector evalúa la influencia de un nodo según la importancia de sus conexiones, mientras que la intermediación mide su capacidad para actuar como puente. (Se tratará en la quinta entrega de la serie).

El uso combinado de estas métricas proporciona una visión más completa del papel e importancia de cada nodo dentro de la red.

Conclusiones

La centralidad de intermediación es una medida clave en el análisis de redes, permitiendo identificar nodos estratégicos que facilitan la conexión entre diferentes partes de la red. Lo que tiene un rango de uso, desde redes sociales hasta infraestructuras críticas como aeropuertos y sistemas de transporte.

En esta entrega, hemos explorado su definición, aplicaciones en diversos contextos y su implementación en igraph con ejemplos prácticos. En la próxima entrega, abordaremos la centralidad de cercanía (closeness centrality), que mide cuán cerca está un nodo del resto de la red.

Nota: La imagen de este artículo fue generada utilizando un modelo de inteligencia artificial.

¿Te ha parecido de utilidad el contenido?

Daniel Rodríguez

Share
Published by
Daniel Rodríguez

Recent Posts

La Paradoja del Cumpleaños, o por qué no es tan raro compartir fecha de nacimiento

Imagínate en una sala con un grupo de personas, por ejemplo, en una oficina, un…

3 días ago

Programador de tareas de Windows: Guía definitiva para automatizar tu trabajo (BAT, PowerShell y Python)

En el trabajo diario con ordenadores, es común encontrarse con tareas repetitivas: realizar copias de…

5 días ago

Curiosidad: ¿Por qué usamos p < 0.05? Un umbral que cambió la historia de la ciencia

En casi cualquier análisis estadístico —ya sea en medicina, psicología, economía o ciencia de datos—…

1 semana ago

¿Está concentrado el MSCI World? Un análisis con Gini, Lorenz y leyes de potencia

El MSCI World Index suele presentarse como “la ventana al mundo” para quienes invierten en…

2 semanas ago

Curiosidad: La maldición de la dimensionalidad, o por qué añadir más datos puede empeorar tu modelo

En el mundo del análisis de datos solemos escuchar una idea poderosa: cuantos más datos,…

2 semanas ago

Error npm ERR! code EACCES al instalar paquetes en Node.js: Cómo solucionarlo paso a paso

¿Te has encontrado con este error al intentar instalar paquetes con npm? npm ERR! code…

3 semanas ago

This website uses cookies.