Colaboración de Pablo Rosillo Rodes (Becario Sicómoro IFISC-CSIC).

Este artículo ha sido confeccionado a partir de un trabajo de investigación titulado The Graphlist realizado por el autor para la asignatura Introduction to Complex Systems del Master in Physics of Complex Systems del IFISC (CSIC-Universitat de les Illes Balears).

El autor quiere agradecer a los Profesores Ernesto Estrada, Sandro Meloni y Maxi San Miguel, Adrián García y a la Fundación Sicómoro

—-     —     —-

Raymond Reddington es un excéntrico e inteligente criminal que es famoso por ser inalcanzable para el FBI durante décadas. Un día, de repente, se entrega y dice que sólo va a hablar con la agente Elizabeth Keen. Por esto, ella es transferida inmediatamente al Equipo Especial, un grupo secreto del FBI que se ocupa de los peores crímenes. El propio Reddington tiene la Lista Negra, una lista de personas de interés para el FBI que está dispuesto a revelar a cambio de su inmunidad. Esto pronto desemboca en crímenes, amor, corrupción y traición; todo en el contexto de una red intrincada y compleja que involucra favores, asesinatos, secuestros y la existencia de la Camarilla, una organización secreta de la mafia que involucra a miembros del Gobierno de los Estados Unidos. Esta es la trama principal de The Blacklist, una serie de televisión con James Spader y Megan Boone como actores principales.

 

Las numerosas e interesantes interacciones entre personajes en la serie dan pie a su estudio usando técnicas de redes complejas, una de las ramas más bonitas de la Física de Sistemas Complejos.

Una red es un constructo matemático formado por nodos y las conexiones entre ellos, llamadas enlaces. Las redes son complejas si exhiben cierto comportamiento no trivial desde puntos de vista estadísticos y topológicos. Una red compleja puede ser, por ejemplo, el sistema mundial de aeropuertos, donde cada aeropuerto es un nodo y las conexiones entre ellos mediante aviones son los enlaces. También puede ser una cadena trófica, donde los nodos son cada uno de los integrantes del ecosistema y los enlaces son relaciones depredador-presa. En definitiva, las redes complejas se encuentran por doquier.

Para entender cómo nos permiten entender mejor la naturaleza vamos a poner como ejemplo The Blacklist. Sí, esa serie que te ponías a la hora de comer en Netflix, que al final te cansaste porque son más de veinte capítulos por temporada y tiene muchas temporadas; esa misma serie puede ser analizada con técnicas de redes complejas ya que, al fin y al cabo, se trata de una red de contactos.

Las redes pueden ser de muchos tipos: direccionales, si las interacciones entre nodos tienen dirección (por ejemplo, si le envías una carta a un amigo y nunca te contesta, la interacción sería de ti hacia tu amigo, y no al contrario); pesadas, si cada interacción tiene un peso distinto (si todos los veranos le envías varias cartas a tu amigo y tu amigo sólo te contestó una vez con una postal de Torrevieja en 1984, la interacción tuya hacia tu amigo es mucho más pesada que la interacción de tu amigo hacia ti), etcétera. Nosotros consideraremos una red muy simple, sin direcciones y sin pesos, atemporal, y creada a partir de las observaciones de las temporadas 1-4 de The Blacklist por parte del autor de este texto junto con la información disponible en The Blacklist Fandom. En cuanto un personaje interactúa con otro de cualquier manera (hablan, se matan, se espían, son familia…), sus nodos quedan conectados, como en la Figura 1.

De estas redes se puede extraer mucha información, pero para ello debemos definir primero algunos conceptos, como el de grado (𝑘𝑖) de un nodo. Esto es el número de conexiones directas, o de primeros vecinos, del nodo. Por ejemplo, en la Figura 1, el nodo 1 tiene un grado 𝑘1 = 5, porque está directamente conectado a 5 nodos: 2, 3, 4, 5 y 6. De la misma manera, 𝑘2 =𝑘3 =𝑘4 =𝑘7 =𝑘8 =1,𝑘5 =2, y 𝑘6 =4. Otro concepto necesario es el de camino más corto, que consiste en el mínimo número de enlaces que unen dos nodos determinados sin pasar por el mismo nodo más de una vez. Por ejemplo, para ir del nodo 1 al 7 podemos escoger dos caminos: 1 → 5 → 6 → 7, cuya longitud es 3, y 1 → 6 → 7, cuya longitud es 2. Por tanto, el camino más corto (𝑑) entre 1 y 7 es tal que 𝑑(1 → 7) = 2.

Pasemos ahora a la red de la serie, que puede verse en la Figura 2. Se trata de una red mayor, con 247 nodos o personajes, y con 555 conexiones.

Cuando tenemos tantas componentes en la red pasamos a hablar de distribuciones. Por tanto, podemos repetir el ejercicio que hemos hecho con el grado de los nodos sobre esta red y obtenemos la Figura 3.

En ella podemos observar que se trata de una red donde muchos personajes tienen pocas conexiones directas, y hay algunos pocos que tienen muchas. ¿Es esto normal? ¿Suele pasar en la naturaleza?

La respuesta es que sí. Resulta que, en las redes de la naturaleza, muchas veces se encuentra que la distribución de los grados de los nodos sigue una ley de potencias, es decir, la distribución se rige por

Esto significa que el número de nodos que tienen un grado 𝑘 viene dado por una constante 𝐴 multiplicada por el nodo elevado al exponente 𝛼. En la red de The Blacklist, los nodos parecen* seguir una ley de potencias con 𝛼 = −1.3.

Estudiando el grado de los nodos podemos empezar a encontrarle alguna utilidad a todo esto. Podemos pensar que una persona es relevante (o central) en la red si tiene muchas conexiones. De hecho, el grado de un personaje mide su capacidad de comunicarse directamente con otros personajes, sin intermediarios. Posteriormente veremos qué personajes son relevantes en esta red.

No obstante, el grado de los nodos no es la única manera de cuantificar la centralidad de un nodo en la red. Quizá no nos interesa con cuántas personas está directamente conectado un personaje, sino cuántos caminos más cortos entre otros personajes pasan a través de él. Por ejemplo, si yo conozco a dos personas que no se conocen entre ellas, su camino más corto pasa por mí, pues soy su intermediario; de esta manera, soy muy importante en la comunicación entre ellos, aunque mi grado no es mucho más alto que el suyo.

Para cuantificar todo esto existe la intermediación, que se define, literalmente, como el número de caminos más cortos entre otros personajes de la red que pasan a través de un personaje dado. Por ejemplo, en la red de la Figura 4, la intermediación del nodo 2 es𝐵2 =3, ya que por él pasan los caminos más cortos entre 1 y 3, entre 1 y 4 y entre 3 y 4.

Si calculamos la intermediación de la red de The Blacklist obtenemos la distribución mostrada en la Figura 5, que sigue una ley de potencias, esta vez con 𝛼 = −1.8.

Hace 9 años se publicó un estudio (Goh, 2002) en el que se analizaron diversas redes de la naturaleza y se encontraron dos clases universales según el valor del parámetro 𝛼 de la distribución de intermediación. Los autores vieron cómo las redes que estudiaban se correspondían siempre con una u otra clase. Resulta que la red de The Blacklist, en su afán por ser compatible con la naturaleza misma y más allá de ser una obra de ficción, comparte clase de universalidad con redes metabólicas de algunas especies de arqueas y con Internet. Este es un resultado muy bonito de los sistemas complejos: a menudo, muchos de ellos exhiben comportamientos universales regidos por leyes sencillas, comunes a todos ellos independientemente de su naturaleza física.

Ya hemos visto dos maneras de cuantificar la importancia de un nodo en una red: su grado y su intermediación. Antes de aplicarlas a personajes concretos de The Blacklist y ver qué nos dicen sobre ellos, vamos a ver una última medida de la importancia: la centralidad de autovector.

La centralidad de autovector es matemáticamente más sofisticada que la centralidad de grado o la centralidad de intermediación, pero grosso modo podemos describirla de la siguiente manera: a cada nodo se le asigna una puntuación, y dicha puntuación depende de la puntuación de los nodos a los que está conectado, las puntuaciones de los cuales dependen a su vez de la puntuación de los nodos a los que están conectados, etcétera. Es decir, desde el punto de vista de la centralidad de autovector eres tanto más importante cuantas más conexiones tengas con nodos importantes.

Ahora podemos aplicar estas medidas a algunos personajes de la serie y ver qué nos dicen sobre ellos. ¿Seríamos capaces de conocer, a partir de los datos de la Tabla 1, qué personajes son más importantes sin haber visto la serie?

Analicemos el grado de los personajes. No sorprende que Raymond Reddington, protagonista de la serie, criminal más buscado en los EE. UU. y colaborador secreto del FBI tenga el grado más alto. Claramente está conectado directamente a muchas personas: precisamente por eso es de interés para el FBI su Lista Negra. En cuanto a Elizabeth Keen y Donald Ressler, agentes especiales del FBI, vemos que están más conectados que Harold Cooper, Director Adjunto del FBI. Tiene sentido, pues al ser ellos quienes realizan el trabajo de campo persiguen, detienen y entrevistan a muchas personas, mientras que en la mayoría de las ocasiones Cooper está en su despacho supervisando u organizando.

En cuanto a la intermediación, vemos que no sólo Reddington juega un papel importante en la conexión de la red, sino que Keen también. Esto encaja con la trama: Elizabeth es parte del FBI, pero también de la vida de Reddington. Muchas conexiones en la serie ocurren a través de ella. También es notable como Mr. Kaplan, amiga y colaboradora de Reddington que limpia todos sus estropicios cuando comete un crimen, en tanto que conectada con el mundo criminal, tiene una intermediación mayor que Alan Fitch, jefe de la Camarilla y Director Adjunto de Seguridad Nacional. No obstante, éste tiene una centralidad de autovector superior a la de Mr. Kaplan, hecho comprensible pues, al ser jefe de una organización mafiosa con miembros tan relevantes como la Camarilla y codearse con las más altas esferas de los Estados Unidos, pese a estar menos conectado que Mr. Kaplan, está conectado a gente más importante.

En virtud de estas conexiones, una red puede estar más o menos conectada. Seguro que os suena el dicho de que todos estamos conectados por una media de 6 conexiones. Dicha creencia popular tiene su origen en un famoso trabajo (Travers y Milgram, 1969) en el que se pedía a un grupo de personas que se pusieran en contacto con un individuo seleccionado de EE. UU. al que no conocían. Sólo podían hacerlo enviando una carta a alguien que conocieran y pidiéndole lo mismo. Se obtuvo la distribución de la Figura 6.

La media es de 5.2 intermediarios. En la Figura 6 vemos cómo los picos están entre 10 y 20 intermediarios. En estudios más recientes, estudiando redes de mensajería instantánea por Intenet (Leskovec y Horvitz, 2008) con muchos integrantes, se ha determinado que la media está en 6.6. Es decir, entre todos los pares de nodos posibles en la red, la media es un camino más corto de longitud cercana a 7. Es un resultado extraordinario.

En el caso de la red de The Blacklist, la distribución de caminos más cortos para cualquier par de personajes posibles es la que se encuentra en la Figura 7.

 

Es una red muy bien conectada en la que, de media, con aproximadamente 3 conexiones cualquier par de personajes está conectado. Una vez sabemos que la red está bien conectada, podemos introducir un matiz a la cuestión. Estas conexiones ¿se dan en mayor medida en comunidades como el FBI o la Camarilla, o es la red entera la que está bien conectada? Esta información nos la proporcionan los coeficientes de agrupamiento.

Escogemos dos coeficientes de agrupamiento que, sin necesidad de entrar en su definición matemática, nos permiten determinar el matiz que hemos comentado antes. El primero es el coeficiente de agrupamiento de Watt-Strogatz, 𝐶̅, que nos da una medida de cómo de agrupada está la red a escala local, es decir, entre comunidades o subgrupos de personas. El segundo es el coeficiente de Newman, 𝑇, que mide la agrupación a escala global, de la red entera como un grupo.

Resulta que en la red de The Blacklist el coeficiente de Watt-Strogatz es 5 veces mayor que el de Newman. Esto tiene sentido ya que, aunque existan personajes con mucha intermediación como Reddington o Keen que conectan diferentes partes de la red entre sí, es dentro de estas partes de la red – el FBI, la Camarilla, los criminales… dondeocurren la mayor parte de las conexiones. La red está robustamente conectada a nivel local, pero no a nivel global. De hecho, si matamos a un personaje como Reddington perdemos más de 22000 caminos entre pares de nodos de la red, es decir, más de 22000 pares de personajes quedan completamente desconectados entre ellos. Este concepto se puede usar para ver los puntos débiles de una red de seguridad o de la red eléctrica: si existe algún nodo que al ser atacado desconectaría la red de manera catastrófica.

En resumen, utilizando técnicas de redes complejas hemos obtenido información sobre los personajes de The Blacklist y sobre la naturaleza de sus interacciones. Normalmente este proceso se lleva a cabo a la inversa: encontramos una red en la naturaleza y pretendemos conocer a sus nodos con estas técnicas, no al contrario. Resulta que la red de The Blacklist, como hemos visto, es compatible con la realidad y está muy bien conectada. Pero no debemos asustarnos: en el proceso de adquisición de datos puede haber habido fallos, y es una red de ficción, no existe entre nosotros… ¿O sí?

¿Cuántas conexiones son necesarias para conectarte a ti como lector o lectora con Raymond Reddington? Resulta que el autor de este texto compartió un coloquio con António Guterres, Secretario General de Naciones Unidas. Éste conoce a Leonardo DiCaprio, quien compartió el rodaje de The quick and the dead con Keith David quien, a su vez, compartió el rodaje de Clash con James Spader, que es el actor que da vida a Raymond Reddington en The Blacklist.

Después de todo, sólo 5 conexiones te separan de Raymond Reddington. ¿Quién sabe si formas parte de una red criminal y no lo sabes?

____ ____ ____

Notas: 

* Decimos que parecen seguir una ley de potencias porque hay sutilezas estadísticas a tener en cuenta (como la cantidad de datos de la que disponemos) antes de afirmar categóricamente que se sigue dicho comportamiento, pero eso queda para otro momento.

Referencias:

Goh, K.-I. et al., (2002). Classification of scale-free networks. Proceedings of the National Academy of Sciences, 99(20), 12583–12588. doi:10.1073/pnas.202301299

Travers, J. y Milgram, S., (1969). An Experimental Study of the Small World Problem, Sociometry, Vol. 32, No. 4, pp. 425-443, http://www.jstor.org/stable/2786545

Leskovec, J. y Horvitz, E., (2008). Planetary-Scale Views on an Instant-Messaging Network, https://arxiv.org/abs/0803.0939