Las tríadas representan la primera red social importante en términos de generar una primera (micro) comunidad. Dada la variedad de relaciones sociales que ocurren entre individuos, es razonable esperar que se encuentren diferentes patrones triádicos en diferentes tipos de relaciones sociales. Por ejemplo, parece razonable esperar que los patrones triádicos en las amistades entre humanos difieran de otros tipos de relaciones como las sexuales, prestigio o, más modernamente, la interacción digital en redes sociales en línea (RSL).
Las díadas, mínimo grupo social posible de dos individuos, y tríadas, grupo de tres individuos, son componentes básicos de una red. Sin embargo, la díada es una unidad de investigación diferente que la tríada más allá de lo trivial de la afirmación. Krackhardt (1999) expresa tres motivos para esa clara diferencia entre díada y tríada. El primer motivo es que una díada preserva la individualidad de ambos miembros en comparación con una tríada, donde los intereses de cualquier miembro podrían ser suprimidos por los otros miembros del grupo conforme a sus propios intereses. El segundo motivo es que en una tríada cada miembro tiene menos poder de negociación que en una díada, debido a la menor amenaza de destrucción del grupo cuando un miembro abandona esa tríada. El tercer motivo es que cualquier conflicto, que es inevitable en cualquier relación a lo largo del tiempo, se maneja y resuelve más fácilmente en una tríada porque existen posibilidades de negociación entre más partes. La tríada permite la aparición de un mediador/intermediario entre dos partes confrontadas. En el caso de una díada, si ambas partes se cierran al diálogo puede quedar la situación sin resolución incluso indefinidamente. En las RSL esa mancomunidad es menos evidente por la falta de conocimiento personal, pero como cualquier componente estructural de la misma da forma al flujo de información y posiciones de poder entre los actores.
Extensos estudios sociológicos han identificado tres factores, a saber, la repetición y fuerza de la relación y el egocentrismo que impulsan a las personas a socializar e interactuar en redes convencionales fuera de línea (Jenssen, & Greve, 2002; Mok et al., 2007; Granovetter, 1973). Varios estudios han modelado los patrones de interacciones estructurales entre usuarios en RSL (Leskovec et al., 2010; Romero et al., 2011); sin embargo, muy pocos han tratado de comprender qué motiva a los usuarios a compartir e interactuar en línea. Algunos esfuerzos sugieren que los motivos de los usuarios pueden depender de sus preferencias individuales (Stefanone et al., 2011), o pueden basarse en el cumplimiento de su misma necesidad de pertenencia, representación y autoestima (Krasnova et al., 2008).
Buscamos entender la microestructura de las relaciones en una RSL. Analizamos la transitividad en conexiones triádicas en una gran RSL, específicamente páginas de Facebook. Al observar la transitividad a través de la perspectiva del grupo de tres enumeraciones, inspeccionamos cómo tres impactos sociales, para ser específicos, el estatus, la calidad de la relación y el egocentrismo, pueden aclarar las asociaciones de usuarios en esos sistemas en línea.
Al investigar la microestructura de una RSL urbana inspirados en Faust (2007), se intenta asociar estadísticamente la composición del censo de tríadas con variables estructurales de las redes. Específicamente, el trabajo busca asociar estructuras muy locales como la densidad de la red o la distribución del grado de entrada y salida nodal en vez de las propiedades triádicas a la composición de censo. Por tanto, se puntualiza que el tamaño de la red afecta al censo de la tríada mediante su efecto sobre la densidad de la red, un punto que debe abordarse explícitamente al construir las teorías de las redes sociales (Faust, 2007, p. 245).
En el enfoque adoptado en esta investigación, se examina la composición de las tríadas en una RSL a fin de identificar relaciones entre la estructura de la red y las acciones de los actores resumidas en el censo de tríadas. El censo de tríadas divide a cualquier grafo o red en estructuras de tres nodos llamadas precisamente tríadas y categoriza a cada una entre 16 posibles configuraciones denominadas isomorfismos (es decir, estructuras cuyos nodos preservan la relación de adyacencia). Si bien el censo de tríadas representa información de la estructura de la red, la prevalencia de distintos isomorfismos también caracteriza conductas de los actores que pueden mutuamente determinarse. Explorar el crecimiento de las redes sociales a lo largo del tiempo se ha convertido en un problema desafiante en el estudio de las redes sociales. Parámetros como la distribución de grados, el diámetro y el coeficiente de agrupamiento son métricas típicas obtenidas en tales análisis. En nuestra contribución añadiremos más de 40 parámetros estructurales con el fin de asociar dicha información a las formas de conexión de los agentes determinadas por el censo de tríadas.
La segunda sección del trabajo lleva a cabo una revisión de la literatura, la tercera presenta los datos y análisis para el censo de tríadas y la cuarta analiza los resultados encontrados. El trabajo cierra con una quinta sección, que corresponde a las conclusiones.
Literatura relevante
El análisis de patrones triádicos representa una herramienta poderosa para extraer propiedades estructurales de los grafos. Los estudios de las tríadas se remontan a Simmel (Simmel, & Wolff, 1964), que observa las propiedades fundamentales y distintivas de tres actores en lugar de dos dentro de una red: se comienza a señalar el posible papel de la tercera persona en interacciones como la intermediación y el arbitraje. Esas posiciones intermedias podrían generar balances y desbalances, equilibrios y desequilibrios en las relaciones. Hay varias teorías de un equilibrio estructural que se describen en detalle en aportes como los de Kovchegov (1991) y Faust (2007). Para una mejor comprensión de los resultados de la investigación adicional, proponemos su breve descripción.
Una de las primeras teorías que dio a luz a un conjunto de modelos de equilibrio, fue la teoría cognitiva de Heider. La teoría de Heider (1946) postula la existencia de una serie de fuerzas psíquicas en el campo cognitivo individual que estaban orientadas hacia la preservación del equilibrio. Según Heider, un equilibrio no es una proporción real de las fuerzas del elemento, sino su percepción por parte de un individuo. Si un individuo considerara que otro individuo apoyará relaciones positivas, entonces cualquier acto negativo “estropearía” la relación, y las fuerzas psíquicas tratarían de restablecer el equilibrio.
Desde el punto de vista del comportamiento, la consecuencia importante de la teoría de Heider reside en la suposición de que cualquier relación positiva es transitiva (por ejemplo, “un amigo de mi amigo también es mi amigo” es cierto), y viceversa, cualquier relación negativa es una intransitiva (por ejemplo, “el enemigo de mi enemigo es mi enemigo” es falso). Si se cumplen tales condiciones, existe el equilibrio estructural.
Este modelo, expresado matemáticamente por Cartwright y Harary (1956), se amplió para considerar un grafo de cualquier tamaño. Este concepto se utilizó para redes sociales, ya que una red se presentaba como un grafo valuado con enlaces de valencia positiva o negativa.
El teorema de estructura de Harary-Cartwright confirma que “un grafo s (grafo valuado) es equilibrado si y sólo si sus puntos se pueden separar en dos subconjuntos mutuamente excluyentes, de modo que cada línea positiva une dos puntos del mismo subconjunto y cada línea negativa une puntos de diferentes subconjuntos”. Un grafo valuado es entonces un grafo en que los nodos se relacionan por enlaces positivos o negativos representados con el signo + o -, respectivamente; por ejemplo una relación amor (+) / odio (-).
En otras palabras, un grupo presentado por un grafo equilibrado puede dividirse en dos subgrupos antagónicos (uno de esos subgrupos puede estar vacío), de modo que los enlaces de subgrupos internos deben ser positivos y los enlaces de subgrupos externos deben ser negativos. Zvereva (2016) utiliza el censo de tríadas para un trabajo de campo de estudio de redes de comunicación en el contexto de una universidad. Diferentes muestras de grupos diferentes presentan correlaciones asociadas a la densidad de la red, al ser la densidad la cantidad de relaciones observadas respecto a todas las potencialmente realizables. La densidad puede representar dos resultados extremos y todos los intermedios entre esos extremos. Un resultado extremo es la red vacía: cuando ningún nodo se conecta con ningún otro. El otro resultado extremo es la red completa: cuando todos los nodos establecen contacto con todos los otros nodos. En el medio de ambos extremos vamos a tener redes densas cuando se aproximen a la red completa y redes ralas cuando se aproximen a las redes vacías. Así, las redes menos densas marcan un predominio de tríadas ralas, mientras que las redes más densas se asocian a las tríadas más completas. Un análisis similar realizaron Uddin y Hossain (2016).
La teoría del equilibrio de Heider sostiene que ciertas configuraciones particulares de tríadas tienden hacia el equilibrio o balance y la estabilidad a lo largo del tiempo, mientras que otras tienden a ser desequilibradas, estresantes e inestables. Varios teóricos han desarrollado variaciones de la teoría del equilibrio, y la transitividad representa una de las extensiones más utilizadas. Leskovec et al. (2010) hicieron un estudio detallado sobre los cambios en el comportamiento de los nodos individuales, sujetos a si las relaciones son positivas o negativas entre los mismos. Una relación negativa sería antagonismo u oposición y una relación positiva sería amistad, por ejemplo. El trabajo se enfoca principalmente en el arribo de un nodo a una red y el proceso de iniciación del enlace, así como la selección del destino del enlace, ya que descubre que la mayor parte de la formación de enlaces es local y procede de la dirección de transitividad de la clausura triádica, lo cual valida el apego preferencial en las redes a gran escala y modela la llegada de nodos y la formación de enlaces en función de diferentes funciones estadísticas y clausura triádica. En nuestro caso, usaremos minería de datos estáticos para fijar como objetivo principal obtener propiedades estadísticas macroscópicas de la red. De este modo nos proponemos asociar los componentes de tríadas censadas identificadas en categorías de transitividad con variables estructurales de las redes. Encontramos que ciertos patrones de transitividad emergen asociados a configuraciones estructurales determinadas.
En el contexto de las RSL como Facebook, aportes como los de Alhazmi et al. (2015) y Doran et al. (2013) encuentran que la presencia de tríadas intransitivas se produce en el caso de usuarios que desean actuar como puentes entre usuarios más lejanos (no esperan reciprocidad) para hacer llegar más lejos su mensaje por medio del uso de intermediarios. El caso de las tríadas transitivas es el de los productos predominantes cuando los usuarios conectados interactúan también fuera de línea. En el caso de las vacíamente transitivas el hecho se debe a usuarios sobradamente comprometidos en enviar mensajes no solicitados (spam).
Censo de tríadas
Un elemento básico de la teoría y el análisis de las redes sociales es la díada, o sea, un par de actores que pueden o no compartir una relación social entre sí. Una tríada es un conjunto de tres actores, que también consta de tres díadas. En su trabajo seminal, Simmel (Simmel, & Wolff, 1964) argumentó que las tríadas son una unidad fundamental del análisis sociológico (Souto Maior Fontes, 2015). Apuntó que tres actores en una tríada pueden permitir dinámicas sociales cualitativamente diferentes que no es posible reducir a individuos o díadas. Por ejemplo, entre las tres partes A, B y C, la parte A tal vez tenga una relación diádica con C pero también puede establecer una relación indirecta con C a través de B. El actor B puede alterar la fuerza o la naturaleza de la relación entre A y C, como solidificar una alianza o mediar un conflicto. Si A y C no interactúan directamente, la parte B puede negociar una transacción entre ellos y además obtener poder de esa posición de intermediario.
El censo de la tríada se ha utilizado en muchas investigaciones empíricas sociológicas y teorías psicológico-sociales, como el balance y transitividad. La teoría del equilibrio de Heider (1946), luego generalizada como equilibrio estructural, propone que las personas tienden a mantener la coherencia o el balance en sus cogniciones; por ejemplo, les agradarán los amigos de sus amigos. La teoría del balance se aplica por lo general a redes completas valoradas. Sin embargo, cualquier red no valorada se puede asignar fácilmente a una red completa valorada al asumir los enlaces presentes como enlaces positivos y a los ausentes como negativos. Se han desarrollado variaciones de la teoría del balance, como las de los agrupamientos ranqueados y transitividad.
Una tríada es un subgrafo de tres nodos y enlaces entre ellos. Una red de n nodos contiene C (n,3) tríadas. Las tríadas pueden ser de dieciséis tipos diferentes, como se muestra en la figura 1. Los tipos de tríadas se pueden etiquetar de acuerdo con el esquema M-A-N; donde cada tipo tiene una etiqueta de tres a cuatro dígitos que representan respectivamente el número de díadas mutuas (M), asimétricas (A) y nulas (N) (Wasserman, & Faust, 1994) y la dirección de los enlaces entre ellas. El censo de tríadas es en resumen un vector de 16 componentes tales que:
, donde es el número (o frecuencia) del “tipo” de tríada (de la propia clase de isomorfismo) en una red.
Una díada mutua se refiere a una interacción bidireccional en la que un usuario inicia la conexión y el otro usuario corresponde. Una díada asimétrica constituye una interacción unidireccional en la que un usuario inicia una conexión con otro usuario, que no es recíproca. La díada nula implica que no hay interacción entre los dos usuarios. Cuando dos tipos de tríadas contienen un número equivalente de díadas, el cuarto dígito se usa para distinguir la dirección de los lazos: D para hacia abajo (Down), U para arriba (Up), T para transitivo y C para cíclico (Prell, & Skvoretz, 2008). Para dilucidar el uso del cuarto dígito, la tríada T.021U en el gráfico 1 contiene dos conexiones asimétricas que apuntan hacia arriba, mientras que dos conexiones asimétricas en T.021D apuntan hacia abajo, y en T.021C las dos conexiones son cíclicas. Un censo de tríadas es un censo de todos los tipos posibles de tríadas en una red determinada (Holland, & Leinhardt, 1970).
Transitividad en tríadas
La transitividad es un concepto clave que vincula muchas teorías sociales con estructuras triádicas. Una relación social entre tres actores A, B y C es transitiva si las relaciones A B, B C y A C están presentes. Basada en el concepto de transitividad, una tríada se puede clasificar en tres categorías, transitiva, intransitiva y transitivas vacías. Se dice que una tríada es transitiva si cada relación de tres vías que contiene también es transitiva. Por ejemplo, la díada mutua en T.120D en el gráfico 1 da como resultado dos posibles relaciones tripartitas entre sus usuarios A, B y C: (i) A→ B, A→ C, B→ C; o (ii) A→ B, A→ C, C→ B. Ambos conjuntos de relaciones son transitivos; por lo tanto, T.120D es una tríada transitiva. Por el contrario, T.120C es intransitivo porque contiene la relación de tres vías intransitivas A→ B, B→ C, C→ B. Finalmente, las tríadas que no cuentan con una ruta dirigida, incluidos sus tres usuarios, son transitivamente vacías. El gráfico 1 clasifica los 16 tipos de tríadas o isomorfismos según la transitividad de sus relaciones subyacentes. Las letras al final de cada número en el isomorfismo diferencian a “D” por down o abajo, “U” por up o arriba, “T” por transitive o transitiva y “C” por cyclic o cíclico.
A continuación, se describen las teorías sociales atribuidas a cada una de estas tres clases de tríadas.
Tríadas intransitivas. Jerarquía social: las tríadas intransitivas suelen surgir debido a los efectos sociales que alientan a los usuarios a interactuar a través de un intermediario, en lugar de establecer una relación directa. Por lo tanto, la información compartida entre las tríadas depende del control de los usuarios en posiciones intermedias, otorgándoles un poder que eleva su jerarquía social al estilo hoyos estructurales de Burt. Estas tríadas son incómodas y pueden ser una fuente de angustia para al menos un usuario (Heider, 1946) porque abren oportunidades para que los usuarios intermediarios oculten información y relaciones secretas. Para eliminar este malestar y angustia y evitar la desigualdad en las relaciones diádicas, las tríadas intransitivas exhiben una tendencia natural hacia la transitividad. En consecuencia, las estructuras intransitivas rara vez ocurren en redes fuera de línea (Hallinan, 1974) y representan tres usuarios que intencionalmente optan por retener la interacción. Los isomorfismos asociados son 021C, 111D, 111U, 201, 030C, 120C y 210.
Tríadas transitivas. Fuerza de relación: si bien el efecto de la jerarquía social disminuye en las tríadas transitivas, la fuerza de las relaciones determina tales interacciones. En consecuencia, las tríadas transitivas son abundantes en una red de amigos personales cercanos debido a la existencia de fuertes relaciones subyacentes entre ellos (Louch, 2000), debido a que para poder mantener relaciones multidireccionales se requiere una inversión significativa de emociones y tiempo al que sólo unos pocos se comprometerían, a menos que las relaciones sean fuertes y valiosas (Granovetter, 1973). Por lo tanto, las tríadas transitivas dominan las redes en las que los usuarios exhiben homofilia, ya sea que ocurra naturalmente (por ejemplo, raza y género) y/o por elección (por ejemplo, organización, religión y club). Por ejemplo, cuando tres personas pertenecen a una organización, un miembro puede presentar a su amigo a otro, e induce así la relación transitiva. Los isomorfismos asociados son 030T, 120D, 120U y 300.
Tríadas transitivas vacías. Egocentricidad: todas las tríadas transitivas vacías, excepto 021U y 021D, no son interesantes porque sólo incluyen relaciones diádicas y nodos no relacionados. Sin embargo, los usuarios de las tríadas vacías T.021U y T.021D exhiben tendencias egocéntricas y sólo se preocupan por ellos mismos con poca consideración por su red social (Henle, & Hubbell, 1938). En estas tríadas, las dos conexiones asimétricas apuntan hacia o lejos de los usuarios egocéntricos. T.021D presenta un usuario egocéntrico que interactúa con muchos otros, pero no recibe respuestas recíprocas. T.021U, por otro lado, representa a un usuario egocéntrico que recibe atención de muchos otros, pero nunca corresponde. Los isomorfismos asociados son 003, 012, 102, 021D y 021U.
En cuanto a la relación que mantienen estos isomorfismos con distintas características estructurales de las redes, algunas respuestas pueden encontrarse en los trabajos de Faust (2007, 2008, 2010). Sus aportes cotejan la composición de las tríadas con la densidad, el grado de salida, grado de entrada y el censo de díadas. En este sentido, un aporte como el de Faust (2007) analiza 82 redes sociales de variadas especies tanto humanas como animales. Una primera conclusión de interés reside en observar cómo el grado de entrada resulta ser restrictivo de las posibles configuraciones tríádicas que puede adoptar un grafo, así como la densidad y tamaño de la red. Posteriormente Faust (2008) analiza censos de tríadas de 128 redes sociométricas de elección limitada del estudio Salud del Adolescente. En tal estudio en particular, ocupan un espacio unidimensional que se describe casi completamente por la densidad de la red y que resalta la estrecha relación inversa de esta métrica con el isomorfismo 003, el cual resulta ser el de mayor prevalencia. Precisamente en redes de mayor densidad es de esperarse que tal configuración de tríada se encuentre ausente o disminuida en su representatividad, en vista de la mayor interacción de los individuos. Por último, en un trabajo posterior Faust (2010) estudia redes sociales humanas y de comportamiento animal, lo hace al cotejar el censo de tríadas con comportamientos diádicos, y enfatiza que tanto algunos comportamientos previstos de la red dentro del análisis de díadas no se veían reflejados en el censo de tríadas, debido a la presencia de sesgos estructurales de carácter triádico.
Metodología, datos y análisis
Para estudiar la relación entre las variables estructurales y los isomorfismos, decidimos aplicar una herramienta exploratoria clásica: el análisis de componentes principales (ACP). La utilización del ACP halla su razón de ser en la posibilidad de reducir la cantidad de información contenida en múltiples atributos. Precisamente, este algoritmo puede relevar relaciones “latentes” entre las variables utilizadas y que en un principio no se habían sospechado (Sabatini, 2009).
Un primer paso requiere que los datos por utilizar se hallen estandarizados, es decir, que cada una de las observaciones (páginas de Facebook en el caso este trabajo) deba ser reescrita tal como
Donde x¯ y s corresponden a la media y desvío estándar de los datos para el atributo j y siendo xi,j la observación estandarizada.
De esta forma, dada una matriz de datos X con n páginas de Facebook y p atributos, la misma puede ser planteada tal como se observa en (1).
Asimismo, se requiere la estimación de la matriz de correlaciones (R) de tamaño p x p:
De esta manera, R puede representarse como un producto escalar de vectores de dimensión p. La aplicación de ACP busca ejes de direcciones ortogonales entre sí donde la proyección de estos vectores sea máxima, de modo que resulte posible representar cada uno de los componentes Zi como una combinación lineal, tal como se ilustra en (3).
Por su parte, el coeficiente α es denominado como la carga factorial (loadings) del componente i para el atributo j.
Dado que se trata de una reconstrucción donde se pretende maximizar la dispersión de los datos, resulta posible estimar el porcentaje de varianza reconstruida mediante el estudio de los autovalores (λ), donde la sumatoria de los mismos es igual al número de atributos considerados, o de manera equivalente, a la traza de R.
Por consiguiente, la proporción de varianza reconstruida (v) en los i componentes se representa en (4).
En este sentido, una discusión de interés reside en cuántos componentes resultan relevantes para poder realizar conclusiones de interpretabilidad dada la dispersión de los datos. En el caso de este trabajo, se hará uso del denominado criterio de Kaiser, el cual señala la necesidad de considerar aquellas dimensiones cuyo autovalor supere la unidad (Kaiser, 1960).
El ACP presentará la información gráficamente en cuatro cuadrantes debido al cruzamiento de dos ejes cartesianos. Cada eje representa la información de cada componente elegido para el análisis en sus escalas de valores negativos a positivos. El primer cuadrante comprenderá la sección negativa del eje horizontal y la sección positiva del eje vertical, mientras que el segundo cuadrante comprenderá las secciones de valores positivos de ambos ejes. A continuación, del tercer cuadrante formarán parte los tramos de valores negativos de ambos ejes y el cuarto cuadrante estará compuesto por la sección de valores positivos del eje horizontal y la sección negativa del eje vertical. Usualmente se inicia combinando el primer y segundo componentes (que acumulan la mayor variancia explicada) y luego se combinan otros componentes si es que aportan información relevante al análisis. Luego se posicionan sobre los cuadrantes las cargas (loadings) de cada variable estimada. El agrupamiento de las cargas es la que permite interpretar variables que mantienen una misma correlación positiva (si se agrupan en el mismo cuadrante), correlación negativa (si se agrupan en cuadrantes opuestos) y no correlacionadas (si se agrupan en cuadrantes transversales).
Obtuvimos datos de las páginas de fans de Facebook de instituciones, negocios, actividades colectivas, entre otros, situadas en la ciudad de Bahía Blanca (Argentina). Las redes son páginas de seguidores de Facebook capturadas a lo largo del año 2015 (del 1/1/2015 al 31/12/2015). Formamos 325 redes que comprenden 93 692 nodos con 6 638 433 enlaces (incluidos los autoenlaces) y se observan en el gráfico 2 mediante el uso del software NodeXL (Smith et al., 2010). Esto se llevó a cabo antes del escándalo de Cambridge Analytic de 2018, de modo que los datos representan la captura completa de cada RSL. Tal como se expone en la tabla 1 , la cantidad media de nodos para las redes analizadas es 587, y se detecta una proporción importante de enlaces únicos promedio (0.66). Asimismo, debe resaltarse la existencia de una considerable dispersión (desvío estándar) en la densidad y el número de enlaces, lo cual podría significar que el nivel de actividad y participación de las redes presentan disimilitudes sustanciales.
Nota: La red de la izquierda representa los datos distribuidos aleatoriamente, mientras que la representación de la derecha representa el núcleo de nodos que comparten 354 de relaciones entre ellos (núcleo 354); el color asignado por modularidad a los modos y el esquema de visualización se halla en Force Atlas 2. Software Gephi (Bastian et al., 2009). Fuente: elaboración propia.
Momentos | Tamaño de red | Enlaces | Proporción de autoenlaces | Proporción de enlaces únicos | Proporción de enlaces recíprocos | Densidad |
Media | 587.28 | 32 936.25 | 0.052 | 0.664 | 0.181 | 0.12 |
Desvío estándar | 1 346.7 | 75 378 | 5.086 | 17.861 | 0.145 | 0.123 |
Moda | 14 | 16 | 0 | 1 | 0 | 0.25 |
Mediana | 175 | 2 579 | 0.007 | 0.705 | 0.135 | 0.085 |
Curtosis | 109.06 | 36.24 | 21.29 | –0.26 | 1.821 | 10.87 |
Asimetría | 8.83 | 5.015 | 4.341 | –0.70 | 1.365 | 2.65 |
Máximo | 18 887 | 776 623 | 0.984 | 1 | 0.727 | 1 |
Mínimo | 4 | 4 | 0 | 0 | 0 | 0 |
N | 325 | 325 | 325 | 325 | 325 | 325 |
Fuente: elaboración propia.
Luego se efectúa la estimación de censos de tríadas para esta colección heterogénea de redes sociales. Debe recalcarse que la unidad de análisis es una red social, y la recopilación de censos de tríadas para las redes se corresponde con cada una de ellas. En ese sentido, se adiciona al estudio de los isomorfismos un total de 25 variables estructurales correspondientes a cada red. Las mismas abarcan medidas globales o macro y describen distintas características de las mismas. El código, variable y descripción básica de cada una de estas variables se presenta en la tabla 2.
Para el caso de las configuraciones de las tríadas, se analizaron los porcentajes de participación de cada tríada en el censo, debido a que estos agrupamientos están altamente correlacionados con el tamaño de la red (rango y número de enlaces).
Código | Variable | Descripción |
v1 | Nodos | Rango del grafo |
v2 | Enlaces únicos | Enlaces cuyo origen y destino no se repiten |
v3 | Enlaces con duplicados | Enlaces cuyo origen y destino se repiten |
v4 | Enlaces totales | Número total de enlaces |
v5 | Autoenlaces | Enlaces de un nodo hacia sí mismo |
v6 | Coeficiente de pares de nodos recíprocos | Porcentaje de los nodos adyacentes recíprocos sobre el total |
v7 | Coeficientes de enlaces recíprocos | Porcentaje de los enlaces adyacentes recíprocos sobre el total |
v8 | Componentes conectados | Cantidad de componentes conectados |
v9 | Componente conectado de nodo único | Nodos aislados |
v10 | Máximo de nodos en un componente conectado | Cantidad de nodos del componente gigante |
v11 | Máximo de enlaces en un componente conectado | Cantidad de enlaces del componente gigante |
v12 | Máxima distancia geodésica (diámetro) | Máxima distancia entre los dos nodos más alejados |
v13 | Distancia geodésica promedio | Promedio de las distancias entre todos los nodos |
v14 | Densidad de grafo | Porcentaje de enlaces actuales relativos a la red completa |
v15 | Asortatividad de grado de entrada-entrada | Medida de correlación entre el grado de entrada/salida de nodos con los grados de entrada/salida de sus contactos |
v16 | Asortatividad de grado de entrada-salida | |
v17 | Asortatividad de grado de salida-entrada | |
v18 | Asortatividad de grado de salida-salida | |
v19 | Grado promedio | Promedio de grado de todos los nodos |
v20 | Número de pares inalcanzables | Cantidad de pares de nodos que no tiene un sendero que los une |
v21 | Centralización de intermediación de red | Es la variación en la centralidad de intermediación de los nodos dividido por la máxima variación en los valores de centralidad de intermediación posible en una red del mismo tamaño |
v22 | Modularidad | Cociente de modularidad de toda la red |
v23 | Coeficiente de agrupamiento Watts-Strogatz | Promedio simple de los coeficientes de agrupamiento local de todos los nodos con grado al menos 2 |
v24 | Coeficiente de agrupamiento de red (transitividad) | Promedio ponderado de los coeficientes de agrupamiento local de todos los nodos con grado al menos 2 |
v25 | Centralización de cercanía de red | Es la variación en la centralidad de cercanía de los nodos dividido por la máxima variación en los valores de centralidad de cercanía posible en una red del mismo tamaño |
102 | Refiere al isomorfismo 102 | |
300 | Refiere al isomorfismo 300 | |
003 | Refiere al isomorfismo 003 | |
021D | Refiere al isomorfismo 021D | |
021U | Refiere al isomorfismo 021U | Isomorfismos |
030T | Refiere al isomorfismo 030T | |
120D | Refiere al isomorfismo 120D | |
120U | Refiere al isomorfismo 120U | |
012 | Refiere al isomorfismo 012 | |
120C | Refiere al isomorfismo 120C | |
210 | Refiere al isomorfismo 210 | |
021C | Refiere al isomorfismo 021C | |
111D | Refiere al isomorfismo 111D | |
111U | Refiere al isomorfismo 111U | |
030C | Refiere al isomorfismo 030C |
Fuente: elaboración propia.
Análisis con datos originales
En el gráfico 3 se presenta el primer y segundo componentes, los cuales acumulan el 53.47% de la variancia total. Se observa la asociación de métricas estructurales asociadas al tamaño de la red (cantidad de enlaces y nodos, tamaño del componente gigante, diámetro, distancia geodésica promedio, centralización de cercanía de red, entre otros) con todos los registros de tríadas. El análisis del gráfico 4 se ocupa del primer y tercer componentes, y nuevamente se evidencia una conducta agrupada de todas las tríadas respecto a indicadores asociados al tamaño de la red. Es decir que a medida que la red crece trivialmente, se contabiliza más presencia de todos los isomorfismos.
Lo que se aprecia en términos de asociación estadística de las variables estructurales de las RSL es que, empezando desde el cuadrante superior izquierdo, el rango de la red parece correlacionar muchas variables (enlaces únicos, enlaces totales, nodos, máximos enlaces en componente conectado). Este cuadrante podría definirse como asociado al tamaño de la red o del componente gigante de la misma.
Inversamente, en el cuadrante inferior derecho, podemos encontrar los componentes conectados de nodo único (nodos aislados), número de pares inalcanzables (desconectados), el número de componentes conectados (grupos aislados), coeficiente de agrupamiento (no ponderado) de Watts-Strogatz y la cantidad de agrupamientos. Este cuadrante reúne información que define el nivel de falta de conectividad que tiene la estructura de red.
En el cuadrante inferior izquierdo se posicionan tanto diámetro como distancia geodésica promedio, junto a las asortatividades (de grado de entrada-salida y de grado de salida-entrada) y centralización de cercanía de red. Este cuadrante reuniría información de estructuras de tipo hub-spoke extendidas.
Finalmente, el cuadrante superior derecho agrupa modularidad, grado promedio, los indicadores de reciprocidad (coeficientes de enlaces y nodos recíprocos, respectivamente), las asortatividades directas (de grado de entrada-entrada y de grado de salida-salida) y marcadamente la densidad. Este cuadrante reúne información que asocia a redes densas, recíprocas y compactas.
Si bien quedan estructuralmente caracterizadas las redes capturadas por cuatro cuadrantes que indican las variables de rango o tamaño de red, se encuentran negativamente asociadas a la presencia de redes desconectadas. Luego tenemos que las estructuras de forma de estrella (hub-spoke) están negativamente correlacionadas con redes densas.
Por lo indicado anteriormente, la asociación del censo de isomorfismos se encuentra trivialmente influido por el tamaño de red, por lo que no mucho puede decirse al respecto. Sin embargo, es posible realizar un análisis de mayor solidez al considerar la relevancia porcentual de cada configuración triádica.
Transformación y análisis con datos composicionales
Debido entonces a un posible efecto de arrastre entre el tamaño de la red y el recuento de cualquier configuración triádica es que debemos explorar la importancia relativa de cada isomorfismo en la composición general. En este sentido se debe trabajar con el porcentaje de participación relativa de cada configuración en el censo de tríadas, pues debe transformarse en valores porcentuales la presencia de cada tríada. El problema de trabajar con porcentajes de un total en el análisis estadístico está bien detallado en la literatura estadística (Aitchison, 1981, 1986; Pawlowsky-Glahn, & Egozcue, 2006). Estos aportes hacen hincapié en los recaudos requeridos para no violar el principio de independencia de las observaciones que el uso de estos datos crudos puede conllevar. Tales datos, denominados composicionales porque componen un todo, implican que al estar restringidos porque la suma de los componentes debe arribar a un entero (deben sumar 100% de la explicación del evento), tiene por efecto que el crecimiento de una variable sea a expensas de otras.
Para llevar a cabo un análisis estadístico que evite esa restricción es necesario aplicar transformaciones a los datos que comprenden alguna forma de conversión logarítmica de los datos originales. De las diversas transformaciones sugeridas, resulta pertinente recurrir a la transformación CLR (centered log ratio) o de cociente logarítmico centrado, puesto que aprovecha toda la información composicional (cantidad censada de un isomorfismo respecto al conteo general de todos los isomorfismos). La misma implica representar el logaritmo natural de un componente respecto al producto de todos los componentes. Esta transformación sigue estando restringida debido a que la suma de todos sus transformados debe ser cero.
Sean los datos composicionales proporciones de un todo (Aitchison, 1981). En particular, una composición o dato composicional puede representarse mediante un vector real con componentes no negativos. El espacio muestral de los datos composicionales es el simplex:
La transformación de cociente logarítmico centrado (clr) es tanto un isomorfismo como una isometría, donde clr: S D → U,U R D
Donde es la media geométrica de x. A continuación restimamos el modelo de componentes principales, pero suplantando los valores originales de cantidad de presencia de isomorfismos por su participación relativa en forma de transformado clr del valor porcentual original. La información ahora es muy probable que no se encuentre correlacionada con métricas de red fuertemente asociadas al rango.
El gráfico 5 muestra los dos primeros componentes del nuevo análisis de componentes principales con las variables composicionales transformadas, mientras que el gráfico 6 hace lo propio con el primero y tercer componentes, respectivamente. A los isomorfismos se les añade una pequeña representación gráfica de la tríada. El total de variancia explicada alcanza 39.5% en el primer caso. Ahora las ubicaciones dentro del esquema de representación gráfica del ACP son diferentes a los datos crudos presentados en los gráficos 3 y 4, aunque aproximadamente coincidentes en las asociaciones entre ambos gráficos. Por ejemplo, los gráficos 5 y 6 nos muestran que asociados a los isomorfismos vacíamente transitivos (2-012; 5-021U; 1-003; 4-021D y 3-102) se hallan diversas métricas estructurales de la presencia de autoenlaces, modularidad, asortatividad de entrada-salida, coeficiente de agrupamiento de red (transitividad) y enlaces únicos. Básicamente, esos isomorfismos se asocian a posiciones separadas o de falta de conectividad.
Del mismo modo, la presencia de los isomorfismos intransitivos (201, 021C, 111D, 111U, 201, 030C, 120C y 210) se encuentran asociados a autoenlaces, modularidad, asortatividad de entrada-salida y de entrada-entrada, componentes conectados, componentes aislados a la cantidad de agrupamientos, centralización de cercanía de red y centralización deintermediación de red. Los isomorfismos intransitivos precisamente extienden el tamaño de la red dado que incluyen la tríada prohibida. En este caso se asocian también a variables de baja conectividad, como los autoenlaces y al número de componentes conectados y aislados, así como al valor de modularidad y la cantidad de agrupamientos. De nuevo encontramos entonces, la participación de esos isomorfismos en el censo de tríadas como explicando redes compuestas de diversas subredes o comunidades.
Finalmente, la participación en el censo de tríadas del grupo de isomorfismos transitivos (030T, 120D, 120U y 300) se halla asociada a la presencia de nodos y enlaces recíprocos, densidad de grafo, asortatividad de grado de entrada-entrada, de grado de salida-salida, grado promedio, y el coeficiente de agrupamiento (transitividad) y de agrupamiento de Watts-Strogatz. Particularmente en este caso, los isomorfismos de transitividad están asociados a alta conectividad y cantidad de enlaces con presencia de reciprocidad.
Conviene ahora asociar los isomorfismos dentro de las definiciones previas de egocentricidad, fuerzas de relación y jerarquía social en el contexto estructural detectado. La egocentricidad asociada a los isomorfismos vacíamente transitivos se distingue en que representan estructuras desconectadas o aisladas de la red. Por otra parte, la jerarquía social se halla vinculada a tríadas intransitivas que determinan posiciones de control de flujo de la información asociadas a la disgregación de las redes en subredes o comunidades. Finalmente, las fuerzas de relación asociadas a los isomorfismos transitivos se enmarcan en los componentes gigantes o comunidades densas y recíprocas del conjunto de redes analizadas.
En el contexto de las páginas de Facebook se refuerza el contexto de asortatividad positiva entre las tríadas. Quienes más se conectan localmente van generando grandes agrupamientos de interconectividad que derivan, a la vez, en grandes grupos, donde la información se difunde y es recíproca y quienes más publican se asocian gradualmente a quienes más publican y quienes más son comentados se asocian a quienes también son más comentados.
Este proceso genera un efecto Mateo rápidamente observable en la conducta en línea a través de grandes hubs o nodos centrales. Este efecto describe el fenómeno empírico (Perc, 2014) observado: en los grupos humanos, los ricos tienden a enriquecerse y adquirir aún mayor poder y los pobres tienden a ser cada vez más pobres.1 Se halla estrechamente relacionado con el concepto de conexión preferencial en análisis de redes sociales (ARS), donde los nodos más conectados están destinados a adquirir muchos más enlaces en el futuro que los nodos periféricos. La ventaja acumulativa también describe el hecho de un círculo virtuoso en el que la ventaja tiende a engendrar una ventaja adicional, en una retroalimentación positiva. El concepto está detrás de las muchas leyes de potencia y el comportamiento de escala en los datos empíricos, así como en el corazón de los estudios de auto organización en las ciencias.
Finalmente, un censo de tríadas permite detectar desde un punto de vista de información microscópica cómo la estructura de la red es permeable al flujo de la información o, por el contrario, dificulta el mismo o lo arbitra en pocos agentes importantes.
Conclusiones
Este trabajo ha incursionado en el análisis de la microestructura de redes que conforman un tipo de interacción diaria de la vida moderna. Se analizaron las acciones de miles de individuos en decenas de redes de páginas de Facebook durante un año entero. En primer lugar, fue examinada la interacción entre la cantidad y composición de los isomorfismos relevados y las variables estructurales, donde se detectaron cuatro patrones sobresalientes asociados a que las variables relativas al tamaño de la red se encuentran inversamente asociadas a las variables.
Para entender esta microestructura se contabilizaron las tríadas de cada red a través de un censo de tríadas y, al ampliar la bibliografía precedente, se cotejó el conteo y composición de cada tipo de tríada con una veintena de indicadores estructurales. Se realizó igualmente un análisis de componentes principales a fin de explorar y determinar un patrón en estas relaciones. En primer lugar, al utilizar los datos de conteo de tríadas, se identificaron cuatro cuadrantes de asociación de variables estructurales. El primer cuadrante asoció variables que remiten todas al tamaño de la red y que se encontraban en oposición al cuadrante diagonal, el cual enmarcaba redes con problemas de falta de conectividad. Posteriormente, se encontró en los cuadrantes restantes una oposición entre las redes densas y recíprocas frente a aquellas asociadas a estructuras de tipo estrella o hub-spoke extendidas. De una manera trivial el conteo de tríadas se vio arrastrado por el efecto del tamaño de red, es decir, a medida que aumentaba el tamaño de red se contabilizan más isomorfismos de cada tipo.
Para lidiar con este problema, se introdujo un análisis de la composición porcentual de cada isomorfismo. De acuerdo con los supuestos estadísticos clásicos (sobre todo el de independencia de las observaciones) se procedió a analizar los conteos de isomorfismos como porcentajes de participación en el total censado, a fin de anular el efecto de escala o tamaño de red, y se modificaron esos datos mediante la transformación centrada logarítmica (clr, en inglés). A partir de esta transformación se realizó nuevamente el análisis de componentes principales y los patrones de asociación se revisaron con las variables transformadas. Los isomorfismos calificados como transitivamente vacíos y asociados al egocentrismo quedaron naturalmente vinculados a variables que describen estructuras desconectadas, mientras que los isomorfismos calificados como intransitivos y asociados a control del flujo de información se enmarcaron en estructuras de comunidades o subredes. Finalmente, las tríadas transitivas asociadas a la fortaleza del enlace se alojaron en estructuras de redes densas y recíprocas. La transitividad está muy asociada a la reciprocidad y asortatividad y al tamaño de la red. El gregarismo en línea genera de este modo un efecto Mateo (Perc, 2014).
Es interesante subrayar que resulta necesario este tipo de análisis estructural inicial sobre grandes RSL, debido precisamente y con frecuencia al rango gigante de las mismas. En nuestro caso, se ha buscado acercarnos a comprender ciertas propiedades estructurales de una red de más de 90 mil nodos y millones de enlaces difícilmente interpretable a simple vista. Y éste es un reto que se volverá más presente a medida que la participación en línea se incremente.