Introducción
El big data es un fenómeno social, tecnológico y cultural, resultante del proceso de datificación de nuestro mundo material, subjetivo y social que ha tenido un crecimiento exponencial en las últimas décadas junto a la digitalización (Dijck, 2014; Kitchin, 2021). Coincidentemente, se entiende a la inteligencia artificial como un conjunto de desarrollos tecnológicos que permiten explotar estos datos para controlar varios -si no todos- los aspectos de nuestra realidad (Sadin, 2018). Big data e inteligencia artificial se encuentran profundamente imbricados -junto a otros fenómenos, como los algoritmos sociales- en una transformación del capitalismo contemporáneo, la dinámica política, y los criterios y expectativas del conocimiento.
El término “big data” fue introducido en el campo de I.T., hace aproximadamente una década, para referir a los desafíos computacionales implicados en el manejo de grandes volúmenes de datos (Diebold, 2012). Luego, se popularizó en el lenguaje de la consultoría de negocios cuando representantes de firmas como Gartner o ibm empezaron a asociarla en sus documentos de marketing con un listado de palabras con “V”: volumen, variedad, velocidad, valor, entre las principales, a las que se fueron sumando otras, como veracidad o visualización (van Rijmenam, 2014). En otro estudio se constata que, aún hoy, estas palabras se encuentran en la mayoría de las definiciones dadas por los medios masivos de comunicación en artículos focales (Becerra, 2021). En campos especializados del conocimiento tan distintos como sociología y psicología (Favaretto et al., 2020), o ingeniería y ciencias de la computación (De Mauro et al., 2015), esta manera de definir al big data convive con otras que, en lugar de referir a propiedades y atributos, buscan poner el foco en los procesos prácticos, sociales y tecnológicos que le dan origen y sentido. Por su parte, la noción de “inteligencia artificial” surge en los años 40-50, a partir de los desarrollos pioneros de la cibernética en la que confluyeron matemáticos y psiquiatras de la talla de Ross Ashby o Norbert Wiener, y discípulos como Alan Turing, cuyo trabajo (1950) le ganó el mote de “padre de la inteligencia artificial”, que se propusieron modelar y replicar los procesos y las capacidades cognitivas humanas a través de la técnica, desarrollando dispositivos computacionales, matemáticos, mecánicos e incluso biológicos que pudieran tener comportamientos inteligentes (Pickering, 2010; Franklin, 2014). En las décadas siguientes, este esfuerzo tecnológico se ha ido desligando del objetivo científico de modelar la mente humana, orientándose hacia el avance de capacidades mucho más acotadas, tales como las que se persiguen en el campo del aprendizaje automático: reconocimiento de imágenes a partir de patrones, procesamiento del lenguaje natural, construcción de modelos estadísticos y predictivos, entre otros.
En los últimos años, desde las ciencias sociales se ha ido constituyendo una línea de trabajo con una mirada crítica sobre el big data y la inteligencia artificial que busca echar luz sobre los problemas sociales y los riesgos éticos a los que nos enfrentan (Iliadis y Russo, 2016; Boyd y Crawford, 2012; Segun, 2021; Becerra y López-Alurralde, 2017). Así, se ha argumentado que lo que llamamos big data es un nuevo estadío del capitalismo que captura y reduce la experiencia humana con fines comerciales, o que la inteligencia artificial -especialmente en la forma de algoritmos sociales- no se sustenta en capacidades tecnológicas, sino en una ideología que cree posible organizar las interacciones sociales, a modo de un power broker (Lanier y Weyl, 2020; O’Neil, 2016; Zuboff, 2019; Srnicek, 2018). Otro objetivo central de esta línea de trabajo es discutir los sentidos sociales y las ideologías que han posibilitado el enorme crecimiento del big data y la inteligencia artificial, desenmascarando las retóricas que los presentan como tecnologías “neutrales” u “objetivas”. Así, por ejemplo, hemos explorado junto con otros autores el discurso promocional de los medios masivos que glorifican las potencialidades de estos desarrollos, mientras esconden su carácter social y propietario (Becerra, 2021; Elish & Boyd, 2018; Sadowski, 2019; Portmess y Tower, 2015).
Teoría de las representaciones sociales y su modelo estructural
Con el presente trabajo se busca continuar en esta indagación crítica de los sentidos sociales del big data y la inteligencia artificial, guiados por una mirada psicosocial que pone el foco en sus representaciones sociales3.
Por representación social (en adelante, RS) se entiende a una forma de conocimiento de carácter práctico, orientado hacia la comunicación y la interacción cotidiana con nuestra realidad (Jodelet, 1985; Wagner y Hayes, 2011). Moscovici (1979, p. 18) las define como un “sistema de valores, nociones y prácticas que proporcionan a los individuos los medios para orientarse en el contexto social y material, para dominarlo”. Las RS se construyen activamente ante la necesidad de dar sentido a fenómenos novedosos que nos interpelan, condicionados por nuestra posición en el entramado de relaciones sociales (Marková, 2017). El estudio original de Moscovici sobre las RS del psicoanálisis (1979) es el caso de un desarrollo científico que se inserta en el mundo del sentido común, con apropiaciones y recortes propios para cada grupo social, proceso que se ve condicionado por visiones ideológicas que reflejan las relaciones con otros grupos sociales. No sería arriesgado hipotetizar que el proceso de representación del big data y la inteligencia artificial nos ofrezca un caso análogo.
Particularmente, aquí adoptamos el modelo estructural de la Teoría de las representaciones sociales (en adelante, TRS) propuesto por J. C. Abric (2001, 1993), que postula que toda RS es un conjunto organizado de sentidos con una estructura particular. Dicho modelo se compone, por un lado, de un núcleo o sistema central de sentidos “estables, coherentes, consensuados e históricamente condicionados” (Abric, 1993, p. 76), es decir, los contenidos más comunes y salientes de la representación en la memoria colectiva; por otro lado, un sistema periférico “flexible, adaptativo y relativamente heterogéneo” (Abric, 1993, p. 77) en los que encontraremos los sentidos más concretos y vinculantes para la acción de los distintos individuos y sub-grupos sociales, y, por ello, más permeables a las necesidades de sus contextos de prácticas. En términos dinámicos, es en el sistema periférico donde se ubican informaciones nuevas que pudieran desafiar los sentidos del núcleo, funcionando como una suerte de “cinturón protector”.
Hasta donde se conoce, no hay estudios similares sobre el big data, planteados desde la TRS; si hay un antecedente con el mismo modelo estructural en torno a la RS de los robots, con resultados muy cercanos a los que aquí se registran para inteligencia artificial (Piçarra et al., 2016). Otros antecedentes cercanos son los análisis de contenidos de diversos tipos de comunicaciones sobre estos fenómenos, como en la prensa y los medios de masas (Becerra, 2021; Paganoni, 2019; Pentzold y Fischer, 2017), o de diferentes manifestaciones de la cultura (Hunter, 1993; Szollosy, 2017; Zdenek, 2003; Fast y Horvitz, 2016).
Preguntas de investigación
Como se adelantó, nuestro objetivo es aportarle a una mirada crítica del big data y la inteligencia artificial, explorando los sentidos sociales que condicionan su aceptación y desarrollo. Para ello, nos interesa, en primer lugar, reconstruir el mundo de sentidos a los que se asocian estos términos y su organización, así como las actitudes u orientaciones valorativas. Esto último responde a nuestro interés por explorar la polaridad que diversos estudios (e.g., Paganoni, 2019) señalan en torno al big data y la inteligencia artificial, y que los ubican en un entendimiento donde conviven una mirada beneficiosa/utópica y otra riesgosa/distópica. En segundo lugar, indagar en las relaciones entre estas ideas evocadas en torno al big data y la inteligencia artificial, infiriendo posibles temas en los que se ponga en juego un recorte -framing- y una valoración particular. Finalmente, el interés por indagar en torno a las fuentes de información acerca de estos temas, con foco en los medios de comunicación de masas y distintas carreras universitarias. Aquí se parte de la hipótesis que informa que al interior de cada uno de estos espacios de comunicación e interacción -que no son excluyentes- circulan distintos posicionamientos que tematizan al big data y la inteligencia artificial de manera particular. Considerar el ámbito de las carreras universitarias en esta primera exploración nos resulta relevante en cuanto se hipotetiza que ambos fenómenos suponen una transformación en los criterios y expectativas con los que se evalúa el conocimiento, y que esto pudiera desencadenar posicionamientos condicionados por los enfoques propios de las distintas ramas del conocimiento y su división (y competencia) en el mercado laboral.
En resumen, se propone responder las siguientes preguntas:
RQ1: ¿Qué sentidos se asocian al big data y la inteligencia artificial? ¿Cómo se organizan y estructuran? ¿Cuál es la valoración de los sentidos asociados?
RQ2: ¿Cuánto se asemejan, y en qué difieren los campos representacionales de dichos fenómenos?
RQ3: ¿Cómo se correlacionan estas ideas en las respuestas dadas por los participantes? ¿Qué formas de recortar y tematizar al big data se pueden inferir?
RQ4: ¿Cuáles son las fuentes de consulta acerca del big data y la inteligencia artificial? ¿Cómo lo representan estudiantes de distintas carreras universitarias?
Método
Instrumentos
La recolección se realizó a través de un formulario online, diseñado para este estudio y difundido por redes sociales, basado en la técnica de evocación o asociación libre de palabras (Figura 1), el cual tiene una larga tradición de uso en la investigación de RS, debido a que permite fácilmente poner de manifiesto un campo representacional ordenado (Doise et al., 1993; Wagner y Hayes, 2011). Los términos inductores utilizados en el formulario fueron “big data” e “inteligencia artificial”, priorizándolos sobre otros posibles, ya que estas son las denominaciones más comunes en la sociedad argentina en los libros de divulgación y en las notas de medios masivos. También incluimos los términos “ciencia de datos” y “conocimiento”, aunque con menor frecuencia de aparición, como casos de contrastación con el objetivo de indagar en la especificidad de los primeros. Para cada participante el formulario muestra sólo uno de estos términos para evitar condicionamientos entre los mismos. El formulario por default presentaba 5 campos para ingresar palabras, aunque se podían agregar otros. También permitía asignar una valoración para cada término introducido, por medio de un control deslizante entre “negativo” y “positivo”. Finalmente, se incluyeron preguntas sociodemográficas, de formación (carrera), y referidas a las fuentes consultadas. La consigna fue la siguiente: Por favor, indícanos qué palabras o frases te vienen a la mente cuando pensás en [“término”]. También te pedimos que, por favor, nos indiques si estas ideas que acabas de introducir se corresponden con algo que valoras positivamente (algo que te agrada) o negativamente (algo que te desagrada), utilizando el deslizador debajo de cada palabra.
Todas las tareas de pre-procesamiento, análisis y visualización fueron programadas en R (Team R Core, 2018). Para el análisis prototípico se diseñó una función4 que emula los del software IRaMuTeQ (Ratinaud, 2009), aunque siguiendo un enfoque “tidy” para la manipulación de los datos (Wickham, 2019); para los análisis de redes se utilizó la librería tidygraph, lo cual extiende igraph; para los análisis factoriales se utilizó la librería FactorMineR (Le et al., 2008).
Muestra
La muestra es no probabilística (Sampieri et al., 2006, p. 240), compuesta por estudiantes y graduados universitarios de Argentina, invitados a participar a través de redes sociales. Este es un primer estudio que no pretende exceder el nivel exploratorio (Lee y Peng, 2015, p. 1314). La distribución de carreras, sexo y edad para cada término inductor se muestra en la tabla 1.
Edad | Educación | Género | |||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Término inductor | Rtas. | Asoc. | Media | sd | FCIM | Human | Psi | SCE | mujer | otro | varón |
Big data | 335 | 1.688 | 33,0 | 12,1 | 80 | 58 | 70 | 127 | 239 | 3 | 93 |
Inteligencia artificial | 255 | 1.290 | 32,7 | 11,2 | 56 | 38 | 39 | 122 | 188 | 3 | 64 |
Ciencia de datos | 102 | 513 | 29,7 | 8.26 | 23 | 15 | 11 | 53 | 63 | 3 | 36 |
Conocimiento | 90 | 465 | 31.1 | 8.99 | 13 | 14 | 19 | 44 | 70 | 1 | 19 |
Nota:
Educación: FCIM: Física, computación, ingeniería, matemática; Human: humanidades; Psi: Psicología, medicina y ciencias de la salud, CSE: Ciencias sociales y empresariales.
Estímulo | freq_cut | rank_cut | min_cut | dix_length |
Big data | 13.65 | 2.93 | 5.00 | 57.00 |
Inteligencia artificial | 10.82 | 3.06 | 4.00 | 61.00 |
Ciencia de datos | 4.94 | 3.28 | 2.00 | 62.00 |
Conocimiento | 4.31 | 3.09 | 2.00 | 70.00 |
freq_cut = Valor de corte para frecuencia; rank_cut = Valor de corte para ranking; min_cut = Frecuencia mínima; dix_length = Tamaño del diccionario
Preprocesamiento
El preprocesamiento del corpus de respuestas consistió en varios pasos:
los términos fueron lemmatizados (reducidos a su raíz), y se removieron símbolos, puntos y números, asimismo también artículos y adverbios;
se reemplazaron caracteres especiales y acentos;
se convirtió el corpus a minúscula;
en el caso de que la respuesta fuese una frase o varios términos, se unieron con “_”;
el único reemplazo que se realizó fue “gran_” por “grande_”.
Previo al preprocesamiento para todos los términos indagados, se contaba con un vocabulario de 1945 palabras únicas, de las cuales, 1490 aparecían una sola vez y, la más frecuente, tenía 131 repeticiones. Al terminar el preprocesamiento, el vocabulario se redujo a 1517 palabras únicas, de las cuales, 1081 aparecían una sola vez y, la más frecuente, tenía 182 repeticiones.
Análisis
Para responder el primer conjunto de preguntas (RQ1.) se realizó un “análisis prototípico” de las evocaciones, consistente en calcular, por cada término indagado, la frecuencia y rango de evocación de las respuestas, para clasificarlos luego en 4 segmentos que pueden ser interpretados como el núcleo de la representación, sus elementos periféricos y dinámicos, y sus manifestaciones singulares e idiosincráticas (Abric, 1993). Como criterio de corte para segmentar entre los términos evocados más/menos rápido, y entre los más/menos frecuentes, se utilizó la media (De Rosa, 2002). Este criterio no tiene consenso en la literatura, sino que suele justificarse por la conveniencia para efectuar análisis posteriores (Dany et al., 2014; Ferrara y Friant, 2016; Wachelke y Wolter, 2011). También se establecieron frecuencias mínimas para cada término buscando que el número de asociaciones incluídas en los segmentos fuese relativamente parejo, para facilitar futuros análisis de comparación. Todo este procedimiento, de acuerdo con Wachelke y Wolter (2011), es solo una forma de organizar la información relativa a una evocación, una convención para la presentación de los datos. Su finalidad es aportar una primera exploración sobre los sentidos, sugiriendo una posible estructura, sin pretender carácter estadístico.
Luego, para vincular y comparar las RS del big data y la inteligencia artificial (RQ2), se ha calculado la similitud entre los términos evocados, usando el índice de asociación de Ellegard (Bisconsin-Júnior et al., 2020; Doise et al., 1993). Este índice se calcula dividiendo el número de palabras en común entre dos diccionarios por la raíz cuadrada del producto de las palabras totales, variando en un rango de 0 (diccionarios totalmente distintos) a 1 (diccionarios idénticos). Luego, las distancias entre pares de diccionarios se analizaron con un análisis de cluster jerárquico (hca, Hierarchical Cluster Analysis), utilizando las distancias euclidianas. Con el fin de tener mayor base de comparación, en este proceso de comparación se trabajó también con las evocaciones de los términos “conocimiento” y “ciencias de datos”.
Para responder al tercer conjunto de preguntas (RQ3.), se calcularon las relaciones entre palabras en el nivel de las respuestas, para luego construir un grafo (Ferrara y Friant, 2016; Verges y Bouriche, 2001). De entre las distintas maneras de construir estas relaciones, aquí se optó por calcular las correlaciones (alpha de Cronbach) entre palabras en el nivel de las respuestas, considerando sólo las palabras comprendidas en los primeros 3 segmentos de la representación, y filtrando las correlaciones negativas, para aplicar luego un algoritmo de detección de comunidades.
Finalmente, nos interesó indagar las fuentes de consulta sobre el big data y la inteligencia artificial, y las diferencias en las RS entre participantes de distintas carreras (RQ4.). Para lo primero, se realizó una diferencia de medias entre fuentes; para lo segundo, se llevó a cabo un análisis factorial de correspondencias (Husson et al., 2017) entre las palabras asociadas y la carrera reportada por los participantes (Barreiro et al., 2014; Doise et al., 1993; Sarrica, 2007). Este segundo análisis se realizó sobre las palabras que quedaron dentro de los cuatro cuadrantes del análisis prototípico, y se consideraron los grupos de carreras.
Resultados
RQ1. Estructura de la RS del big data y la inteligencia artificial
Para explorar la estructura de la RS de los objetos que nos interesan, se siguió el procedimiento del análisis “prototípico” que resulta en una tabla con distintos segmentos de los sentidos evocados, distinguiendo entre los más/menos frecuentes y los evocados más/menos rápido. Para establecer los límites entre los segmentos se usaron dos indicadores: la frecuencia media para su generalidad, y la media de su accesibilidad o saliencia, entendida en términos de un rango medio del orden de evocación. Los Gráficos 2 y 3 presentan la estructura de la RS del big data y la inteligencia artificial.5 Las líneas punteadas marcan los puntos de corte. Así, el cuadrante inferior derecho de cada gráfico incluye las asociaciones registradas con una frecuencia mayor y un rango por debajo de la media (las que se evocan más rápido); en el cuadrante de arriba a la derecha se ubican las asociaciones de alta frecuencia, con un rango de evocación por arriba de la media; en los 2 cuadrantes de la izquierda se ubican las principales zonas de contraste, con las asociaciones menos frecuentes. El color denota la valoración media, en una escala de rojo (1/10) a verde (10/10). La frecuencia tiene una transformación (log) para visualizar mejor.
En primer lugar, nos interesan las asociaciones más frecuentes y salientes. Estas son las principales candidatas para expresar los sentidos más centrales y consensuados de la representación. Para el caso de big data se trata de los términos: informacion, dato, control, internet, analisis, grande, manipulacion, base_dato, conocimiento (en orden de frecuencia decreciente). La gran mayoría de estos términos evocados, remiten a la premisa epistémica del big data, consistente en que hay grandes conjuntos de datos que pueden ser analizados para generar información y conocimientos. Es interesante señalar que el término grande (lemma donde convergen distintos términos, tales como grandes, mucho) es el único en el núcleo que remite a las palabras con V’s. Sin embargo, también se debe aclarar que algunas de estas ideas están presentes en varias palabras compuestas de menor frecuencia, y que otro preprocesamiento las podría haber puesto en un lugar más predominante. Con la excepción de control -que es un término compartido con el mismo segmento en inteligencia artificial- y manipulación, cuya valoración es de 2.5 y 1.5/10 respectivamente, todos estos términos tienen una valoración media positiva, cercana a 8/10. Para el caso de inteligencia artificial, los términos evocados son: robot, tecnología, futuro, computadora, ciencia, control, máquina, automatización, robótico, algoritmo, innovación, progreso, robótica (en orden de frecuencia decreciente). El campo semántico que se puede inferir de estas palabras remite a tecnologías desarrolladas, algunas de ellas con las que interactuamos cotidianamente, como computadora o algoritmos, aunque las más frecuentes robot, robótico, robótica pueden ubicarse antes en el imaginario popular que en la interacción cotidiana. En este sentido, a diferencia de lo visto en big data, estos sentidos no permiten inferir usos particulares. Y si bien la media de las valoraciones de estos términos también es positiva, por arriba de 6.5/10, la misma es relativamente más baja que la del mismo segmento para big data.
En torno al núcleo central se ubica una periferia que, de acuerdo con Abric (1993), puede incluir sentidos más concretos y dinámicos, que adaptan los sentidos centrales a diversos contextos, o expresan la particularidad de algún grupo. En esta periferia se encuentran, en primer lugar, aquellas asociaciones de alta frecuencia, pero un rango de evocación por arriba de la media (en las Figuras 2 y 3, en el recuadro de arriba a la derecha), es decir, sentidos consensuados que no se evocan tan rápidamente; y en segundo lugar, aquellas de baja frecuencia pero muy salientes, indicativas de sentidos muy significativos, aunque sólo para algunos grupos minoritarios de participantes. En el caso de big data, se trata de las asociaciones tales como tecnología, privacidad e informática, para el primer grupo, y de computadora, marketing, espionaje, poder, entre algunas variantes de otras asociaciones más centrales ya mencionadas, como mucha información, o grandes datos. Se pueden agrupar estas asociaciones en dos grandes sentidos: en primer lugar, aparece la materialidad del big data, con referencias a su infraestructura o la remisión a un sector de la economía y la actividad laboral, con una valoración media positiva, que oscila entre 5-7/10; en segundo lugar, aparece el principal riesgo del big data: la explotación con fines comerciales o políticos, avasallando la privacidad hacia los datos personales. En el caso de inteligencia artificial, se trata de asociaciones como avance, desempleo, programación y también big data, para el primer segmento, e innovación, progreso, evolución para el segmento. Las valoraciones medias en estos segmentos son mucho más altas y menos dispersas que las de big data, aunque no tanto como la de los objetos de contraste que hemos seleccionado (conocimiento y ciencia de datos). Entre los términos más negativos se encuentra el desempleo (y más abajo en la frecuencia, el del reemplazo). Finalmente, en el último segmento (en las Figuras 2 y 3, ubicados en el recuadro de arriba a la izquierda) se encuentra una zona periférica de la representación que incluye sentidos con muy poco consenso y poca significatividad, de modo que pueden ser considerados idiosincráticos y menos interesantes para su caracterización.
RQ2. Relaciones entre la RS del big data y la inteligencia artificial
Es claro que los fenómenos del big data y la inteligencia artificial se encuentran profundamente imbricados no sólo en su historia, sino también en que tienen una relación fluida en la retórica con que se los presenta. Como señalan Elish y Boyd (2018), algunos actores en la industria tecnológica suelen usar un término o el otro, de acuerdo con el nivel de entusiasmo que generen en el público. No debería entonces asombrarnos que en la RS del big data y la inteligencia artificial encontremos al otro en su periferia: big data se encuentra en el segundo segmento de las asociaciones de inteligencia artificial, y éste se encuentra en el cuarto segmento de big data. También comparten algunos de sus sentidos más consensuados, y si observamos las diferentes posiciones que ocupan, se puede inferir una posible clave para relacionarlos: elementos centrales de la representación del big data, especialmente las que se pueden inferir que remiten a su dimensión epistémica, como información, internet o conocimiento, que se corresponden con sentidos en la periferia de inteligencia artificial; en contraparte, asociaciones centrales de inteligencia artificial, relativas a su infraestructura, como tecnología y computadora, se ubican en la periferia del big data. Más interesante, puede observarse que comparten a control en cada núcleo, lo que sugiere que la relación entre ambos está teñida de suspicacia.
Para aclarar más el campo de sentidos que quedan involucrados en torno al big data y la inteligencia artificial, se puede recurrir a una comparación con las RS de otros dos objetos de interés: el conocimiento y la ciencia de datos (Figura 4). Si se calcula la distancia entre los diccionarios compuestos por los 3 primeros segmentos de cada representación, se observa (Figura 5) que big data y ciencia de datos se encuentran muy cercanas, en tanto comparten gran parte de los sentidos; que en términos relativos les sigue inteligencia artificial; y que conocimiento presenta una mayor diferencia con el resto. Esto permite conjeturar que, si bien, la posibilidad de dar lugar a un conocimiento novedoso es un elemento central de la retórica tanto del big data como de la inteligencia artificial, este sentido no es equivalente a la RS del conocimiento, el cual presenta varios elementos que las anteriores no contienen, como la referencia al saber, poder, libro, cultura, ignorancia y, comparativamente, tampoco presenta elementos de valoración baja o negativa en su núcleo. Por otro lado, si bien es claro que big data e inteligencia artificial tienen sentidos complementarios, la dimensión del análisis, investigación y/o extracción de conocimiento es más presente en la primera que en la segunda, lo que confirma un poco más la inespecifidad, o la falta de un objetivo claro para la inteligencia artificial, más allá del control.
Big data | IA | |||
Término | Ranking | Segmento | Ranking | Segmento |
información | 1 | 1 | 23 | 3 |
control | 3 | 1 | 6 | 1 |
internet | 4 | 1 | 19 | 3 |
conocimiento | 9 | 1 | 24 | 3 |
tecnología | 10 | 2 | 2 | 1 |
computadora | 14 | 3 | 4 | 1 |
innovación | 28 | 3 | 11 | 1 |
RQ3. Temas en la RS del big data y la inteligencia artificial
Los análisis anteriores, tributarios del modelo estructural, son útiles para generar hipótesis en torno a una organización jerárquica de la RS, pero requieren de subsiguientes análisis para aclarar las relaciones entre sí de los sentidos. Por ello, aquí hemos calculado las asociaciones entre palabras, y observar cómo se juntan en las respuestas, y estas asociaciones construyen un grafo. Luego, se detectan comunidades automáticamente con un algoritmo de detección de comunidades. Las Figuras 6 y 7 reflejan estas relaciones: el color de los puntos denota el grupo de términos, mientras que su grosor denota el grado de asociación entre los términos, y el color denota la comunidad o grupo.
Al considerar estas correlaciones entre sentidos evocados en torno a big data, se puede sugerir que hay 2 grandes posibles temas: un primer tema está marcado por el primer grupo de correlaciones más fuertes, que se corresponden con una definición básica del big data, donde prácticamente no excede a la traducción de dicho término, y que vincula a datos e información con nociones de volúmenes, tales como grande, mucho, o importante; en el mismo sentido se encuentra otro grupo que incluye a muchos datos, bases de datos, mucha información, pero también a manipulación; junto a estos, un tercer grupo incluye a grandes datos junto a nociones de informática y estadística; luego, hay un segundo tema con términos fuertemente correlacionados, mayormente vinculados con los peligros del big data: control, marketing, espionaje, poder y complejidad. Los sentidos dados a inteligencia artificial se correlacionan en menor grado, pero entre mayor número de elementos, dando grupos con menos definición. Sin embargo, pueden diferenciarse algunos temas: uno de ellos incluye términos relacionados con los usos posibles y sus consecuencias sociales, como desempleo, educación, innovación, ciencia, o evolución, progreso, mente, aprendizaje; otro tema, más cercano a la computación y la robótica, y a modos de implementar o instanciar la inteligencia artificial, sin referencia a un uso social particular, como red neuronal o algoritmo, y que incluye también algunas menciones vinculadas con el riesgo, como peligro, skynet, o control.
RQ4. Fuentes de difusión y consulta del big data y la inteligencia artificial
Finalmente, nos interesa indagar acerca de las fuentes que los participantes utilizan para informarse sobre nuestros objetos de interés. Con respecto a las fuentes, la Tabla 4 nos muestra algunas particularidades: los participantes consultan mayormente sitios web, sin distinción de carreras de origen; los que más reportan haberse formado dentro de su carrera sobre estos temas son los que provienen de Física, computación e ingeniería; en el espacio de la formación dentro de las carreras, el big data parece haberse insertado con mucho más peso que la inteligencia artificial, a pesar de que esta última es un campo transdiciplinar de las ciencias con una larga tradición; quienes más se informan por medio de diarios y noticias son los estudiantes de psicología, medicina y ciencias de la salud; los estudiantes y graduados de ciencias sociales y negocios, son quienes más reportan la realización de cursos sobre big data e inteligencia artificial, presumiblemente para complementar su formación profesional frente a la irrupción de estas tecnologías en las áreas de competencia laboral.
Big data | IA | |||||||
---|---|---|---|---|---|---|---|---|
Carrera | Cursos | Diarios | Formación | Sitios | Cursos | Diarios | Formación | Sitios |
Física, comput. e ingeniería | 0.47% | 0.39% | 0.46% | 0.65% | 0.55% | 0.30% | 0.41% | 0.57% |
Humanidades | 0.36% | 0.34% | 0.41% | 0.60% | 0.42% | 0.53% | 0.21% | 0.74% |
Psicología y medicina | 0.29% | 0.43% | 0.30% | 0.51% | 0.38% | 0.64% | 0.28% | 0.49% |
Sociales y empresariales | 0.50% | 0.43% | 0.40% | 0.56% | 0.50% | 0.57% | 0.29% | 0.67% |
Luego, una forma posible de indagar la incidencia de estos medios en la RS es mediante un análisis de correspondencia que permita representar en forma simultánea los términos y los grupos de carrera (Figuras 8 y 9). Para esto se redujeron los datos de cada representación a dos ejes factoriales que cubren cerca de 70-80 % de la varianza. Sin embargo, en tanto esta técnica busca explorar posicionamientos diferenciales relativos, los resultados solo pueden ser tomados como posibles indicios de significaciones a explorar con otros métodos. Puntualmente, se observa: que los estudiantes y graduados de psicología y otras ciencias de la salud crean mayor foco en las consecuencias más amplias, como el control y marketing para big data, y el reemplazo de la humanidad, o la evolución para la inteligencia artificial; que los estudiantes y graduados de humanidades, ponen el foco en problemáticas como privacidad, desempleo, además de identificar factores (tecnológicos) del desarrollo de ambas, como los celulares, internet o (tecnologías en la) nube; que los estudiantes y graduados de física, computación e ingeniería, vinculan explícitamente big data e inteligencia artificial, junto con otras nociones informáticas, pero sin dejar de señalar peligros como la manipulación; y finalmente, que los estudiantes y graduados de ciencias sociales y negocios constituyen el mayor grupo en nuestra población, de modo que sus posiciones son más cercanas al sentido común relevado.
Conclusiones
En este trabajo se buscó aportar una mirada crítica del big data y la inteligencia artificial, a través de la exploración de sus sentidos sociales, entendiendo que éstos condicionan la problematización de los grupos sociales, así como sus expectativas, demandas y reparos. Para ello, se administra una encuesta con una técnica de asociación de palabras o evocaciones, que se ha interpretado siguiendo el modelo estructural de la TRS.
En nuestra RQ1. se pregunta por el contenido y la organización de estas RS y sus valoraciones y actitudes asociadas, y en RQ2. el interés está en indagar sobre las relaciones entre estas ideas evocadas. Según los resultados obtenidos, el núcleo central de la RS del big data discurre en sentidos vinculados con la información y los datos, así como los de inteligencia artificial se centran en la figura del robot y la tecnología. En ambos casos se trata de ideas abstractas, valoradas positivamente. Estos sentidos conviven con otros que remiten al campo del conocimiento y la ciencia, también con valoraciones positivas; otros, advierten peligros y riesgos, con valoraciones muy negativas. Entre los sentidos positivos redundan aquellos que remiten tanto a las imágenes del fenómeno como a su proyección: así los datos y los robots conviven con promesas de información, conocimiento y futuro. En otro estudio, limitado al big data (Becerra, 2021), nos referimos a estos componentes como la “premisa” y la “promesa”, señalando que ambos son profundamente cuestionables, en tanto, e.g., la idea de la gran disponibilidad de datos del big data esconde que estos datos son propietarios y que presentan un acceso muy desigual (Andrejevic, 2014).
Por otro lado, entre las ideas más negativas destaca la del control, que vincula ambos fenómenos en un posible escenario distópico, donde nuestra información personal no está a disposición nuestra, sino que es utilizada en contra de nuestros intereses, limitando incluso nuestro rango de acción política (Helbgling et al., 2019). Esta mirada crítica del big data y los desarrollos con inteligencia artificial -especialmente, los algoritmos sociales- ha empezado a aparecer en la discusión pública a partir de casos como el Cambridge Analytica, y se ha reflejado en documentales y series de consumo masivo, como The social dilemma o The big hack. Sin embargo, este componente crítico en la RS del big data y la inteligencia artificial parece estar limitada a expresar el peligro, sin identificar actores sociales o intereses. Incluso, en los sentidos más concretos, donde se tematiza explícitamente a la tecnología, a la infraestructura material, o a la industria, no hay referencias a empresas o a servicios, buscando generar valor con big data e inteligencia artificial. Sólo hay una referencia al marketing y la publicidad en la periferia del big data, donde se asigna un valor negativo. Luego, en las áreas periféricas se observan sentidos subalternos que concretizan estas nociones generales, como indica la TRS, presumiblemente por remitir a las representaciones de grupos particulares. Son estos sentidos los que se equiparan a la infraestructura y las áreas de aplicación (e.g., comercial), y también a los problemas sociales más concretos (e.g., el avasallamiento sobre la privacidad y el desempleo por la automatización).
Los análisis de correlación de la RQ3. permiten confirmar algunas de estas inferencias en cuanto a la manera de vincular estos sentidos: se encuentran definiciones básicas, casi literales, que refieren a datos y robots y los ubican en la tecnología; se tienen áreas de aplicación y los problemas (sociales) que allí podrían desencadenar; existe un discurso crítico que alerta riesgos en torno al control, especialmente el social; y hay nociones tecnológicas y referencias a otros desarrollos, así como a los valores de futuro e innovación, que dan la pauta de que estos fenómenos son parte de un conjunto más amplio. Los análisis realizados en RQ4. apuntaron a buscar posicionamientos particulares, considerando las carreras de orígen de los participantes, y explorando si acaso estos distintos contexto disciplinares y profesionales ofrecen posicionamientos propios. El desbalance en la muestra no nos permite generalizar una tendencia, no obstante, pareciera que estos temas señalados no son exclusivos de ningún grupo, sino que más bien hay un sentido común genérico, abierto a distintos anclajes, que no necesariamente son antagónicos, y donde convive una narrativa positiva con una crítica.
En conclusión, una mirada crítica de los fenómenos del big data y la inteligencia artificial, que pusiera el foco en sus sentidos sociales, parece enfrentarnos a desarrollos sociales y tecnológicos con mecanismos abstractos que tienen una gran capacidad de transformación, aunque no se identifique un objetivo particular en su explotación, lo cual sugiere las marcas de un discurso meramente promocional (Elish y Boyd, 2018). Al respecto, Zuboff (2019) ha sugerido que esto es posible porque las transformaciones recientes en el capitalismo no apuntan a inculcarnos ningún ethos, sino a automatizar nuestros comportamientos por sobre cualquier nivel de consciencia o voluntad. La sensación de peligro o amenaza de control social es parte central de las RS del big data y de la inteligencia artificial, balanceando el discurso promocional, aunque se debe enfatizar que no se identifican agentes sociales detrás de estos mecanismos. Se podría conjeturar, siguiendo a Srnicek (2018), que esta falta de conciencia acerca del rol de las corporaciones de la economía de plataformas, que extraen y procesan big data, y que explotan algoritmos (sociales) de inteligencia artificial para potenciar el engagement de los usuarios, se debe a su particular manera de combinar ubicuidad e invisibilidad: se presentan como meros intermediarios entre tipos de usuarios cuando, por su rol y arquitectura, controlan la interacción entre ellos y los someten a prácticas monopólicas. Si nuestra interpretación es correcta, es tarea de las ciencias sociales y de los estudios críticos del big data y la inteligencia artificial, desentrañar los mecanismos que lograron esta configuración.
Los resultados aquí presentados reflejaron una primera exploración de la RS del big data y la inteligencia artificial que requiere de futuras investigaciones. Entre las limitaciones de nuestro estudio se debe señalar la naturaleza de la muestra con la que se ha trabajado y su composición desbalanceada entre las carreras. Un análisis más profundo de los posicionamientos diferenciales de los distintos grupos sociales necesitará un diseño que contemple estas limitaciones. Luego, otras limitaciones propias del enfoque estructural de las TRS y de la técnica de asociación de palabras o evocaciones, nos comprometen a complementar estas exploraciones con otros diseños metodológicos, cualitativos y de análisis de contenido.