25 de septiembre de 2011

Twitter no nos representa


Los medios sociales son ya un espacio más en el cual se construye la opinión pública. Es aún difícil precisar el peso que tienen en este proceso y si representan un solo gran segmento de la esfera pública o si, por el contrario, representan la manera en que diversas y separadas esferas públicas tienden a conectarse y –desde esa conexión- facilitar que quienes en ellos participen activamente contribuyan al moldeamiento de la opinión pública.

Por sobre las interrogantes, asumiendo que la influencia de los medios sociales sobre la agenda pública va en aumento, urge reflexionar sobre su representatividad, en tanto uno de los lugares comunes que existe sobre ellos (e Internet en general) es su potencial para democratizar los debates sobre temas de interés público. 

Los medios sociales –solemos afirmar- permiten que más personas participen en los debates, que un análisis más plural de los temas aflore y que nuevos temas sean visibilizados. Normalmente, este hilo de argumentación no toma en consideración o no lo hace en profundidad, el hecho que las plataformas sobre las cuales ocurren estas discusiones de interés público, son privadas, y que por lo tanto es necesario que las sociedades se doten a sí mismas de normas y regulaciones que garanticen que los fines públicos que a través de ellas se busque alcanzar, no sean intervenidos de manera opaca por intereses privados (los de las compañías dueñas de las plataformas o las de terceros actores interesados en influir que la opinión se oriente en determinada dirección).

En el caso de Twitter, los Temas del Momento (Trending Topic) son la manera en que preferentemente se visualizan las discusiones entre sus usuarios que influyen en la opinión pública. Que Twitter Inc. haya decidido desde hace un tiempo avanzar hacia la segmentación de los Temas del Momento, personalizándolos por países y ciudades, grafica una estrategia corporativa destinada a relevar una de sus más importantes funcionalidades como servicio, precisamente la que tiene mayor influencia en el comportamiento de la mayor parte de sus usuarios.

Cada vez es más frecuente leer o ver notas en los medios de comunicación de masas cuyo punto de partida es una etiqueta que logró escalar entre las más usadas en Twitter, asumiendo la prensa en forma explícita que si llegó a ese punto fue porque era representativa de lo que estaba ocurriendo en el mundo o en el país y que por lo tanto era necesario relevarla aún más a través de una decisión editorial.

Al mismo tiempo, como ocurrió en el caso de Wikileaks, también son cada día más normales las acusaciones sobre intervenciones artificiales de los Temas del Momento, acusaciones que siempre encuentran por respuesta que cierta parte del algoritmo de Twitter destaca o esconde por alguna justificada razón la etiqueta (¡cómo si la sola mención de la existencia del algoritmo santificara una matemática y objetiva expresión de la realidad!).

La base de los Temas del Momento son los propios tweets que los usuarios generan. Sobre la dificultad de realizar a partir de ellos afirmaciones con altos grado de representatividad, hace poco danah boyd y Kate Crawford realizaron un interesante resumen en un paper centrado en el análisis de grandes conjuntos de información (Big Data) y cuya lectura recomiendo. Cito (la traducción es mía):
Primero, Twitter no representa a  “toda la gente”, aunque muchos periodistas e investigadores se refieran a “gente” y “usuarios de Twitter” como sinónimos. Ni tampoco es la población usando Twitter representativa de la población mundial. Tampoco podemos asumir que cuentas y usuarios sean equivalentes.  Algunas personas nunca crean una cuenta y acceden a Twitter solo vía Web. Algunas cuentas son “bots” que producen contenido en forma automática sin la participación de una persona. Más aún, la misma noción de cuenta activa es problemática. Mientras algunos usuarios publican contenido frecuentemente en Twitter, otros participan solo “escuchando”. Twitter Inc.  ha revelado que el 40% de los usuarios activos solo se conectan para escuchar. Los significados de “usuario”, “participación” y “activo” deben ser examinados críticamente.
Debido a las incertidumbres sobre lo que representa una cuenta y a qué se parece el compromiso, hacer muestreos de las cuentas de Twitter y hacer afirmaciones sobre la gente y los usuarios es pararse en terrenos inestables. Twitter Inc. puede hacer afirmaciones sobre todas las cuentas y todos los tweets o sobre una muestra al azar en tanto tiene acceso a la base de datos central. Incluso así, no le resulta fácil tomar en cuenta a mirones, personas que tienen múltiples cuentas o grupos de personas que acceden con una sola cuenta. Adicionalmente, la base de datos central es propensa a cortes, y tweets se pierden o borran con frecuencia.
Twitter Inc. hace accesible al público solo una fracción de su material a través de APIs. Esa “manguera contra incendios” (N.T.: “firehose” en el original) teóricamente contiene todos los tweets públicos publicados y explícitamente excluye cualquier tweet que el usuario haya decidido publicar en forma privada o “protegida”. Sin embargo, tweets públicos también se pierden en la “manguera”. Aunque un grupo importante de compañías y start-ups tienen acceso a la “manguera”, muy pocos investigadores tienen este nivel de acceso. La mayor parte tiene acceso a una “manguera de jardín” (N.T.: “gardenhose” en el original) (aproximadamente el 10% de los tweets públicos), un “spritzer” o vaso alto (aproximadamente el 1% de los tweets públicos) o han usado cuentas de usuarios “blanqueadas” que les dan acceso a APIs para obtener diferentes grupos de contenidos del flujo público. No está claro que tweets son incluidos en estos flujos o muestreos distintos de datos. Podría ser que la API obtenga una muestra al azar de tweets, o que obtenga los primeros miles de tweets por hora, o que solo obtenga tweets de un segmento particular de la red. Dada esta incertidumbre, es difícil para los investigadores realizar afirmaciones sobre la calidad de los datos que están analizando. ¿Son los datos representativos de todos los datos? No, porque excluye los tweets de las cuentas protegidas. ¿Son los datos representativos de todos los tweets públicos? Quizás, pero no necesariamente.
El jueves 22 de septiembre, con ocasión de la última marcha por la educación realizada en Chile, la etiqueta #yomarchoel22 no logró escalar a los Temas del Momento en Chile, pese a que algunas aplicaciones de terceros usando la información de Twitter, sí indicaron en sus propios rankings el masivo uso de la etiqueta. Irremediablemente, las sospechas de alteración manual del algoritmo surgieron. No faltaron quienes, aprovechando su ausencia de los Temas del Momento,  buscaron disminuir la relevancia de la marcha. Quizá, a la luz de las palabras de boyd y Crawford, lo más sensato sea pensar que los Temas del Momento siempre tendrán una muy restringida representatividad. O que su valor para medir el estado de la opinión pública sea el mismo que leer los editoriales de un medio de comunicación tradicional. Vale decir, una interpretación legítima pero sesgada de la realidad.

Mi apuesta: más allá de las restricciones impuestas por las reglas propias de cada medio social y que limitan su potencial democratizador, reconocer que la ciudadanía está desarrollando prácticas de uso y expectativas sociales sobre ellos que merecen repensar cómo fines públicos se logran/dependen de plataformas privados. 

2 comentarios:

Cristian Cabezas dijo...

Hola Enzo, gracias por comentar esta lectura, que tiene mucha substancia. Voy a leer el paper para comentar mejor. Una observación: danah boyd se escribe con minúsculas (es raro pero cierto)

Cristian

Enzo Abbagliati Boïls dijo...

Gracias, Cristián. Ya lo corregí en las dos menciones que hago del nombre y apellido. Y sí, me había dado cuenta del tema de las minúsculas, pero pensaba que era cierto tipo de gesto geek.