La Biblioteca del Congreso de los Estados Unidos, una de las más importantes del mundo, se propuso en 2010 incorporar a sus fondos documentales todos los tuits publicados y por publicar. Como seguramente sabrán quienes lean estas líneas, los tuits son mensajes breves (no más de 140 caracteres) que los usuarios de la red social de internet Twitter publican para que sean leídos por sus seguidores y, si así les parece, redifundidos a su vez por éstos. Los mensajes pueden incluir enlaces a sitios de internet, vídeos o imágenes fotográficas.
Twitter es por ello una fenomenal herramienta de comunicación y un vehículo cultural de primera magnitud. Por eso no es extraño que una de las grandes bibliotecas del mundo se haya propuesto hacerse con ese patrimonio. Pensemos en los historiadores del futuro. Para ellos será muy útil, por ejemplo, poder acceder a los mensajes que se publicaron con la etiqueta de los movimientos sociales que ha habido desde el nacimiento de la red social, el 21 de marzo de 2006. La llamada “Primavera árabe”, la expansión del Califato Islámico, el movimiento Occupy Wall Street, el 15M, etc. También les interesará seguir el rastro que dejaron quienes lleguen a ser presidentes, jefes de gobierno, papas, premios Nobel, etc., mediante los tuits que publicaron cuando aún eran unos perfectos desconocidos. Incluso pueden resultar de interés mensajes que en el momento de su publicación resultaron anodinos; podrían contener información –sobre alimentos, condiciones meteorológicas, clima laboral, etc.- útil para contextualizar determinados acontecimientos o circunstancias biográficas. Como puede verse, son múltiples las perspectivas bajo las que la información contenida en esos trinos (en inglés tweets) puede acabar teniendo un uso interesante en el futuro.
La dificultad, a nadie se le escapa, es la enormidad de la tarea. El volumen de información a manejar no es sólo un problema cuantitativo, sino que por sus dimensiones, se convierte en un problema de complejidad extrema. Las cifras marean: antes de 2010, año en que se tomó la decisión de archivar en la Biblioteca los tuits, ya se habían publicado 21000 millones de mensajes. Hoy se publican del orden de 500 millones de tuits diarios y, aunque las cifras no son del todo fiables, hay del orden de 300 millones de usuarios activos. Las complicaciones no lo serían tanto si los trinos consistiesen simplemente en textos de menos de 141 caracteres. El problema es que, además, cada tuit contiene información relativa a la fecha en que se envió, a veces también al lugar desde el que se envió, a los usuarios que redifundieron el mensaje, los que lo respondieron, los que lo marcaron como favorito, y otros. En total hay del orden de un centenar de datos –metadatos en la jerga- asociados a cada tuit.
El trabajo está en marcha. Lo desarrolla una empresa –Gnip- que fue en su día adquirida por Twitter, y que descarga los tuits por intervalos de una hora para almacenarlos -dos copias en ubicaciones diferentes por motivos de seguridad- y extraer una primera información estadística básica. De momento, la principal dificultad que han encontrado es que una búsqueda en el periodo anterior a 2010 requiere 24 horas, lo que hace la base documental impracticable.
Pero todo este proyecto tiene otro problema del que sus responsables no han dicho ni pío: ¿qué ocurrirá si alguien no desea que sus tuits sean conocidos? ¿se dará a los usuarios la oportunidad de borrar tuits? Y es que, como en otros ámbitos, también en las redes sociales uno es dueño de sus silencios y esclavo de sus palabras. ¿Seremos por siempre esclavos de nuestros trinos?
Sobre el autor: Juan Ignacio Pérez (@Uhandrea) es catedrático de Fisiología y coordinador de la Cátedra de Cultura Científica de la UPV/EHU
——————————–
Este artículo fue publicado el 2/8/15 en la sección con_ciencia del diario Deia
Trinos para siempre | Mi Cajón de Ideas …
[…] La Biblioteca del Congreso de los Estados Unidos, una de las más importantes del mundo, se propuso en 2010 incorporar a sus fondos documentales todos los tuits publicados y por publicar. Como seguramente sabrán quienes lean estas líneas… […]