La digitalización es un aspecto imparable de nuestras sociedades modernas. Cada vez más datos personales acaban en manos de grandes empresas tecnológicas que, en contraprestación, nos ofrecen cada vez nuevos y mejores servicios. Esto, no obstante, conlleva unos riesgos para la privacidad y una preocupación creciente de la ciudadanía, que ya ha visto saltar a los medios diversos escándalos por una gestión poco ética, o directamente ilegal, de esos datos. Leyes como la nueva GDPR europea responden a esa preocupación, y tratan de asegurar que la explotación de nuestros datos se realice con las máximas garantías, aunque todavía queda mucho por hacer.
Recientemente, saltaba la polémica ante la noticia de que diversos organismos públicos, como el INE o el Ministerio de Fomento, están llevando a cabo proyectos para estudiar la viabilidad de obtener un beneficio público de datos procedentes de operadoras de telefonía, ya sea subcontratando estudios o mediante la compra de datos anónimos. En este caso, se trataba de una alarma injustificada provocada por titulares de medios más preocupados por las visitas que por el interés de la ciudadanía. Efectivamente, como muestran muchos estudios científicos, existe un enorme potencial para que la explotación de estos y otros datos mejore la función pública al mismo tiempo que reduzca los costes. Pero además, estos recientes estudios se llevan a cabo con las máximas garantías para preservar nuestro derecho a la privacidad.
El caso del Censo
Un censo es un procedimiento sistemático para adquirir información de una población. Antiguamente, el objetivo era exclusivamente contar a la población. Hoy en día, el registro del Padrón tiene un recuento permanentemente actualizado, y el objetivo de los censos es el de conocer las características de esa población. Se trata de una herramienta de gran tradición (se remonta al siglo XVIII) que aporta una información estadística fundamental para fines no solo gubernamentales, de planificación económica y social, sino también para el tejido empresarial y económico de los países. Tanto es así que su realización es obligatoria por normativa comunitaria, y el ciudadano tiene la obligación por ley de aportar información veraz cuando es encuestado.
En España, el Instituto Nacional de Estadística (INE) es el organismo público encargado de los Censos de Población y Viviendas, que se realizan cada 10 años. La última edición, de 2011, incorporaba una novedad con respecto a la anterior, de 2001: se realizaron encuestas a una muestra representativa (el 10% de la población, unos 4 millones de personas), en lugar de enviar cuestionarios a todas las viviendas del país. Se partía de muy pocos datos por habitante empadronado (tan solo cuatro variables administrativas), y se ideó un procedimiento para inferir todos los demás datos (sociales, familiares, económicos) a partir de la encuesta a esta muestra. Como resultará evidente, se trata de un procedimiento muy complejo y muy costoso.
Los nuevos Censos 2021, en cambio, vendrán cargados de novedades dirigidas a mejorar estas estadísticas y la eficiencia con la que se compilan. El objetivo principal del INE desde 2014, cuando se finalizaron los trabajos de los Censos 2011, es el de aumentar las variables de partida (el INE estima que llegarán hasta el 90%) para disminuir el número de preguntas de la encuesta, haciéndole la vida más fácil al ciudadano, reduciendo el trabajo de procesar todos esos cuestionarios y aumentando la calidad de la información recopilada. Para ello, no solo se cuenta en la actualidad con muchos más registros administrativos (tributarios, seguridad social), aparte del Padrón, sino que se estudia la viabilidad de conseguir parte de esas variables mediante el análisis de datos en manos de compañías privadas.
En concreto, recientemente se ha materializado un acuerdo pionero en Europa entre el INE y tres de las mayores operadoras de telefonía en España. En próximas fechas, se realizará un estudio piloto en el que estas operadoras reportarán al INE recuentos de la presencia de teléfonos móviles para ciertas franjas horarias en una serie de “áreas INE” en las que han dividido el país. Estas áreas se han definido bajo el criterio de que contengan un mínimo de 5000 habitantes para ofrecer las máximas garantías en cuanto a anonimidad de los datos, y el INE ha desarrollado una metodología para su aprovechamiento con tres objetivos fundamentales: obtener 1) dónde vive la población, 2) adónde se mueve diariamente (principalmente por motivos de trabajo), y 3) con qué otras zonas está vinculada (por ejemplo, viaje al pueblo en Navidad). Los dos últimos objetivos están relacionadas con dos preguntas referentes a movilidad que ya estaban presentes en los dos últimos censos, mientras que el primero es una estimación complementaria de la población que servirá para cuantificar y corregir posibles sesgos.
El caso de la movilidad
Otro aspecto tanto o más importante para las políticas públicas que las características de la población es cómo nos movemos. Muchos investigadores estamos convencidos de que la cantidad masiva de datos que generamos con nuestra actividad diaria puede analizarse de forma ética para obtener grandes beneficios sociales en este aspecto. No en vano, la mayor parte del conocimiento que tenemos de nuestras ciudades se basa en estos censos que se realizan cada 10 años y contienen información estática. Investigaciones como el Atlas de la Desigualdad, del profesor Esteban Moro (Universidad Carlos III de Madrid, profesor visitante en el MIT Media Lab), tratan de ir un paso más allá y combinar la información censal con datos de geoposicionamiento para tener una visión más granular de los problemas de las ciudades modernas.
El Ministerio de Fomento también empieza a ser consciente del potencial de este tipo de datos en beneficio de todos, y en concreto para estudiar la movilidad de los ciudadanos y planificar las infraestructuras y sistemas de transportes. Al igual que con el censo, hasta ahora la fuente principal de información también eran encuestas. La última gran encuesta, Movilia 2006/2007, nos costó 5 millones de euros. Sin embargo, en 2018 se contrató un estudio con objetivos similares a partir de datos telefónicos, cuyo coste fue de tan solo 150 mil euros, aunque todavía no son públicos sus resultados.
Datos para el bien social
Toda esta información estadística es un bien público necesario para el buen funcionamiento de un país, para el diseño, evaluación y mejora de las políticas públicas. La empresa privada ya hace tiempo que se subió al carro de la digitalización, y hace cada vez un mayor uso de la ciencia de datos para optimizar sus procesos internos y tomar decisiones basadas en datos, para crecer y aumentar su competitividad en el mercado. Es el momento de que la administración pública tome el mismo camino y se modernice en beneficio de todos.
Como ciudadanos, no solo deberíamos alegrarnos de que por fin se tomen estas iniciativas, sino que deberíamos exigir activamente que nuestros datos se usen para el bien social; eso sí: siempre con las máximas garantías y transparencia, de forma ética y respetuosa con nuestro derecho a la privacidad. Es el momento de exigir políticas y una gestión basadas en datos.
Sobre el autor: Iñaki Úcar es doctor en telemática por la Universidad Carlos III de Madrid e investigador postdoctoral del UC3M-Santander Big Data Institute.
A más datos, mejor servicio público – Enchufa2
[…] leyendo A más datos, mejor servicio público, mi última colaboración en el Cuaderno de Cultura Científica, que complementa este otro, […]
A más datos, mejor servicio público – El Loco de la Colilla
[…] fuente / culturacientifica.comgobiert […]
– Futuro Imperfecto #1: ¿Trabajaremos?
[…] y eso nos ha hecho pasar por alto que el instituto ya tenía un plan para que sus censos de 2021 aprovechen los datos que depositamos en empresas privadas. ¿Lo hacen por el bien social o en aras de una vigilancia masiva? No son los únicos, parece que […]
Los retos de geolocalizar a la población española — Cuaderno de Cultura Científica
[…] En el ámbito de la movilidad, el proyecto que se pretende impulsar es semejante al proyecto piloto que lanzó el INE para complementar el censo. […]