Las redes neuronales necesitan datos para aprender. Aunque sean falsos

Quanta Magazine

Los datos reales pueden ser difíciles de obtener, por lo que los investigadores están recurriendo a datos sintéticos para entrenar sus sistemas de inteligencia artificial.

Un artículo de Amos Zeeberg. Historia original reimpresa con permiso de Quanta Magazine, una publicación editorialmente independiente respaldada por la Fundación Simons.

datos
Ilustración: Kristina Armitage / Quanta Magazine

En un día soleado a fines de 1987, una camioneta Chevrolet circuló por un camino boscoso lleno de curvas en el campus de la Universidad Carnegie Mellon en Pittsburgh. El enorme vehículo, llamado Navlab, no destacaba por su belleza o velocidad, sino por su cerebro: era una versión experimental de un vehículo autónomo, guiado por cuatro poderosos ordenadores (para su época) en el área de carga.

Al principio, los ingenieros trás Navlab intentaron controlar el vehículo con un algoritmo de navegación, pero al igual que muchos investigadores anteriores, les resultó difícil dar cuenta de la amplia gama de condiciones de conducción con un solo conjunto de instrucciones. Así que lo intentaron de nuevo, esta vez utilizando un enfoque de inteligencia artificial llamado aprendizaje automático: la camioneta aprendería a conducir por sí misma. Un estudiante de posgrado llamado Dean Pomerleau construyó una red neuronal artificial, hecha de pequeñas unidades de procesamiento lógico destinadas a funcionar como células cerebrales, y se dispuso a entrenarla con fotografías de carreteras en diferentes condiciones. Pero tomar suficientes fotografías para cubrir la amplia gama de posibles situaciones de conducción fue demasiado difícil para el pequeño equipo, por lo que Pomerleau generó 1.200 imágenes sintéticas de carreteras en un ordenador y las usó para entrenar al sistema. La máquina autodidacta conducía tan bien como cualquier otra cosa que se les ocurrió a los investigadores.

Navlab no llevó directamente a ningún avance importante en la conducción autónoma, pero el proyecto mostró el poder de los datos sintéticos para entrenar los sistemas de IA. A medida que el aprendizaje automático mejoró en las décadas siguientes, desarrolló un apetito insaciable por los datos de entrenamiento. Pero los datos son difíciles de obtener: pueden ser costosos, privados o escasos. Como resultado, los investigadores recurren cada vez más a los datos sintéticos para complementar o incluso reemplazar los datos naturales para entrenar redes neuronales. “El aprendizaje automático ha estado luchando durante mucho tiempo con el problema de los datos”, afirma Sergey Nikolenko, director de IA en Synthesis AI, una empresa que genera datos sintéticos para ayudar a sus clientes a crear mejores modelos de IA. “Los datos sintéticos son una de las formas más prometedoras de resolver este problema”.

Afortunadamente, a medida que el aprendizaje automático se ha vuelto más sofisticado, también lo han hecho las herramientas para generar datos sintéticos útiles.

Un área en la que los datos sintéticos están demostrando ser útiles es para abordar las preocupaciones sobre el reconocimiento facial. Muchos sistemas de reconocimiento facial están entrenados con enormes bibliotecas de imágenes de rostros reales, lo que plantea problemas sobre la privacidad de las personas en las imágenes. El sesgo también es un problema, ya que varias poblaciones están sobrerrepresentadas o subrepresentadas en esas bibliotecas. Los investigadores del Mixed Reality & AI Lab de Microsoft han abordado estas preocupaciones y han lanzado una colección de 100 000 caras sintéticas para entrenar sistemas de IA. Estos rostros se generan a partir de un conjunto de 500 personas que dieron permiso para escanear sus rostros.

El sistema de Microsoft toma elementos de rostros del conjunto inicial para crear combinaciones nuevas y únicas, luego agrega un estilo visual con detalles como maquillaje y cabello. Los investigadores dicen que su conjunto de datos abarca una amplia gama de etnias, edades y estilos. “Siempre hay una larga cola de diversidad humana. Creemos y esperamos capturar mucho de eso”, explica Tadas Baltrušaitis, un investigador de Microsoft que trabaja en el proyecto.

Otra ventaja de las caras sintéticas es que el ordenador puede etiquetar cada parte de cada cara, lo que ayuda a que la red neuronal aprenda más rápido. En cambio, las fotos reales deben etiquetarse a mano, lo que lleva mucho más tiempo y nunca es tan consistente o preciso.

Los resultados no son fotorrealistas, las caras se parecen un poco a los personajes de una película de Pixar, pero Microsoft los ha usado para entrenar redes de reconocimiento facial cuya precisión se acerca a la de las redes entrenadas en millones de caras reales.

datos
Un equipo de Microsoft creó estos rostros, y muchos miles más, utilizando un conjunto de datos reales. Los rostros sintéticos pueden parecer caricaturescos, pero pueden ayudar a entrenar las redes neuronales con la misma precisión que las fotos reales, con menos preocupaciones sobre la privacidad y la diversidad. Fuente: Microsoft

La capacidad de los ordenadores para generar datos sintéticos útiles también ha mejorado recientemente, debido en parte a mejores GPU, un tipo de chip diseñado para el procesamiento gráfico que puede producir imágenes más realistas. Erroll Wood, un investigador actualmente en Google que también ayudó a crear las caras sintéticas, se basó en las GPU para un proyecto de seguimiento ocular. El seguimiento ocular es una tarea difícil para los ordenadores, ya que implica seguir los movimientos mínimos de ojos de aspecto diferente bajo condiciones de iluminación variadas, incluso en ángulos extremos con el globo ocular apenas visible. Normalmente se necesitarían miles de fotos de ojos humanos para que una máquina aprendiese a dónde está mirando una persona, y esas fotos son difíciles de obtener y prohibitivamente caras.

El equipo de Wood demostró que un ordenador basado en una GPU y ejecutando Unity, un paquete de software para producir videojuegos, podía generar las imágenes necesarias, incluidos reflejos detallados de imágenes digitales cubriendo un ojo humano curvo y húmedo. El sistema GPU tardó solo 23 milisegundos en generar cada foto. (De hecho, cada imagen en realidad tardó solo 3,6 milisegundos en producirse; el resto del tiempo se dedicó a almacenar la imagen). Los investigadores produjeron 1 millón de imágenes oculares y las usaron para entrenar una red neuronal, que funcionó tan bien como la misma red entrenada con fotos reales de ojos humanos, por una fracción del precio y en mucho menos tiempo. Al igual que con las caras sintéticas de Microsoft, la red de seguimiento ocular se benefició de la capacidad del ordenador para aplicar etiquetas perfectas a píxeles de las imágenes de entrenamiento.

Los investigadores también están utilizando los últimos sistemas de IA para crear los datos necesarios para entrenar a los sistemas de IA. En medicina, por ejemplo, un objetivo durante mucho tiempo ha sido crear una red neuronal que pueda interpretar imágenes radiológicas tan bien como los radiólogos humanos. Pero es difícil obtener los datos necesarios para entrenar estos sistemas, ya que las radiografías y las tomografías computarizadas de pacientes reales son información privada de salud. Es muy trabajoso obtener acceso a los miles o millones de imágenes necesarias para entrenar un modelo verdaderamente preciso.

A principios de este año, Hazrat Ali, científico informático de la Universidad COMSATS de Pakistán, describió sus primeros experimentos con DALL·E 2, un popular modelo de difusión, para crear imágenes realistas de rayos X y tomografía computarizada de los pulmones, incluidas representaciones de afecciones pulmonares específicas. Estas imágenes se pueden usar para entrenar una red neuronal para detectar tumores y otras anomalías. Dentro de un año espera que los modelos de difusión establezcan un nuevo punto de referencia para las herramientas de radiología de IA. “Una vez que podamos sintetizar resonancias magnéticas, tomografías computarizadas y tal vez ultrasonidos más realistas, esto acelerará la investigación y, en última instancia, la transferencia clínica, sin generar preocupaciones sobre la privacidad de los pacientes y el intercambio de datos”.

Mientras Navlab avanzaba tímidamente por el campus de CMU, los espectadores probablemente no pensaran que estaban viendo el nacimiento de una tecnología importante. Pero ese lento viaje ayudó a presentar al mundo los datos sintéticos, que han asumido un papel clave en el desarrollo de la inteligencia artificial. Y ese papel puede volverse verdaderamente esencial en el futuro. “Los datos sintéticos han llegado para quedarse”, afirma Marina Ivasic-Kos, investigadora de aprendizaje automático de la Universidad de Rijeka en Croacia. “El final del juego es reemplazar completamente los datos reales con datos sintéticos”.


El artículo original, Neural Networks Need Data to Learn. Even If It’s Fake., se publicó el 16 de junio de 2023 en Quanta Magazine.

Traducido por César Tomé López

2 comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada.Los campos obligatorios están marcados con *