La extraña capacidad de sincronizarnos

Fronteras

Existe en nuestro universo un planeta lleno de simetrías. El planeta da vueltas alrededor de su eje y lo hace siempre al mismo ritmo: siempre en base a periodos regulares de tiempo. Tiene su propio satélite, además, que en su órbita obstinada repite siempre los mismos movimientos, siempre en periodos regulares de tiempo. No lejos de ellos, brilla una estrella. Planeta y satélite dan vueltas a su alrededor y… ya sabéis cómo continúa esta historia: periodos regulares de tiempo.

Concierto de Año Nuevo
Concierto de Año Nuevo. Fuente: Wiener Philarmoniker

Esto, me diréis, no parece demasiado especial. Al fin y al cabo, habitamos un universo que en tiempos de Newton se comparó con el mecanismo de un reloj. Lo singular es que este planeta está habitado. Y una vez al año, siempre que pasa por un punto determinado de su órbita, las criaturas que lo habitan realizan un ritual de lo más extraño. De repente, cientos de ellas empiezan a golpear las palmas de sus manos entre sí, todos a la vez y lo hacen… sí, en base a periodos regulares de tiempo. Es la gran celebración de la conservación del momento angular y del movimiento periódico, también conocida como Concierto de Año Nuevo.

Aunque dar palmadas al ritmo de la música pueda parecer algo trivial, se trata de una tarea enormemente compleja. Para ejecutarla, no basta con escuchar la música y reaccionar a ella. Si queremos dar las palmadas a tempo, debemos detectar los patrones subyacentes en la música y adivinar cuándo viene la siguiente pulsación. Debemos anticiparnos constantemente a lo que suena.

Desde un punto de vista computacional, por ejemplo, este problema no resulta nada sencillo. Cada año, investigadores de todo el mundo se enfrentan a este reto con nuevos y mejorados algoritmos, con el objetivo de automatizar una tarea que, como humanos, nos resulta casi trivial: dada una pieza musical, ¿dónde se sitúa el pulso?, ¿cómo sabemos cuándo “dar la palmada»? No es de extrañar que los orígenes de la investigación en este ámbito hundan sus raíces en la psicología de la música: para detectar el tempo de una grabación debemos comprender, en paralelo, cómo los humanos percibimos eso que llamamos pulso.

El problema se complica especialmente en el caso de la música clásica. Por un lado, la ausencia de una base clara de percusión (como la batería, omnipresente en otros estilos musicales), hace que sea más difícil detectar picos de energía claramente diferenciados en la señal acústica y que ayuden a marcar el ritmo. Por otro lado, es común que en este tipo de música aparezcan patrones más complejos, como cambios de compás o polirritmos que, incluso para personas con cierta formación musical, pueden resultar difíciles de desentrañar. Todo ello se agrava por el hecho de el tempo que sigue un intérprete casi nunca es constante a lo largo de una misma pieza: lo más común es que varíe de manera expresiva mediante accelerandos y ritardandos; pequeñas flexiones de esos “periodos regulares”, que nosotros identificamos sin ningún problema pero que pueden confundir a las máquinas mejor entrenadas.

A día de hoy, existen multitud de algoritmos que intentan abordar este problema con mayor o menor éxito dependiendo del estilo musical. Los que se centran en el análisis de grabaciones reales (hay otros que analizan audios midi, por ejemplo) deben enfrentarse a dos problemas diferenciados. Por un lado, la detección de los ataques musicales (las notas que tocan los instrumentos, vaya) cuyas duraciones definen el ritmo de una pieza. Por otro, la detección de patrones y relaciones jerárquicas existentes en el ritmo que permiten establecer cuál es el pulso regular subyacente. La cuestión es que para interpretar esos patrones y esas relaciones, los humanos contamos con todo un bagaje cultural que nos permite relacionar esa música con el estilo al que pertenece, su carácter, su estructura… sin esas claves, es fácil que los algoritmos detecten patrones que no son estructurales o que no puedan distinguir entre el pulso de una pieza y sus posibles múltiplos o submúltiplos. Dicho de otra manera: cuando nosotros damos palmas al ritmo de la Macarena, casi siempre lo hacemos con un pulso determinado, pero también podríamos hacerlo al doble de velocidad. Es nuestro contexto cultural (incluso nuestro conocimiento de la coreografía de la canción), lo que nos ayuda a lidiar con esa ambigüedad. El ordenador lo tiene mucho más difícil.

Resulta sorprendente que una tarea tan cotidiana, tan intuitiva y fácil para nosotros, siga eludiendo a la inteligencia artificial. El hecho es que, hasta la fecha, ningún robot ha sido capaz de batirnos en el viejo arte de dar palmadas al ritmo de la música. Quizás, si algún día viene Skynet y las máquinas a conquistarnos, podríamos retarles a bailar un tango, o, peor aún, invitarles al Concierto de Año Nuevo. Seguro que les estallaría la cabeza.

Referencias:

Graham Percival and George Tzanetakis (2014). Streamlined Tempo Estimation Based on Autocorrelation and Cross-correlation with Pulses. IEEE/ACM Trans. Audio, Speech and Lang. Proc., 22(12):1765-1776.

Frederic Font and Xavier Serra (2016). Tempo Estimation for Music Loops and a Simple Confidence Measure. In 17th International Society for Music Information Retrieval Conference (ISMIR 2016), New York, 07/08/2016.

Simon Dixon (2001). Automatic Extraction of Tempo and Beat From Expressive Performances, Journal of New Music Research, 30:1, 39-58.

Almudena Martín Castro (2017). El metrónomo de Beethoven. Modelado físico de un misterio histórico. Trabajo Fin de Grado, Universidad Nacional de Educación a Distancia.

Sobre la autora: Almudena M. Castro es pianista, licenciada en bellas artes, graduada en física y divulgadora científica

3 comentarios

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *