cuento
Simplificando un poco se puede decir que cuanto más se parece el genoma de dos individuos, más próximamente emparentados están. Esto vale para entes tales como virus, especies de mamíferos o, también, individuos de una misma especie. Así, dos gemelos (procedentes de un único óvulo) no tendrían diferencias en su genoma nuclear (no así en el mitocondrial, aunque ese es otro tema que no trataremos aquí), pero un koi-san y un servidor tendremos genomas con un buen número de diferencias. Y una lógica similar a la de la secuencia de nucleótidos del genoma cabe aplicar con la de los aminoácidos de sus proteínas.
Gracias a las técnicas de genética molecular y mediante la aplicación de sofisticados análisis matemáticos, es posible trazar la trayectoria que han seguido los linajes de organismos en el pasado. También se pueden agrupar en conjuntos de especies, géneros, familias, etc., en virtud de su proximidad (filo)genética. En general, cuanto más se parecen entre sí las secuencias de nucleótidos del genoma o las de aminoácidos de las proteínas de los miembros de un clado (ya se trate de los individuos o poblaciones de una especie, de las especies de un género, de los géneros de una familia, o de cualesquiera otros niveles taxonómicos), menos tiempo ha transcurrido desde que se separó de otros de los que difiere. Al fin y al cabo, el grado de parentesco refleja, precisamente, ese tiempo.
Pues bien, una lógica similar se puede utilizar cuando, en vez de organismos, se desea analizar la historia de un elemento cultural, como un cuento, por ejemplo, si se dispone de rasgos cuya presencia o ausencia se puede establecer en sus diferentes versiones actuales. Por ello, se pueden utilizar métodos matemáticos similares a los que se usan para trazar la historia de organismos biológicos, solo que en este caso no es el genoma lo que difiere o se asemeja entre dos versiones de una misma historia, sino esos elementos a que acabo de hacer mención. En efecto, del mismo modo que se analiza la secuencia de aminoácidos de determinadas proteínas de diferentes variantes del SARS-Cov2 o la de las hemoglobinas de diferentes especies de mamíferos, por ejemplo, se puede analizar los elementos que contienen las diferentes variantes o versiones de un mismo cuento.
Eso es, precisamente, lo que hicieron con el cuento The Spinning-Woman by the Spring (o The Kind and the Unkind Girls), cuyas variantes se hallan por toda Europa y parte de Asia. En la colección de los hermanos Grimm aparecen tres variantes, a saber: Los tres enanitos del bosque, San José en el bosque y Madre Nieve (Frau Holle). De acuerdo con el índice de tipos de la clasificación Aarne-Thompson-Uther, se trata de un cuento del tipo 480, con centenares de variantes en Europa.
Analizaron 700 variantes, correspondientes a 31 grupos etnolingüísticos: alemán (61 variantes), armenio (3), búlgaro (8), checo (11), danés (48), escocés (3), esloveno (6), español (11), estonio (16), finlandés (83), flamenco (6), francés (16), griego (11), inglés (8), irlandés (22), islandés (11), italiano (33), letón (13), noruego (48), polaco (45), portugués (2), rumano (4), ruso (32), sueco (101), sueco en Finlandia (25), suizo alemán (3), turco (32) ugrofinés en Rusia (23), valón (3), vasco (2) y yugoslavo (13). Los autores han identificado 393 rasgos binarios, o sea, 393 elementos que pueden estar incluidos en el cuento o no estarlo. Y a continuación, trabajando con pares de variantes, han estimado la distancia que hay entre cada una de las dos. La distancia se determina a partir del índice de Jaccard, que es un índice de similitud (o, si se quiere, de lo contrario) que se calcula dividiendo los elementos que comparten las dos variantes (la intersección) entre los elementos totales que tienen esas variantes.
Además de la similitud entre pares de variantes, calcularon las distancias geográficas entre sus localidades de procedencia o, en ausencia de ese dato, entre los centroides de las áreas en que se distribuyen las dos variantes. También elaboraron una matriz de disimilitud lingüística entre las diferentes lenguas, para lo que utilizaron las distancias entre pares de lenguas tal y como se pueden determinar a partir de análisis filogenéticos publicados previamente. En el caso de las pertenecientes a una misma familia, ese procedimiento no conlleva especial complicación, pero para estimar la disimilitud cuando se trata de lenguas pertenecientes a diferentes grupos (túrquicas, ugrofinesas y vasco), procedieron asignando, de modo arbitrario, una distancia entre familias equivalente a 1’25 veces la existente entre las dos lenguas menos similares de las indoeuropeas. Y por último, elaboraron una matriz de identidad etnolingüística para las variantes individuales del cuento. Cuando dos variantes pertenecen a una misma comunidad lingüística, la distancia entre ellas en esa matriz sería 0, y 1 si las dos variantes pertenecen a dos comunidades diferentes.
El análisis posterior incluyó dos procedimientos. Por un lado, utilizaron análisis de correlaciones entre las distintas distancias (entre cuentos, geográficas, lingüísticas, y grupos etnolingüísticos); y por el otro, aplicaron análisis de la varianza molecular (AMOVA), que permitió estimar qué proporción de la variación observada corresponde a las diferencias entre poblaciones (comunidades etnolingüísticas, en este caso) y qué proporción corresponde a las diferencias dentro de las poblaciones. Y a continuación construyeron una NeighbourNet (red de vecinos) que permite visualizar los agrupamientos de las distintas comunidades etnolingüísticas, basados en las variantes del cuento, así como las distancias entre ellas.
Entre los factores analizados, la distancia geográfica entre las poblaciones es la que explica una mayor fracción de la variación entre las distintas modalidades del cuento. De hecho, si se tiene en cuenta que una parte sustancial de las diferencias entre las lenguas está muy relacionada con la geografía, cuando el análisis se hace descontando el efecto de la distancia geográfica, resulta que la lengua no explica una fracción significativa de la variación de las variantes.
No ocurre lo mismo con la identidad etnolingüística, ya que este factor sí explica una fracción significativa de la variación en las modalidades del cuento, incluso cuando se tiene en cuenta el efecto de la distancia geográfica. El efecto de este factor es tan importante que el efecto de la barrera cultural que erige la frontera etnolingüística es equivalente a multiplicar la distancia geográfica entre variantes del cuento por un factor de 10. Esto quiere decir que dos cuentos de la misma cultura separados 100 Km son, en promedio, tan parecidos entre sí como lo son dos cuentos de diferentes culturas pero separados entre sí 10 Km.
La NeighbourNet obtenida para el conjunto de poblaciones estudiadas refleja cinco grandes agrupaciones. La primera incluye poblaciones del occidente europeo que hablan lenguas romances (excluyendo Rumanía), y otras como la población vasca, la flamenca y la suiza de lengua alemana. La segunda agrupación incluye las poblaciones del oriente europeo con lenguas eslavas, además de otras comunidades lingüísticas, como la rumana y la de hablantes de lenguas ugrofinesas de Rusia. La tercera incluye poblaciones a caballo entre Europa y Asia (armenios, griegos y turcos). La cuarta agrupación contiene las poblaciones de los países nórdicos, salvo Dinamarca. Y en la quinta se incluyen alemanes, daneses, letones y británicos.
La imagen general que se obtiene es que las variantes del cuento se agrupan a lo largo del continente europeo de acuerdo con áreas geográficas muy bien definidas, con la única salvedad de la quinta agrupación, que quizás refleje la influencia que tuvo la expansión vikinga que comenzó en el siglo IX en las Islas Británicas, así como la de redes comerciales, como la Liga Hanseática, que comunicaron los países ribereños del Báltico con las Islas Británicas a partir del siglo XIII.
El geográfico es, con diferencia, el factor de diferenciación más importante en términos absolutos. No obstante, al de la geografía se añade también el efecto del grupo etnolingüístico, que es importante; como se ha señalado más arriba, 10 Km de distancia entre dos variantes de diferente grupo etnolingüístico equivalen a 100 Km entre dos variantes del mismo grupo, lo que quiere decir que la identidad etnolingüística constituye una importante barrera a la transmisión de elementos culturales como son los cuentos. El linaje cultural (representado por la lengua de la población), sin embargo, no ejerce un efecto muy marcado sobre la diversidad de variantes del cuento.
Esta es de las pocas investigaciones en que se ha estudiado un proceso de evolución o diferenciación cultural mediante técnicas propias de la genética de poblaciones. En este trabajo no se han analizado los marcadores genéticos de las poblaciones humanas a las que corresponden las variantes del cuento, pero de haberse hecho, sospecho que muy probablemente se habría observado un importante paralelismo entre distancias genéticas y distancias culturales, en un sentido similar al observado en este estudio sobre canciones populares realizado en Taiwán.
Fuente: Ross RM, Greenhill SJ, Atkinson QD (2013): Population structure and cultural geography of a folktale in Europe. Proc R Soc B 280: 20123065
Para saber más: Cuentos de otro tiempo, y de este
Sobre el autor: Juan Ignacio Pérez (@Uhandrea) es catedrático de Fisiología y coordinador de la Cátedra de Cultura Científica de la UPV/EHU
Más que la genética, es la cultura la que configura los grupos humanos — Cuaderno de Cultura Científica
[…] por el planeta, no sólo se diferenciaron nuestros genomas, también se diversificaron las lenguas y otros rasgos culturales. De hecho, es posible, y no demasiado difícil, establecer correspondencias entre grupos genéticos […]