¿Se puede predecir el éxito futuro de un científico?

#con_ciencia

Autor de la ilustración: David Parkins
Autor de la ilustración: David Parkins

Al parecer, Niels Bohr dijo que “hacer predicciones es muy difícil, especialmente cuando se trata del futuro”. Pero hay quien se ha atrevido a hacerlas y no parecen haberle salido tan mal. Hace unos meses la revista Nature publicó un comentario (“comment”) en el que se presentaba una fórmula que permitía predecir con un cierto grado de precisión cuál sería el éxito científico que alcanzaría un investigador en activo años después.

¿Qué interés tiene tal cosa? se preguntarán muchos lectores. Según los investigadores, su utilidad sería muy clara. A los responsables de centros de investigación e, incluso, a las agencias que financian la investigación puede interesarles tener una idea, siquiera sea aproximada, de cuál será la evolución previsible de científicos a los que podrían, respectivamente, contratar o financiar. A mí no me ha interesado por esas razones. Me ha parecido un artículo interesante porque ayuda a conocer mejor cómo funciona uno de los aspectos más importantes de la actividad científica tal y como se desarrolla en la práctica, el de la publicación de los resultados de la investigación.

Como medida del nivel de éxito científico, los autores del trabajo utilizan el índice “h (la inicial del apellido de quien lo propuso, Jorge Hirsch) del investigador cuyos logros futuros se desea predecir. Un valor j de ese índice indica que j artículos publicados por el autor en cuestión han sido citados, al menos, j veces. El índice h combina los dos aspectos que se suelen valorar, la cantidad de artículos publicados y la calidad de los mismos, tal y como la indica el número de citas recibidas. Muchos investigadores y especialistas en cienciometría (perdón por el palabro) son muy críticos con este índice por razones diversas[1], pero a pesar de las críticas que ha recibido, hoy por hoy es el más utilizado por los investigadores y materia importante en las comidillas propias del gremio.

Los autores de este “comentario” en Nature se centraron en el campo de las neurociencias. Seleccionaron los autores con h>4 (para excluir investigadores inactivos), publicaciones posteriores a 1995 (los registros electrónicos anteriores no son fiables), y autores cuyo primer manuscrito fue publicado más de cinco años atrás.

Utilizando procedimientos de regresión lineal, obtuvieron ecuaciones que permiten predecir el valor del índice h de un investigador, 1, 5 o 10 años después del año de partida, utilizando como predictores, los siguientes: número de artículos publicados (n), valor del índice h en la fecha de partida (h), años transcurridos desde la publicación del primer artículo (y), número de revistas diferentes en las que ha publicado los artículos (j), y número de artículos en las revistas Nature, Science, Nature Neuroscience, PNAS y Neuron (q), que son las revistas más prestigiosas en las que publican los neurocientíficos.

Y las ecuaciones obtenidas, fueron las siguientes:

Un año después (r2=0,92): h (+1) = 0,76 + 0,37 n-2 + 0,97 h -0,07 y + 0,02 j + 0,03 q

Cinco años después (r2=0,67): h (+5) = 4 + 1,58 n-2 + 0,86 h -0,35 y + 0,06 j + 0,2 q

Diez años después (r2=0,48): h (+10) = 8,73 + 1,33 n-2 + 0,48 h -0,41 y + 0,52 j + 0,82 q

Como indican los valores de r2, la predicción pierde fiabilidad cuanto más se aleja del punto de partida, lo cual es perfectamente lógico[2]. Por otro lado, se observa que conforme la predicción se refiere a momentos más alejados del punto de partida, la influencia de los indicadores va cambiando. A corto plazo, el valor actual de h es muy determinante, lo que es lógico, dado que de un año para otro no hay tiempo para que el índice, por su misma formulación, cambie sustancialmente; pero es muy interesante que vaya perdiendo influencia en el de años progresivamente más lejanos; indica que, en cierto modo, no parece fácil vivir de las rentas. Y el reverso de ese efecto es el de las dos últimas variables, el número de revistas diferentes en que se publica y el hecho de publicar en las más prestigiosas. Al fin y al cabo, esos dos indicadores reflejan una práctica de publicación que llega a más investigadores por lo que la probabilidad de ser más citado en el futuro también es mayor. Porque por un lado, cuanto mayor es el número de revistas en que se publica, mayor es el número de investigadores que tiene acceso a la investigación del investigador en cuestión; y por lo tanto, mayor será la probabilidad de ser citado en el futuro. Y por el otro, con las revistas prestigiosas pasa algo parecido: esas revistas las consulta más gente y además, los trabajos publicados en ellas tienen más citas, ya sea por la calidad cierta de sus artículos, o por su buen nombre.

Es muy probable que en otros campos del saber se puedan hacer ejercicios como este, aunque seguramente las ecuaciones resultantes tendrán, en esos casos, coeficientes distintos. Al fin y al cabo, cada campo tiene sus peculiaridades, y los investigadores de cada especialidad tienen prácticas de publicación diferentes. Pero que las ecuaciones fuesen distintas no le quitaría un ápice de interés al procedimiento. De hecho, sería útil comparar las ecuaciones que se obtuviesen en unos y otros campos, pues, a buen seguro, darían buenas pistas acerca del modo en que funcionan sus investigadores en lo relativo a las prácticas de publicación y de citas.

Dos consideraciones para terminar: 1) Si el lector es un investigador joven, tome nota: si está a su alcance, intente publicar en las mejores y, en todo caso, diversifique sus apuestas editoriales. Y 2) Si se llegase a generalizar el uso de métodos como este o similares para asignar fondos o para contratar investigadores, quizás dejarían de ser útiles en unos años, pues es posible que se modificase el comportamiento de los investigadores y que esa modificación invalidase el procedimiento; o no.

Fuente: Daniel E. Acuna, Stefano Allesina y Konrad P. Kording (2012): “Predicting scientific success” Nature 489: 201-202

Nota: Francis Villatoro se hizo eco de este mismo comentario, aquí.


[1] Que a mi juicio podrían sintetizarse en una, y es que, como cualquier indicador numérico sintético, no informa de la calidad de un trabajo o trayectoria de investigación tal y como lo haría un comité de expertos que valorase los textos de los artículos. Tiene otros problemas, como que no permite comparaciones entre diferentes campos (por la diferente dinámica de publicación y citación en unos y en otros) o que no descuenta las autocitas, etc., pero el fundamental (e irresoluble) es el primero. Para una discusión y valoración de diferentes cuestiones relativas a este asunto, recomiendo los numerosos artículos que Francis Villatoro ha publicado al respecto en su blog aquí.

[2] Porque, parafraseando a Bohr, cuanto más se proyectan en el futuro las predicciones, más difíciles se vuelven.


Esta anotación ha sido escrita por Juan Ignacio Pérez, coordinador de la Cátedra de Cultura Científica de la UPV/EHU

2 comentarios

Deja una respuesta

Tu dirección de correo electrónico no será publicada.Los campos obligatorios están marcados con *