Me fío, o no, de Wikipedia

Ciencia infusa

Wikipedia

Wikipedia, según Wikipedia, es “una enciclopedia libre, políglota y editada colaborativamente”. Contiene, en una cifra que aumenta cada día, 37 millones de artículos en 284 idiomas, redactados por voluntarios de todo el mundo en una labor que comenzó en 2001. En la actualidad es la obra de consulta más popular y utilizada de internet. Todo lo que he escrito hasta ahora está tomado de Wikipedia pues, cuando en Google pongo Wikipedia, lo primero que sale es Wikipedia. Es más, cuando escribí este artículo, el 28 de julio de 2014, obtuve un total de 881.000.000 de resultados sobre Wikipedia en Google cuando inicié la búsqueda con el término Wikipedia.

Pero en el propio texto Wikipedia en Wikipedia hay un apartado titulado “Críticas” que, a su vez, se divide en tres parágrafos: “Falta de referencias y contenidos”, “Errores y vandalismo” y “Manipulaciones y sesgo”. En resumen, la pregunta, que también se hacen en Wikipedia, es ¿nos podemos fiar de Wikipedia?

Ya se han publicado algunos trabajos que intentan responder a esta pregunta. Hace unas semanas, Jingyu Han y Kejia Chen, de la Universidad de Nanjing de Correos y Telecomunicaciones, en China, nos muestran un algoritmo que clasifica automáticamente la calidad de las entradas de Wikipedia. Por lo que cuentan Han y Chen, algo parecido se hace para clasificar los correos electrónicos como spam.

Clasifican cada entrada según su precisión, exhaustividad, coherencia y concreción y, a partir de esta evaluación, predicen la calidad de los textos de Wikipedia. Comparan sus resultados con la evaluación de los mismos textos por evaluadores externos. Constatan que su algoritmo supera hasta en un 26% la labor de esos evaluadores sobre la calidad de las entradas de Wikipedia.

Pero, como nos cuentan M. Dylan Bould y sus colegas, de la Universidad de Ottawa, en Canadá, resulta que Wikipedia es el recurso más utilizado para hacer consultas sobre salud, un asunto más concreto y más cercano a mi formación e intereses. Es, por tanto, importante averiguar cuánto de fiar es Wikipedia y conocer, en general, cómo se usa para temas de salud por los navegantes de internet.

Entre otros datos, Bould estudia cómo se cita Wikipedia en la literatura científica. Es una manera de saber indirectamente si Wikipedia es fiable para los investigadores. Si lo es aparecerá entre las referencias y, si no lo es, ignorarán la enciclopedia. Los objetivos del trabajo de Bould son conocer la prevalencia de las citas de Wikipedia, qué tipo de revistas científicas aceptan artículos con citas de Wikipedia en su bibliografía y, finalmente, ver cómo se cita Wikipedia en los textos.

Los datos, tomados en febrero de 2012, proceden de Scopus y de Web of Science, y las revistas de Medicina se seleccionan en MedLine, PubMed y Embase, y sus factores de impacto, correspondientes a 2011, del Journal Citation Reports. Encuentran 1433 artículos de 1008 revistas con 2049 citas de Wikipedia. No son muchos artículos con citas de Wikipedia pero llegan para hacer un primer estudio.

Lo primero que detectan es que el número de citas crece con el tiempo, sobre todo a partir de diciembre de 2010. Más de la mitad de las citas de Wikipedia, y es normal ya que, después de todo, es una enciclopedia, se refieren a definiciones, con el 31.6%, y a descripciones, con el 23.5%. Las citas, a pesar de la creencia general, no aparecen solamente, y por tanto se aceptan, en revistas con factor de impacto bajo o, incluso, sin él. También algunas revistas de factor de impacto alto las publican. Por ejemplo, la media de los factores de impacto de las revistas con citas de Wikipedia es de 2.0, con los máximos en 36.6 de Nature o 31.2 de Science.

Bould concluye que el mayor problema de la fiabilidad y el futuro de las citas de Wikipedia es que sus textos son temporales y cambian, o pueden cambiar, constantemente. En cambio, las fuentes y las evidencias de las que proceden estos textos de Wikipedia son permanentes y accesibles, habitualmente artículos o libros académicos. Afirman que, según esto, lo adecuado es exigir a los autores de los artículos científicos que citan entradas a Wikipedia que mencionen las fuentes originales y no las transcripciones de Wikipedia.

Volvamos a la relación entre temas de salud y citas de Wikipedia con dos trabajos recientes que tratan de aspectos más concretos de la Medicina. Uno de ellos, dirigido por Garry Thomas, de la Universidad de Toronto, en Canadá, sobre la nefrología y las consultas de los pacientes sobre sus enfermedades en Wikipedia, y el segundo, de Samy Azer, de la Universidad King Saud, de Arabia Saudita, sobre los textos de Wikipedia que tratan de gastroenterología y hepatología y su utilidad para los estudiantes de Medicina.

Thomas busca entradas en Wikipedia relacionadas con la nefrología, entre el 1 y el 15 de agosto de 2012, y encuentra 69 en total. Utiliza la clasificación internacional de enfermedades de la OMS conocida como “International Statistical Classification of Diseases and Related Problems (10th Edition, 2007)”, y analiza el porcentaje de códigos de esta clasificación, relacionados con la nefrología, que aparecen en los 69 artículos que ha encontrado en Wikipedia.

El 72% de las entradas de Wikipedia se atienen a esta clasificación de la OMS, con el máximo en las enfermedades glomerulares, con el 92%, y el mínimo en el apartado de “otras enfermedades” con el 60%. Por tanto, y con un cierto rigor, el 75% de las enfermedades del riñón aparecen en Wikipedia.

El autor también explora la fiabilidad de los textos. Una cosa es que citen las enfermedades de las clasificaciones aceptadas y otra, muy distinta, es que lo hagan con fiabilidad. Para ello analiza el número de referencias que proceden de revistas con revisión por referees que se citan en cada texto de Wikipedia. El número medio de referencias que cumplen esta condición es de 7.1, con el máximo en “Cálculos renales” con 71 referencias, y 45 de ellas son de revistas con referees. El 81% de los textos de Wikipedia sobre nefrología tienen, por lo menos, una referencia a una revista con referees. Por tanto y en general, los textos de Wikipedia sobre nefrología están referenciados y, según Thomas, en principio se pueden considerar fiables.

Considera el autor que los textos sobre nefrología en Wikipedia pueden ser una herramienta poderosa para la información y la educación de los pacientes. Sin embargo, hay que cuidar tanto su fiabilidad, su actualización y que sean inteligibles para los lectores.

El segundo trabajo, presentado por Samy Azer, utiliza un método parecido y, en mayo de 2013, encuentra 39 entradas en Wikipedia que tratan de gastroenterología y hepatología. Para evaluarlos utiliza un examen por evaluadores externos y concluye que en los textos falta profundidad y, por tanto, no son muy útiles para los estudiantes de Medicina. Quizá, como en el trabajo de Thomas, sirvan para un público menos formado pero no para los estudiantes. Su fiabilidad, medida según el número de referencias, es, en total, de 1233 citas de artículos científicos en las 39 entradas, con un rango que va de 4 a 144, y una media de 31.6. El 28% de estas referencias vienen de revistas con referees.

En conclusión, para Azer los textos de Wikipedia no son útiles para los estudiantes de Medicina. Añade, además, que no son muy fiables pues son limitados, tienen deficiencias e, incluso, errores científicos que deben revisarse.

En cuanto a su legibilidad, es decir, a si son fácilmente leíbles y comprensibles, tanto Thomas como Azer destacan que no presentan una especial dificultad pues su nivel de escritura es el típico de instituto, college o, como mucho, primer año de universidad.

Demos un paso más y vayamos con Robert Hasty, de la Campbell University de Buies Creek, en Carolina del Norte, a evaluar lo que dice Wikipedia sobre las diez enfermedades más costosas en Estados Unidos. Según sus estadísticas oficiales, son: enfermedades del corazón, cáncer, desórdenes mentales, daños traumáticos, osteoartritis, asma y enfermedades obstructivas pulmonares, hipertensión, diabetes, problemas en la espalda e hiperlipidemia.

Los autores buscan una entrada para cada una de estas enfermedades en Wikipedia y, a la vez, una revisión sobre cada una de ellas en las revistas académicas. Dos expertos independientes comparan ambos textos a partir de los acuerdos y desacuerdos entre ellos.

Los resultados son evidentes: en 9 de las 10 enfermedades, los expertos encuentran un desacuerdo significativo entre lo que se escribe en Wikipedia y lo publicado en revistas médicas; solamente hay acuerdo en daños traumáticos. Por tanto, cuidado con el uso de la información médica que aparece en Wikipedia. Sin embargo, me parece a mí, este es un estudio que merece un reanálisis por otros investigadores. Creo que es un error metodológico comparar un solo texto de Wikipedia por cada enfermedad con un solo artículo académico sobre la misma enfermedad y, además, ambos elegidos por el equipo investigador. Es un buen dato para empezar, pero hay que ampliar la base metodológica y estadística del trabajo.

Sin embargo, este trabajo se hizo popular, llegó a los medios y se publicó en decenas de periódicos, revistas, radio, televisión e internet de todo el mundo. Y el titular era siempre el mismo: “Wikipedia se equivoca en 9 de cada 10 entradas de salud”. Recuerden, esta afirmación es absolutamente inexacta. Wikipedia más bien se equivoca en 9 “de” 10, no de “cada” 10.

En conclusión, y a falta de más investigación sobre Wikipedia, no es adecuada para citar en trabajos académicos pues es más fiable la fuente original. Siempre será una línea de trabajo interesante la que proponen Han y Chen con sus algoritmos y quedo a la espera de más resultados. No estaría mal disponer, por lo menos para algunos círculos académicos y periodísticos se me ocurre sobre la marcha, de un sistema automático de clasificación de la calidad de los textos de Wikipedia, por lo menos como análisis previo y rápido.

Por otra parte, a Wikipedia le falta estabilidad lo que gana con sus actualizaciones, pero se diferencia de las publicaciones académicas en que no es constante y, además, no está revisada según los estándares académicos. Lo más aprovechable, siempre con precaución, son las definiciones y las descripciones y, añado, por experiencia propia, las biografías y, repito, siempre con un espíritu profundamente alerta y crítico.

Pero este espíritu crítico, tan necesario en el manejo de internet y de la información que de allí nos llega, me parece, no se adquiere en internet sino fuera del maremágnum online. Quizá lo que uno aprende, de aquí y de allá, de este y de aquel, de lo que y quien nos marca para nuestro trabajo, es, en último término, el espíritu crítico que necesitamos y del que, a veces, incluso creo que huimos.

Y un apunte final, me parece curioso que haya científicos que citen a Wikipedia en sus artículos y no a la fuente original que sirvió de base al texto de Wikipedia. Es raro. Quizá, y es una suposición personal sin ninguna evidencia, quien cita a Wikipedia es el autor “colectivo” y “anónimo” de la entrada en Wikipedia.

Referencias:

Azer, S. A. 2014. Evaluation of gastroenterology and hepatology articles on Wikipedia: Are they suitable as learning resources for medical students? European Journal of Gastroenterology and Hepatology 26: 155-163.

Bould, M.D., E.S. Hladkowicz, A.-A.E. Pigford, L.-A. Ufholz, T. Postonogova, E. Shin & S. Boet. 2014. References that anyone can edit: review of Wikipedia citations in peer reviewed health science literature. British Medical Journal doi: 10.1136/bmj.g1585

Fitterling, L. 2014. Wikipedia: Proceed with caution. Journal of American Osteopathic Association 114: 334-.335.

Han, J. & K. Chen. 2014. Ranking Wikipedia article’s data quality by learning dimension distributions. International Journal of Information Quality 3(·): 207.

Hasty, R.T., R.C. Garbalosa, V.A. Barbato, P.J. Valdés Jr., D.W. Powers, E. Hernández, J.S. Johu, G. Suciu, F. Qureshi, M. Popa-Radu, S. San José, N. Drexler, R. Patankar, J.R. Paz, C.W. King, H.N. Gorber, M.G. Valladares & A.A. Somji. 2014. Wikipedia vs. peer-reviewed medical literature for information about the 10 most costly medical conditions. Journal of American Osteopathic Association 114: 368-373.

Thomas, G.R., L. Eng, J.F. de Wolff & S.C. Grover. 2013. An evaluation of Wikipedia as a resource for patient education in nephrology. Seminars in Dialysis 26: 159-163.

Sobre el autor: Eduardo Angulo es doctor en biología, profesor de biología celular de la UPV/EHU retirado y divulgador científico. Ha publicado varios libros y es autor de La biología estupenda.

10 comentarios

  • Avatar de NaBUru38

    «el mayor problema de la fiabilidad y el futuro de las citas de Wikipedia es que sus textos son temporales y cambian, o pueden cambiar, constantemente»

    Es cierto, pero ya hay una solución: el software MedaWiki ofrece un «enlace permanente» en cada página.

    • Avatar de Carlos Márquez

      Los documentos con filosofía colaborativa deben ser temporales, ahora, el hecho de ser temporales no define la calidad de sus escritos.

  • Avatar de Pato

    Excelente artículo. Me gustaría agregar que me parece que es un tema más bien disciplinario. Soy del área de humanidades y en ella el citar desde wikipedia «no está muy bien visto», de hecho, no recuerdo haber leído algún paper en el que la citen. ¿Sabes de algún estudio en el ámbito de las Ciencias Sociales o Humanides que investiguen este mismo problema que mencionas en tu entrada?

    Por otro lado, es importante recalcar las implicancias que puede traer este «ingreso» de wikipedia a la literatura científica aceptada. ¿Qué pasa con los estudiantes que se encuentran en una etapa inicial de ingreso a las culturas científicas? ¿Cómo les decimos que Wikipedia se puede usar o no en un trabajo de investigación? ¿Qué herramientas les podemos entregar para que sean capaces de discernir si una entrada es fiable o no?

    Como sea, sigo creyendo que wikipedia es muy útil, pero no para que sea citada en un trabajo de investigación (sea paper, informe, TFM, tesis doctoral, etc.). Más que todo debe ser entendida como una excelente fuente de ingreso a la información, pero no una información citable.

  • Avatar de LEGVIIGPF

    Claro, estamos hablando de la Wikipedia en inglés, en español saldría notablemente peor parada.

    La otra cuestión importante es ¿a quién está dirigida la Wikipedia? Se dice en el artículo que no sirve para los estudiantes de medicina, pero debe la Wikipedia, una enciclopedia generalista, servir para los estudiantes de medicina? Un artículo excesivamente técnico no será entendido por el público en general, aquel que busca una primera aproximación al asunto en cuestión. Para profundizar hay, y debe haber, otros canales.

    La divulgación no debe mirar solo a la fiabilidad y la precisión de los contenidos, si no también a quién va dirigida, a quién se pretende llegar. A veces hay que perder precisión, y usar metáforas y comparaciones; sin dejar de ser fiables.

  • Avatar de Nemigo

    no estoy de acuerdo con las conclusiones
    en wikipedia ya se advierte que no son un lugar en que buscar información sobre salud o tratamientos médicos y se remite a un especialista
    por lo tanto no tiene sentido criticar la falta de algo que ya te han dicho que no existe

  • Avatar de Virtudes Guzmán

    Al artículo le falta una comparación a mi entender muy necesaria: comparar el nivel de citas de Wikipedia con el de otras enciclopedias. Esos resultados sí serían significativos.
    Parecen olvidar que la literatura científica se alimenta de literatura científica, y no de enciclopedias generales. La función de éstas es explicar los conceptos principales de un tema. Para profundizar hay otras fuentes.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *