Resumiendo la información estadística: media, mediana, moda y rango intercuartílico

Matemoción

14 min

Resumiendo la información estadística: media, mediana, moda y rango intercuartílico

Hace unos días se publicaba una noticia relacionada con una nueva vacuna para tratar el cáncer de mama triple negativo. En la nota de prensa podía leerse el siguiente texto.

Una vacuna de ARN mensajero (ARNm) para tratar el cáncer de mama triple negativo ha provocado una respuesta inmune potente y duradera en la mayoría de las pacientes que la han recibido, según los resultados de un ensayo clínico presentados hoy por científicos de la compañía BioNTech en la revista Nature.

La vacuna no está diseñada para prevenir la enfermedad, sino para mejorar el tratamiento de personas a las que ya se ha diagnosticado. Se trata de una vacuna individualizada que se elabora a medida para que el sistema inmune de cada paciente reconozca y ataque proteínas específicas de su tumor. Diez de las catorce pacientes que la han recibido permanecen libres de la enfermedad después de una mediana de 5 años y 2 meses desde que recibieron la última dosis. […]

Al leer esta noticia, la periodista Eva Caballero, directora del programa La mecánica del caracol de Radio Euskadi y Premio de Periodismo científico Concha García Campoy en la categoría de radio en 2022, me propuso que, en mi colaboración quincenal con su programa, recordáramos los conceptos estadísticos de media, mediana y moda. Y he pensado que esta noticia es también una buena excusa para escribir una sencilla entrada sobre este tema en el Cuaderno de Cultura Científica.

mediana
Vacuna de ARN mensajero para el covid-19. Foto: Spencer B Davis / Wikimedia Commons

Media y mediana, dos sencillos conceptos estadísticos

Empecemos recordando la definición de los dos conceptos más sencillos utilizados en la estadística, la media aritmética, que es la más habitual y conocida, y la mediana.

Dada una serie de valores numéricos x1, x2, …, xn en los que estamos interesados (ya sean las notas de un examen, la altura de un determinado grupo de población, el sueldo de las trabajadoras de cierto sector, etcétera), la media aritmética de los mismos se calcula haciendo la suma de los valores, dividido por la cantidad de valores:

Media aritmética = (x1 + x2 + … + xn) / n.

Podríamos decir que la media informa del valor de equilibrio aritmético entre los números o valores considerados. Por ejemplo, imaginemos que me tomo la temperatura durante una semana (a una cierta hora) y los resultados son los siguientes (ordenados de menor a mayor), en grados centígrados: 35,7 – 36 – 36,2 – 36,3 – 36,7 – 37,1 – 37,4. Por lo tanto, la temperatura media de esos días ha sido de:

(35,7 + 36 + 36,2 + 36,3 + 36,7 + 37,1 + 37,4) / 7 = 255,4 / 7 = 36,48 grados.

De forma intuitiva, esta temperatura promedio puede interpretarse como la temperatura que yo tendría todos los días si mi temperatura no variara en esos siete días.

Mientras que la mediana es el valor que está “exactamente” en el medio, la mitad de los datos estadísticos están por encima y la otra mitad por debajo. Para calcularla, se toman los datos numéricos y se ordenan de menor a mayor, si la cantidad de valores es impar se considera el valor que está en el medio, y si es par, se toma la media aritmética de los dos que están en el medio.

En nuestro sencillo ejemplo de las temperaturas de una semana, como ya están en orden {35,7 – 36 – 36,2 – 36,3 – 36,7 – 37,1 – 37,4}, la mediana de las temperaturas es el valor que está situado en el medio de esos siete valores, que es 36,3 grados. En este ejemplo ficticio, la mediana es cercana al valor de la media, pero no siempre es así, como se verá.

Un bonito ejemplo del uso de la mediana

Una mediana de 5 años y 2 meses

Por lo tanto, volvamos a la noticia que ha desencadenado esta reflexión y preguntémonos qué significa exactamente que “diez de las catorce pacientes que la han recibido permanecen libres de la enfermedad después de una mediana de 5 años y 2 meses desde que recibieron la última dosis”.

Claramente, lo que significa es que, si se lista el tiempo que lleva cada una de esas 10 pacientes libres de enfermedad, la cantidad que está en el medio (de hecho, puesto que son una cantidad par de valores, la media de las dos que están en el medio) es “5 años y 2 meses”. Por lo tanto, para cinco de esas pacientes libres de la enfermedad no han pasado aún 5 años y 2 meses desde que recibieron la vacuna, mientras que para las otras cinco han pasado más de 5 años y 2 meses. La cuestión es que la mediana no nos dice nada más sobre cómo se distribuyen esos tiempos por encima y por debajo de “5 años y 2 meses”.

Por ejemplo, podría pasar cualquiera de las siguientes situaciones extremas. Para empezar, podría ocurrir que cinco pacientes llevaran 5 años libres de la enfermedad, uno 5 años y 4 meses (que en su expresión decimal sería 5,34 años), y los otros cuatro 10 años:

{5 – 5 – 5 – 5 – 5 – 5 años y 4 meses [5,34] – 10 – 10 – 10 – 10}.

En este caso la mediana es 5 años y 2 meses, como en la noticia, pero serían tiempos muy positivos, cuya media aritmética estaría en 7 años (y medio mes). De hecho, la media nos ofrece una imagen muy positiva de la respuesta de las pacientes a la vacuna.

Por el contrario, podría ser que hubiese cuatro pacientes que llevan 1 año, otra 5 años y las cinco restantes 5 años y 4 meses (5,34 años):

{1 – 1 – 1 – 1 – 5 – 5 y 4 meses [5,34], [5,34], [5,34], [5,34], [5,34]}.

De nuevo, la mediana es de 5 años y 2 meses, pero los tiempos no son tan optimistas en esta ocasión, siendo la media aritmética de 3 años y casi siete meses, mucho más baja que en el ejemplo anterior.

De hecho, si acudimos al artículo original que desencadenó la noticia, un artículo en la revista Nature, del 18 de febrero de 2026, titulado Individualized mRNA vaccines evoke durable T cell immunity in adjuvant TNBC, los resultados son bastante optimistas, ya que los tiempos de las 10 pacientes libres de la enfermedad están por encima de 5 años, como se observa en la siguiente imagen sobre el tiempo que han pasado desde la vacunación.

Gráfica con los días que han pasado desde la vacunación para los 14 pacientes vacunados. Fuente: Sahin, U., Schmidt, M., Derhovanessian, E. et al. (2026) Individualized mRNA vaccines evoke durable T cell immunity in adjuvant TNBC. Nature doi: 10.1038/s41586-025-10004-2 CC BY 4.0

Para la nota de prensa yo habría utilizado la media aritmética, ya que es una información a la que está más habituado el público, incluidos los periodistas.

La media es muy sensible a los extremos

Como se ha comentado respecto a los resultados del estudio de la nueva vacuna para tratar el cáncer de mama triple negativo, una misma mediana puede tener asociadas diferentes distribuciones de los valores del estudio. A la hora de informar del resultado de un estudio estadístico como este, es conveniente añadir la media aritmética para entender un poco mejor la distribución de los valores. De hecho, normalmente se utiliza la media, pero esta por si sola también deja la información a medias, no explica tampoco como se distribuyen los valores y es muy sensible a los valores extremos (puede verse el video Una de mates: media y mediana [https://culturacientifica.com/2015/12/10/una-de-mates-media-y-mediana/]). Pongamos un ejemplo.

Como vamos a comentar más adelante la cuestión de la edad de fallecimiento de las personas en España, utilicemos un sencillo ejemplo, relacionado con esto, para ilustrar que la media es muy sensible a los valores extremos. Consideremos las edades de fallecimiento de 7 personas sobre las que tenemos un cierto interés, por el motivo que sea. Imaginemos que estas edades son: {5, 77, 80, 82, 85, 89, 92} años. Entonces, la media es de 72,86 años, lo que nos da a entender, si solo conocemos el valor de la media, que este es un dato no muy bueno, de hecho, la media de la edad de fallecimiento en España en 2025 se sitúa en 81,3 años. Esto se debe al valor extremo de la muestra. Una persona ha fallecido con 5 años, pero los demás están por encima de 75 años. Por otra parte, si calculamos la mediana de esos siete valores, esta es 82 años, que no se ha dejado influir por el valor extremo.

Fotografía del funeral del Papa Francisco en el Vaticano. Foto: Dipartimento della Protezione Civile (Roma, Italia)

Otro concepto sencillo, la moda

Lo ideal es que la información venga acompañada de ambos valores, incluso uno más, la moda, que es el valor (o rango de valores) que más se repite. Además, siempre es aconsejable, en el texto de una noticia, explicar los conceptos estadísticos que se utilizan, en este caso, al menos la mediana y la moda, que son menos conocidos y utilizados por el público.

Pongamos otro ejemplo, sacado del interesante libro de Darrell Huff titulado Cómo mentir con estadísticas, para comprobar que el uso de las tres medidas estadísticas, media, mediana y moda, nos permite conocer mejor la situación. Imaginemos que los sueldos mensuales de un grupo de 25 personas (del colectivo que queramos estudiar) son los siguientes (en euros):

{45.000 – 15.000 – [2 x] 10.000 – 5.700 – [3 x] 5.000 – [4 x] 3.700 – 3.000 – [12 x] 2.000}

Entonces, la media es 5.700 euros al mes (que es alta debido a que uno de los sueldos es muy alto, 45.000 euros; algún otro hay alto, aunque no tanto, ni tantos), la mediana es 3.000 euros (esto es, la mitad cobran por encima de eso y la otra mitad por debajo, que vemos que es significativamente menor que la media, ya que esta está influenciada por el extremo de 45.000 euros) y la moda, lo más frecuente, es de 2.000 euros, que cobran 12 personas. Las tres informaciones (media, mediana y moda) nos describen bastante bien la distribución de los sueldos.

mediana
Ilustración perteneciente al libro Cómo mentir con estadísticas, de Darrell Huff

La edad de fallecimiento en España

Pero vayamos con un ejemplo real. He buscado la información sobre la edad a la que han muerto las personas en España en los dos últimos años (ojo, que no es exactamente lo mismo que la esperanza de vida, aunque está relacionado). Según el INE (Instituto Nacional de Estadística), en 2024 la edad media a la que fallecieron las personas que vivían en España es de 81,1 años (81 años y un mes), que separada por género es de 77,2 años (77 años y 2 meses y medio) para los hombres y 85 años para las mujeres.

También he buscado la mediana, que resulta ser de 85,8 años (85 años y 9 meses y medio). Es decir, la mitad de la gente ha muerto en 2024 por encima de esa edad, mientras que la otra mitad lo ha hecho por debajo. La mediana está cerca de la media, incluso algo por encima, como vemos. Esto se debe, entre otras cuestiones, a que hay poca mortalidad infantil, por lo que no hay valores extremos que tiren hacia abajo de la media. Distinguiendo por género, las medianas son 82,3 años (82 años y 3 meses y medio) para hombres y 89,7 años (89 años y 8 meses y medio) para mujeres.

Además, la moda de las muertes en España, en 2024, es de 91 años, es decir, esa es la edad a la que más personas han muerto, en general, se han producido muchas muertes alrededor de esa edad. Y por eso, también, la mediana es superior a la media. Si separamos por géneros, 88 años en hombres y 94 años en mujeres.

Tabla con la media, mediana y moda de la edad de fallecimiento de las personas en España en 2024

Podemos incluir también la información del año 2025, que es la siguiente. La media aritmética de la edad a la que han muerto las personas residentes en España en 2025 es de 81,3 años, que ha crecido un poco respecto al año anterior, la mediana es 86,2 años y la moda 92 años.

Tabla con la media, mediana y moda de la edad de fallecimiento de las personas en España en 2025

Aunque este es un ejemplo sencillo, nos permite ver que la mejor forma de dar una información estadística resumida es dando, al menos, esas tres sencillas medidas estadísticas: media aritmética, mediana y moda, fáciles de entender y juntas nos transmiten bastante información. Solo la media, o la mediana, se puede quedar bastante pobre, salvo que eso sea el objetivo de quien informa.

Además, el rango intercuartílico

Se puede añadir otra sencilla medida estadística, el rango intercuartílico, que está relacionada con la mediana y que aporta un poco más de información sobre la distribución de los valores del estudio estadístico.

Consideremos de nuevo los valores del estudio estadístico, ordenados de menor a mayor. Se van a introducir dos nuevos valores, los cuartiles, que van a estar definidos de forma similar a la mediana. El primer cuartil se trata del valor debajo del cual está el 25%, de los valores del estudio estadístico, el segundo cuartil sería la mediana (50% por encima y por debajo) y el tercer cuartil sería el valor encima del cual estarían un 25% de los valores (o el 75% debajo de ese valor). Y se define, finalmente, el rango intercuartílico como el rango entre el primer y el tercer cuartil.

Observemos que el rango intercuartílico es la zona que contiene al 50% de los valores que están en el medio, alrededor de la mediana. Este valor complementa la información de la mediana, ya que nos da una idea de la dispersión que se produce alrededor de la misma. Si el rango intercuartílico es grande los valores estarán muy dispersos, en esa zona central alrededor de la mediana, mientras que, si es pequeño, estarán más agrupados alrededor de ella.

Volvamos a poner un ejemplo práctico. Imaginemos que se ha entrevistado a 15 médicos y médicas sobre la cantidad de operaciones, de un determinado tipo, que han realizado y los resultados han sido (ordenados ya) los siguientes…

20 – 25 – 25 – 27 – 28 – 31 – 33 – 34 – 36 – 37 – 44 – 50 – 59 – 85 – 86

entonces la media es de 41,3 operaciones, mientras que la mediana es de 34 operaciones, que está exactamente en el medio. Ya vemos que existen valores extremos por arriba (85 y 86 operaciones), que desplazan la media respecto a la mediana. Veamos el rango intercuartílico. Si volvemos a los datos

20 – 25 – 25 – 27 – 28 – 31 – 33 – 34 – 36 – 37 – 44 – 50 – 59 – 85 – 86

la mediana es 34, el primer cuartil es 27 y el tercero 50. Por lo tanto, el rango intercuartílico es 27-50 (cuya diferencia es de 23 operaciones, que quizás es algo amplio, los valores están dispersos), que recoge al 50% de los valores que están en la zona media. Imaginemos que esa diferencia fuese de 35, eso querría decir que la muestra del número de operaciones es más dispersa aún alrededor de la mediana, y al revés, estarían los datos más agrupados, si fuese menor.

mediana

Si volvemos a los datos de la edad de fallecimiento en España, resulta que el rango intercuartílico es el rango entre 74,2 (74 años y dos meses y medio) y 90,9 (90 años y casi once meses), que es un rango de 16,7 años. Por lo tanto, el rango intercuartílico nos está informando de que el 25% de las muertes está por debajo de 74,2 años, el 25% está por encima de 90,9 años, y el 50% de las muertes en la zona centro, alrededor de la mediana, entre los 74,2 y 90,9 años.

Si miramos al año 2025, el rango intercuartílico es el rango entre 75,3 y 91,1 años, que es un rango de 15,8 años. Respecto al año anterior, se observa que la zona en la que se producen el 50% de los fallecimientos alrededor de la mediana, el rango intercuartílico, se ha desplazado un poco hacia arriba y, además, se han concentrado un poco más las edades de fallecimiento alrededor de la mediana, ya que el rango es menor, ha pasado de 16,7 a 15,8 años.

Bibliografía

  1. Darrell Huff, Cómo mentir con estadísticas, Editorial Crítica, 2015.
  1. David Spiegelhalter, El arte de la estadística, cómo aprender de los datos, Capitán Swing, 2023.

Sobre el autor: Raúl Ibáñez es profesor del Departamento de Matemáticas de la UPV/EHU y colaborador de la Cátedra de Cultura Científica

Deja una respuesta

Tu dirección de correo electrónico no será publicada.Los campos obligatorios están marcados con *