Jose Luis Arroyo Barrigüete y Francisco Borrás Palá
Imaginemos que, tras diez años trabajando en una empresa, otra compañía nos llama y nos hace una oferta de trabajo. Esta tiene ventajas respecto a nuestras condiciones actuales pero, como en toda decisión, hay riesgos asociados a la incertidumbre. ¿Me llevaré bien con los compañeros? ¿Tendré una buena relación con mi nuevo jefe? ¿Encajaré en la cultura corporativa de esta compañía?
Ahora supongamos que alguien nos dijera cuál es la probabilidad que tenemos de equivocarnos. Por ejemplo que, en caso de aceptar la oferta, tenemos una probabilidad del 0,7 % de estar tomando la decisión incorrecta. Dicho de otra forma: tenemos un 99,3 % de probabilidad de tomar la decisión adecuada. En estadística, a esto lo llamamos p-valor.
En ciencia es muy frecuente utilizar el contraste de hipótesis. La idea es partir de una hipótesis nula (H₀), que no es sino el statu quo, la situación actual. En nuestro ejemplo, permanecer en la empresa en la que estamos. Frente a ella se contrasta la hipótesis alternativa (H₁), es decir, una idea contraria a la anterior. En nuestro caso, cambiar de trabajo.
Si encontramos una fuerte evidencia empírica en contra de la hipótesis nula, decimos que la rechazamos y, por tanto, aceptamos la alternativa. Siguiendo con nuestro ejemplo, esta evidencia sería lo que yo pudiera llegar a saber, después de investigarlo, sobre las mejores condiciones de trabajo que nos ofrecen.
Pero, ¿qué significa “fuerte evidencia empírica”? Para responder a esa pregunta, tenemos un concepto muy útil llamado p-valor. Este es la probabilidad que tenemos de equivocarnos si rechazamos la hipótesis nula con la información (evidencia empírica) de la que disponemos.
Cuanto más pequeño sea el p-valor, más improbable es que nos estemos equivocando al rechazar la hipótesis nula. Dicho de otro modo, más probable es que estemos acertando. En nuestro ejemplo, cuanto más pequeño sea el p-valor, más probable es que cambiar de trabajo sea una decisión adecuada.
Entonces, ¿qué p-valor necesitaría yo para cambiar de trabajo? ¿Cuánto riesgo estaría dispuesto a asumir? ¿Un 10 %? ¿Quizá un 5 %? ¿O se sentiría más cómodo con un 1 %? Estos son, de hecho, valores típicos usados en ciencia. Usaremos uno u otro en función del riesgo que estemos dispuestos a asumir.
Estos porcentajes son valores subjetivos que dependen del individuo que toma la decisión y de las consecuencias de la misma. En cambio, el p-valor es un dato objetivo que calculan todos los programas informáticos de estadística a partir de los datos de una muestra. Aparece de forma mágica como un resultado, aunque detrás hay un proceso de cálculo.
Si el p-valor se encuentra por debajo del nivel de riesgo, rechazaremos H₁. De hecho, los ordenadores habitualmente facilitan todavía más la decisión poniendo un asterisco al lado del p-valor si es menor que el 10 %, dos si es menor que el 5 % y tres si es menor que el 1 %.
En nuestro ejemplo de la oferta de trabajo, con un p-valor del 0,7 % los tres asteriscos nos dejarían bastante tranquilos respecto a aceptar la propuesta, salvo que seamos de esas personas que no se arriesgan nunca.
En el año 2314…
Ana sale de casa con sus gafas cuantrónicas de realidad aumentada, y tras llegar a la oficina en su aerodeportivo, se plantea si tomar un segundo café antes de entrar, o bien subir directamente a su despacho para comenzar la jornada. Sus gafas captan el pensamiento, y tras apenas unos microsegundos de cálculo, proyectan en el visor tridimensional el siguiente mensaje:
H₀ : subir directamente al despacho, como es habitual.
H₁ : tomar un segundo café.
P-valor: 0.841
Ana, sorprendida por un p-valor tan alto, decide subir directamente y olvidar la idea del café, pero se pregunta a qué se deberá tal cifra. Solo mientras asciende hasta la planta 159 en el ascensor gravítico cae en la cuenta de que, apenas en media hora, tiene una importante reunión que debe preparar. De haber tomado ese café, probablemente no habría tenido el tiempo suficiente para hacerlo. Esa es la información de que disponían sus gafas cuantrónicas, que no se olvidan de nada.
Tras una intensa jornada, Ana recibe una holo-llamada de Bernardo, que la invita a cenar esta noche. Ana, tras haber terminado una relación previa hace varios meses, tiene dudas sobre si está interesada en la proposición. Las gafas, captando sus pensamientos, proyectan un nuevo mensaje:
H₀ : cenar sola en casa, como es habitual.
H₁ : aceptar la proposición de Bernardo y cenar con él.
P-valor: 0.053
Por segunda vez en el día, Ana queda sorprendida por la información que le proporcionan sus gafas. ¿A qué se debe un p-valor tan bajo? ¿Tan seguro está su micro-ordenador de que debe aceptar la propuesta de Bernardo? ¿Solo una probabilidad del 5,3 % de equivocarse si la acepta? Ana reflexiona unos segundos y recuerda que las gafas han sido capaces de buscar todo el rastro que ha ido dejando Bernardo en las redes sociales en un instante, muchísimo menos tiempo que el que hubiera empleado ella. Entonces le responde…
Volviendo al presente
¿Qué sucedería si dispusiésemos de las gafas cuantrónicas de Ana? Ante cualquier pequeña decisión, estas procesarían toda la información disponible y nos facilitarían de inmediato la probabilidad de equivocarnos. No cabe duda de que, por una parte, nos equivocaríamos mucho menos. Por otra, ¡la vida sería mucho más aburrida!
Como, afortunadamente, aún estamos muy lejos de que tales gafas existan, de momento el p-valor queda restringido a la experimentación científica, donde nos dará una idea de cuán probable es que estemos equivocados. En el resto de casos, deberemos seguir utilizando un análisis DAFO.
La próxima vez que lea algún estudio en el que se menciona el p-valor, ya sabe a qué se refieren los autores: al riesgo que tienen de equivocarse en sus afirmaciones con la evidencia empírica de los datos de una muestra. Como la muestra es solo una parte de la población, es una información imperfecta. Por ello el p-valor no podrá ser nunca 100 % o 0 %, que supondría una seguridad absoluta a la hora decidir.
Sobre los autores: Jose Luis Arroyo Barrigüete y Francisco Borrás Palá son profesores de métodos cuantitativos en ICADE – Universidad Pontificia Comillas
Este artículo fue publicado originalmente en The Conversation. Artículo original.
Álvaro
En esta entrada creo que se da una interpretación equivocada de lo que es el p-valor. Aquí se dice que «es la probabilidad que tenemos de equivocarnos si rechazamos la hipótesis nula con la información (evidencia empírica) de la que disponemos». Por el texto se entiende que cuando hablan de «probabilidad de equivocarnos» se refieren a la probabilidad de que la hipótesis nula sea cierta cuando la estamos rechazando o al revés. Pero el p-valor en ningún caso nos indica la probabilidad de que una hipótesis sea cierta o no. De hecho, es uno de los errores más comunes con el p-valor y una de las razones por las que la ASA (American Statistical Association) decidió publicar una declaración sobre su uso e interpretación [1][2].
Un saludo
Álvaro
[1] https://www.amstat.org/asa/files/pdfs/P-ValueStatement.pdf
[2] https://amstat.tandfonline.com/doi/full/10.1080/00031305.2016.1154108