En mi anterior entrada de la sección Matemoción del Cuaderno de Cultura Científica, Falsos positivos o la importancia de comprender la información, analizábamos el fenómeno de los falsos positivos en medicina (aunque son también importantes en muchos otros campos de nuestra sociedad), que no son más que un ejemplo de probabilidad condicionada.
La probabilidad condicionada a la que estamos dedicando estos artículos, es una herramienta matemática muy importante en nuestra vida cotidiana, con aplicaciones en prácticamente todos los ámbitos de la ciencia, la tecnología y la industria. Medicina, derecho, ingeniería, compañías aseguradoras, control de calidad, deporte, telecomunicaciones, informática, internet, y un largo etcétera que incluye incluso a la propia investigación científica.
Sin embargo, en esta entrada vamos a centrar nuestra atención en los peligros de un uso incorrecto de la misma en derecho, como una herramienta falaz, pero contundente, en manos del fiscal o los abogados que participan en un juicio, y las terribles consecuencias que puede tener para las personas implicadas. Para ello vamos a analizar algunos ejemplos de juicios reales extraídos de la literatura científica.
Pero para poder entender completamente de lo que estamos hablando, vamos a recordar brevemente qué es eso de la probabilidad condicionada.
Como todo el mundo sabe la probabilidad de que un evento ocurra se calcula dividiendo “el número de casos favorables” entre “el número de casos posibles”. Así, dada una determinada familia con dos “hijos”, si nos preguntamos cuál es la probabilidad de que los dos sean chicas, tendríamos que calcular primero el espacio muestral, es decir, el espacio de todos los casos posibles. En esta ocasión, habrá cuatro posibles casos (chica, chica), (chica, chico), (chico, chica) y (chico, chico), donde el orden en el par expresa el orden cronológico de nacimiento. Como solo uno de los cuatro es favorable, son dos chicas, la probabilidad de que los dos “hijos” sean chicas es 1/4 = 0,25, es decir, una probabilidad del 25%.
Sin embargo, pensemos que ahora nos preguntan cuál es la probabilidad de que esa familia tenga dos hijas si nos han informado que al menos uno de los “hijos” es una chica. Este es un ejemplo de probabilidad condicionada. Esta nos mide la probabilidad de que ocurra un cierto evento, llamémosle A, sabiendo que se ha producido otro cierto evento B, que en principio influye en el primero. Hablamos de la “probabilidad de A dado B”.
En el ejemplo de las dos chicas, si tenemos en cuenta la información adicional de que uno de los “hijos” es una chica, entonces el espacio muestral se reduce a solo tres posibilidades, (chica, chica), (chica, chico) y (chico, chica). Se han eliminado de la muestra los casos posibles que no se ajustan a la condición, que en este caso es solo (chico, chico). Si ahora miramos a ver cuántos casos son favorables dentro de los tres posibles, los dos “hijos” son chicas, observamos que de nuevo solo hay un caso favorable, luego la probabilidad de que esa familia tenga dos hijas sabiendo que al menos uno de los “hijos” es una chica es 1/3 = 0,33, es decir, un 33%. Como vemos es un resultado distinto al anterior, puesto que la cuestión, a través de la condición, es diferente.
Como es natural, si cambia la condición cambiará también la probabilidad condicionada. Volviendo al ejemplo de la familia con dos “hijos”, podemos pensar en una condición distinta. Supongamos que nos han informado de que el “hijo” que hace atletismo es una chica. La condición ahora ha cambiado puesto que no es que sepamos que un «hijo» es una chica, sino que sabemos que, de los dos «hijos», el que hace atletismo es una chica, cambia la condición, y la probabilidad condicionada que en este caso es 1/2. Esto se debe a que ahora la cuestión es que el otro «hijo», el que no hace atletismo, puede ser hijo o hija.
Una vez recordado el concepto de probabilidad condicionada, estamos en condiciones de analizar algunos juicios reales en los que se hizo un mal uso de la misma.
El mediático caso del juicio a O. J. Simpson. Seguramente muchas de las personas que estáis leyendo este texto recordaréis este caso que llenó una gran cantidad de horas en televisión y de páginas en los medios escritos de todo el mundo, pero para quienes no lo recordéis, os daré algunos datos del mismo.
O. J. Simpson era un ex jugador de fútbol americano retirado, había sido una de las grandes estrellas de este deporte, y tras retirarse inició su carrera como actor (apareció en películas como Capricornio uno y Agárralo como puedas, y en series como Raíces) y presentador de TV. Es decir, era una persona muy famosa.
Se le acusó del asesinato, el 12 de junio de 1994, de su ex mujer Nicole Brown y el amigo de esta, Ronald Goldman. El juicio fue ampliamente seguido por todos los medios de comunicación estadounidenses, pero también de muchas otras partes del planeta. De hecho, más de la mitad de la población de EEUU siguió el veredicto, que le declaró “no culpable”, a pesar de las muchas evidencias que la policía tenía de su culpabilidad y que el caro equipo de abogados que contrató O. J. Simpson consiguió desmontar, eliminando algunas pruebas a consecuencia de algunos errores policiales o mostrando a su cliente como una víctima de una conspiración de la policía que había colocado allí dichas evidencias.
A lo largo del juicio la fiscalía presentó pruebas de que el ex jugador de fútbol tenía un historial de violencia contra su ex mujer, lo cual ya era una buena razón para sospechar de él como el autor del asesinato de Nicole Brown y argumentó que un patrón de abuso reflejaba un patrón para matar.
Uno de los abogados de la defensa, Alan Dershowitz, argumentó que menos de 1 de cada 1.000 mujeres maltratadas muere a manos de sus parejas, o ex parejas, es decir, hay una probabilidad menor al 0,1% de que una mujer maltratada muera a manos de su (ex) pareja. Y concluía que “pocos hombres que abofetean o golpean a sus compañeras continúan hasta matarlas”, lo que, según sus palabras, era una evidencia de que el argumento de la fiscalía era erróneo y el maltrato no señalaba a O. J. Simpson como sospechoso de matar a su mujer.
El dato ofrecido por el abogado era correcto, pero no el razonamiento que exculpaba a su cliente. Ese dato no era el relevante para el juicio que se estaba celebrando, como el matemático John Allen Paulos puso de manifiesto en su libro Érase una vez un número y en la polémica en el New York Times a raíz de su publicación, en 1999, con Alan Dershowitz. La cuestión realmente importante (que es una probabilidad condicionada) era justo la contraria, si una mujer que ha sido víctima de maltrato, es después asesinada, cuál es la probabilidad de que el asesino sea su pareja, o ex pareja.
Según un informe del FBI un total de 4.936 mujeres fueron asesinadas en EEUU en 1992, de las cuales 1.432 lo fueron a manos de sus (ex) parejas, luego se puede realizar una estimación de la probabilidad de que una mujer asesinada (en EEUU, en esos años), lo haya sido de manos de su (ex) pareja es del 29% (1432 de cada 4936). ¡¡ Casi un tercio de las mujeres asesinadas, lo son de la mano de sus (ex) parejas!!
El dato anterior es significativo, pero ni siquiera esa era la cuestión relevante para el juicio (aunque obviamente sí desde un punto de vista social). La cuestión relevante en relación al juicio al ex jugador de fútbol americano O. J. Simpson era la siguiente: si una mujer que ha sufrido maltrato es después asesinada, cuál es la probabilidad de que el asesino sea su pareja, o ex pareja. Esa sí era la cuestión que importaba en el juicio.
En su artículo ¿Tendencia a abusar-tendencia a matar?, los matemáticos J. C. Merz y J. P. Caulkins realizaban una estimación (que nos vamos a saltar aquí) de esa probabilidad condicionada (en EEUU, en esa época), y llegaban a la conclusión de que era igual al 80%. Es decir, había una probabilidad del 80% de que el asesino de una mujer que ha sido víctima de maltratos sea su pareja, o ex pareja. Por otra parte, un informe sobre crímenes en EEUU citaba que “de todas las mujeres maltratadas asesinadas en EEUU en 1993, el 90% fueron asesinadas por el abusador”. Estas cifras eran las realmente relevantes en el juicio a O. J. Simpson, pero no fueron las que se tuvieron en cuenta.
Posteriormente, en 1997, O. J. Simpson sería declarado culpable de esas muertes en un juicio civil, y condenado a pagar 30 millones de dólares a las familias. Sin embargo, el ex jugador de fútbol americano ni estuvo en la cárcel por el asesinato de su ex mujer, ni pagó esos 30 millones. En la actualidad está en la cárcel, pero por un caso de robo y secuestro, de 2008, que nada tiene que ver con lo anterior.
El desgarrador caso de Sally Clark. La abogada británica Sally Clark perdió a su primer hijo cuando este tenía once semanas de vida (en diciembre de 1996). Se declaró que la muerte de su hijo se debía al “síndrome de la muerte súbita del lactante” (SMSL). El diagnóstico de muerte por SMSL se hace cuando se produce una muerte repentina e inesperada de un bebé menor de un año de edad y en la autopsia no se encuentra ninguna causa que explique la misma.
Al año siguiente, el matrimonio Clark, Sally y Steve, volvió a tener un hijo. Este murió ocho semanas después de su nacimiento (en enero de 1998), y de nuevo se declaró que la muerte era debida al SMSL. En ambos casos, la madre se encontraba sola en casa y los cuerpos de los niños presentaban traumatismos, que podían explicarse como consecuencia del intento de reanimarles por parte de su madre.
Un mes más tarde, Sally Clark fue detenida y acusada de asfixiar a sus dos hijos (inicialmente su marido también fue arrestado, pero fue posteriormente puesto en libertad, aunque estuvo al lado de su mujer en todo momento, y tuvieron a su tercer hijo durante el proceso judicial).
Durante el juicio, la acusación llamó a declarar a sir Roy Meadow, profesor de pediatría de la Universidad de Leeds, quien declaró que “la probabilidad de que un bebé muera del SMSL es de 1 entre 8.543, luego si multiplicas esta por sí misma, obtienes que la probabilidad de que dos bebés mueran del SMSL es de 1 entre 73 millones”, y que una doble muerte por SMSL no se producirá más que una vez cada cien años. A lo que el fiscal añadió que “esta [la probabilidad de dos muertes por SMSL] es extremadamente pequeña, lo que hace muy improbable que los bebés murieran de forma natural e implica poderosamente el asesinato”.
La fiscalía no presentó más evidencias de la culpabilidad de Sally Clark que el argumento estadístico anterior, de hecho no había ninguna evidencia de que fuese una mala madre, que hubiese desatendido a sus hijos o que fuera violenta. Finalmente, Sally Clark fue declarada culpable del asesinato de sus dos hijos e ingresó en prisión en noviembre de 1999.
Sin embargo, varios fueron los fallos estadísticos en el argumento del pediatra y la fiscalía.
1) Para calcular esa probabilidad de “1 entre 73 millones” de que dos bebés murieran por el síndrome de la muerte súbita del lactante, el profesor Meadow multiplicó la probabilidad de que un bebé muriese de ese síndrome, 1 entre 8.543, por sí misma. Pero eso implica que dos muertes por SMSL en una misma familia son sucesos independientes (como tirar dos veces una moneda al aire), sin embargo, pueden existir factores genéticos y medioambientales que predispongan a algunas familias a que se produzcan este tipo de muertes, por lo que un segundo caso de SMSL sería en tales familias más probable que en otras familias.
El matemático británico Ray Hill, utilizando datos de CESDI, The Confidential Enquiry for Stillbirths and Deaths in Infancy, del año 2.000, llegó a la conclusión de que dada una primera muerte por SMSL en una familia, la probabilidad de una segunda muerte se incrementaba entre 10 y 22 veces.
2) El segundo error tenía que ver con el dato ofrecido sobre la incidencia del síndrome de la muerte súbita del lactante. El profesor Meadow tuvo en cuenta el dato de que la probabilidad de que un bebé muera de SMSL es de 1 entre 8.543, pero este no es el dato genérico, sino para entornos familiares óptimos, es decir, familia de no fumadores, madre mejor de 26 años, que trabaje al menos uno de los progenitores, etcétera. Además, no tuvo en cuenta que hay diferencia entre niños y niñas. De hecho, la probabilidad genérica de que un bebé muera de SMSL es de 1 entre 1.300, y no, 8.543.
Por lo tanto, podríamos rehacer las cuentas del profesor Meadow. La probabilidad de que el primer hijo muriera de muerte súbita era de 1 entre 1.300 (1/1.300), mientras que para el segundo, atendiendo al análisis del profesor Hill, estaría en una horquilla de 1 entre 60 y 1 entre 130, por lo que tomemos aquí algo intermedio, 1 entre 100 (1/100). En conclusión, la probabilidad de que dos bebés mueran en una misma familia de SMSL sería de (1/1.300) x (1/100) = (1/130.000), es decir, 1 entre 130.000 (que es el 0,0007%).
Esa probabilidad sigue siendo muy pequeña, pero si tenemos en cuenta la gran cantidad de bebés que nacen al año en Gran Bretaña, más de 700.000 bebés, se van a producir más casos de familias con dos muertes por SMSL, como así ha ocurrido, e incluso, como le pasó a Sally Clark, con las madres acabando en la cárcel (por ejemplo, Donna Anthony –encarcelada en 1998 por el asesinato de sus dos bebés, un niño y una niña- o Angela Cannings –encarcelada en 2002 por el asesinato de sus dos hijos-, en los que también intervino el pediatra sir Roy Meadow).
3) Como ocurrió en el caso de O. J. Simpson, el fiscal y el jurado interpretaron el valor de la probabilidad de que dos bebés de una misma familia murieran por SMSL como la probabilidad de que Sally Clark fuese inocente. Como esa probabilidad era muy pequeña, era bastante improbable que esa mujer fuese inocente.
Sin embargo, de nuevo no era la probabilidad de que dos bebés de una familia murieran por el síndrome de la muerte súbita del lactante lo que importaba en el juicio, sino la probabilidad de que si dos bebés (en este caso niños) de una misma familia mueren, lo hagan por SMSL.
¿Cómo saber si esa probabilidad es grande o pequeña? Solo había dos posibles causas para explicar las muertes de los dos niños en esa familia, SMSL o asesinato. Por lo tanto, lo que necesitaba el jurado era comparar la probabilidad de que los dos niños murieran de muerte súbita con la probabilidad de que murieran asesinados. El matemático Ray Hill estimó que era 9 veces más probable que dos niños, de una misma familia, sean víctimas del SMSL, que sean víctimas de asesinato.
Los Clark apelaron la sentencia, para lo cual contrataron a dos profesores de estadística (uno de ellos Phillip Dawid, en cuya página web podemos encontrar su informe), sin embargo, perdieron la apelación. Pero continuaron luchando y buscando explicaciones médicas para las muertes de sus hijos. Entonces, descubrieron que el patólogo que había trabajado para la acusación había ocultado que su segundo hijo había sufrido una infección bacteriana en el momento de su muerte, y que podría ser la causa de la misma, por lo que habría sido una muerte natural. Se anuló su condena y, tras dos años y medio en prisión, fue puesta en libertad. Por desgracia, murió en 2007 por una intoxicación etílica.
A raíz de su caso, se revisaron los casos de otras mujeres en situaciones similares a Sally Clark, como por ejemplo las dos citadas anteriormente, Donna Anthony y Angela Cannings, que fueron puestas en libertad.
Estos son solamente dos ejemplos que ponen de manifiesto el peligro que puede tener el mal uso de la probabilidad y la estadística en un juicio, así como las terribles consecuencias del mismo. La solución, como en el caso de los falsos positivos, pasa por que las personas implicadas en estos juicios, abogados y jueces, tengan un mayor conocimiento de estos temas, pero también, y esto es esencial, por la contratación, siempre que sea necesario, de personas expertas en este tipo de cuestiones, con formación matemática, y más concretamente, con formación estadística.
En siguientes entradas del Cuaderno de Cultura Científica mostraremos algunos otros casos interesantes en relación a lo planteado en esta entrada.
Bibliografía
1.- John Allen Paulos, Érase una vez un número, Tusquets, 1999.
2.- Leonard Mlodinow, El andar del borracho, Crítica, 2008.
3.- D. Freedman, R. Pisani, R. Purves, A. Adhikari, Estadística, Antoni Bosch, 1991.
4.- J. C. Merz, J. P. Caulkins, Propensity to abuse-propensity to murder?, Chance 8, n.2, pag. 14, 1995.
5.- Ray Hill, Multiple sudden infant deaths – coincidence or beyond coincidence?, Pediatric and Perinatal Epidemiology 18, pag. 320-326, 2004.
6.- Información general sobre los casos judiciales de Sally Clark, Donna Anthony y Angela Cannings, o sobre el controvertido pediatra Roy Meadow, pueden encontrarse en wipidedia.
Sobre el autor: Raúl Ibáñez es profesor del Departamento de Matemáticas de la UPV/EHU y colaborador de la Cátedra de Cultura Científica
Nota del editor:
El autor ha tomado la decisión de modificar el artículo según se recoge a continuación y por los motivos que se exponen más abajo.
Se ha eliminado el ejemplo sobre cual es la probabilidad de que en una familia con dos «hijos», estos sean chicas, si suponemos «que nos han informado de que uno de los “hijos” es una chica que se llama Vanessa». Ha sido sustituido por el párrafo en el que se indica que el hijo que hace atletismo es una chica.
El argumento mostrado originalmente era erróneo ya que no consideraba algo esencial como las probabilidades de que una niña se llame Vanessa, y de que no se llame Vanessa. El resultado que se presentaba es el correcto, no así el argumento.
Esta entrada participa en la Edición 6.7: El punto del Carnaval de Matemáticas, alojado en el blog Matifutbol.
Alvaro
El cálculo de 33% en el párrafo 7 está mal. Si introduces el orden de nacimiento (que no hace falta porque no influye en el número de niñas que tiene la pareja) hay cuatro casos:
(chica-chico) (chico-chica) (chica1-chica2) (chica2-chica1), suponiendo que sabemos que la pareja tiene una «chica1»
Raúl Ibáñez
Perdón Alvaro, pero si incluyes «chica 1» «chica 2» te estás saliendo de la información que te suministra la condición «uno de los hijos es una chica», porque la condición no te fija cual de los hijos es… solo que uno es una chica…
Un abrazo, Raúl
Juan Carlos
Tal y como yo lo veo, nos dicen que al menos uno de los hermanos es una chica. Tendríamos que tener en cuenta los casos en que esa chica ha nacido en primer o en segundo lugar y ha tenido otra hermana. Entonces son dos casos favorables de cuatro. Vamos, que lo veo como Alvaro.
Raúl Ibáñez
Querido Juan Carlos, tu hablas de «esa chica» (que puede haber nacido la primera o la segunda), pero no se está fijando una chica, sino el hecho de que «uno de los hijos sea una chica»…
Alvaro
Pues lo mismo que cuando dices que hay una chica y un chico, pero no se dice en qué orden ha nacido. No entiendo por qué desdoblas el caso de chico-chica y no el de chica-chica.
Juan Carlos
Si tenemos dos cartas con dos imágenes posibles, chico o chica, y dándole la vuelta a una (cualquiera de ellas) descubrimos que es chica, la probabilidad de que la segunda sea chica es del 50%. Yo creo que es la misma situación del ejemplo. Saludos.
Pablo Jiménez
No, eso es lo que te dice la intuición, pero es falso. En ese caso también es 33%.
Y respecto a lo de chica1-chica2… no puedes introducir esa nomenclatura, porque cuando tú obtienes la información de que al menos un hijo/a es chica, no sabes si la hija en que el padre/madre piensa al dar la respuesta, en el caso (chica,chica), es la mayor o la menor.
La forma más rigurosa de tratar esto es con Bayes. Separar por casos a priori equiprobables y considerarlos también equiprobables después de quitar los que no cumplen la información recibida no es correcto en general, y da problemas (como en el problema de Monty Hall, valga la redundancia).
En particular, hay que tener en cuenta la «probabilidad condicionada inversa» de obtener la información que hemos obtenido, en cada caso considerado, y multiplicarla por la probabilidad a priori de cada caso. Cuando esta «condicionada inversa» es igual en todos los casos, omitirla no causa problema, pero en el resto de casos sí lo hace.
Alvaro
Y si no ha quedado claro en el comentario anterior.. al tener 2 posibilidades sobre 4, la probabilidad es del 50%, no del 33%
Raúl Ibáñez
Querido Alvaro, no estoy desdoblando el caso chico-chica y no el chica-chica… si el primer hijo es chico y el segundo chica tenemos el caso (chico, chica), si el primer hijo es chica y el segundo chico tenemos el caso (chica, chico), y si ambos hijos son chicas tenemos el caso (chica, chica), e igualmente para dos chicos… Un abrazo, R
Alvaro
Pero hay dos posibles casos para cuando son dos chicas. Porque ya que sabes que uno de los hijos es chica, y llamándola chica1, hay dos opciones, que nazca primero la chica1 y luego la chica2 o al revés.
Y si piensas que el orden no tiene nada que ver (como pienso yo), pues el caso de que nazca una chica y un chico ¡¡se queda en un solo caso posible!!
Los números de Fibonacci por todas partes
[…] “el número de casos posibles” (pueden leerse las entradas relacionadas con la probabilidad, La probabilidad en el banquillo de los acusados o El cuento de la ruleta rusa ). Así, dada una determinada familia con dos “hijos”, si nos […]
Fibonacci está en todas partes (y III) – meiker
[…] “el número de casos posibles” (pueden leerse las entradas relacionadas con la probabilidad, La probabilidad en el banquillo de los acusados o El cuento de la ruleta rusa ). Así, dada una determinada familia con dos “hijos”, si nos […]