La teoría de juegos de cómo los algoritmos pueden hacer subir los precios

Quanta Magazine

Estudios recientes revelan que incluso los algoritmos de fijación de precios más simples pueden encarecer las cosas.

Un artículo de Ben Brubaker. Historia original reimpresa con permiso de Quanta Magazine, una publicación editorialmente independiente respaldada por la Fundación Simons.

precios
Ilustración: Nash Weerasekera / Quanta Magazine

Imagina un pueblo con dos comerciantes de utensilios. Los clientes prefieren el utensilio más barato, así que los comerciantes compiten fijando precios bajos. Descontentos con sus escasas ganancias, se reúnen una noche en una taberna llena de humo para discutir un plan secreto: si suben los precios juntos en lugar de competir, ambos podrían ganar más. Pero ese tipo de acuerdo intencionado sobre precios, llamado colusión, lleva más de un siglo prohibido. Los comerciantes deciden no arriesgarse y todo el mundo sigue disfrutando de utensilios baratos.

Durante más de un siglo, la legislación estadounidense ha seguido este esquema básico: prohibir esos tratos a puerta cerrada y con ello preservar unos precios justos. Hoy no es tan sencillo. En amplios sectores de la economía los vendedores dependen cada vez más de programas informáticos llamados algoritmos de aprendizaje, que ajustan los precios de forma iterada en función de nuevos datos sobre el mercado. A menudo son mucho más simples que los algoritmos de “aprendizaje profundo” que impulsa la inteligencia artificial moderna, pero aun así pueden comportarse de formas inesperadas.

Entonces, ¿cómo pueden los reguladores garantizar que los algoritmos fijan precios justos? Su enfoque tradicional no servirá, porque se basa en encontrar una colusión explícita. “Los algoritmos desde luego no se están tomando copas juntos”, apunta Aaron Roth, científico informático de la Universidad de Pennsylvania.

Sin embargo, un artículo muy citado de 2019 mostró que los algoritmos podían aprender a coludir de forma tácita, incluso cuando no estaban programados para ello. Un equipo de investigadores enfrentó dos copias de un algoritmo de aprendizaje simple en un mercado simulado y les dejó explorar distintas estrategias para aumentar sus beneficios. Con el tiempo, cada algoritmo aprendió por ensayo y error a castigar cuando el otro bajaba los precios: respondía reduciendo su propio precio en una cuantía enorme y desproporcionada. El resultado final fue precios elevados, sostenidos por la amenaza mutua de una guerra de precios.

precios
Aaron Roth sospecha que los problemas de la fijación de precios algorítmica podrían no tener una solución sencilla. «La conclusión de nuestro estudio es que resulta difícil determinar qué descartar», afirma. Foto cortesía de Aaron Roth

Las amenazas implícitas como esta también están en la base de muchos casos de colusión humana. Así que, si quieres garantizar precios justos, ¿por qué no exigir que los vendedores utilicen algoritmos incapaces de hacer amenazas?

En un trabajo reciente, Roth y otros cuatro científicos informáticos mostraron por qué eso puede no ser suficiente. Probaron que incluso algoritmos aparentemente benignos que optimizan su propio beneficio pueden a veces dar lugar a resultados perjudiciales para los compradores. “Aun así puedes obtener precios altos de maneras que, desde fuera, parecen razonables”, explica Natalie Collina, estudiante de posgrado que trabaja con Roth y coautora del nuevo estudio.

No todos los investigadores coinciden en las implicaciones del hallazgo —mucho depende de cómo se defina “razonable”—. Pero la investigación revela lo sutiles que pueden ser las cuestiones sobre fijación algorítmica de precios y lo difícil que puede resultar regularlas.

“Sin alguna sospecha de amenaza o de un acuerdo, es muy difícil que un regulador pueda entrar y decir: ‘Estos precios no parecen correctos’”, afirma Mallesh Pai, economista de la Universidad Rice. “Por eso creo que este artículo es importante.”

Sin arrepentimiento

El trabajo reciente estudia la fijación algorítmica de precios desde la óptica de la teoría de juegos, un campo interdisciplinar en la frontera entre la economía y la informática que analiza las matemáticas de las competiciones estratégicas. Es una forma de explorar los errores de los algoritmos de precios en un entorno controlado.

“Lo que intentamos hacer es crear colusión en el laboratorio”, explica Joseph Harrington, economista de la Universidad de Pennsylvania que escribió un influyente artículo de revisión sobre la regulación de la colusión algorítmica y que no ha participado en la nueva investigación. “Una vez que lo hacemos, queremos averiguar cómo destruir esa colusión.”

precios
Natalie Collina y sus colegas han descubierto que los precios altos pueden surgir de maneras inesperadas. Foto: Nandan Tumu

Para entender las ideas clave conviene empezar con el simple juego de piedra-papel-tijera. Un algoritmo de aprendizaje, en este contexto, puede ser cualquier estrategia que un jugador use para elegir una jugada en cada ronda basándose en los datos de rondas anteriores. Los jugadores pueden probar distintas estrategias a lo largo del juego. Pero si juegan bien, acabarán convergiendo a un estado que los teóricos de juegos llaman equilibrio. En equilibrio, la estrategia de cada jugador es la mejor respuesta posible a la estrategia del otro, por lo que ninguno tiene incentivo a cambiar.

En piedra-papel-tijera, la estrategia ideal es sencilla: hay que jugar una jugada aleatoria cada ronda, escogiendo las tres posibilidades con la misma frecuencia. Los algoritmos de aprendizaje destacan cuando un jugador adopta un enfoque distinto. En ese caso, elegir jugadas en función de rondas anteriores puede ayudar al otro jugador a ganar más a menudo que si jugara al azar.

Supón, por ejemplo, que tras muchas rondas detectas que tu oponente —un geólogo— eligió piedra más del 50% de las veces. Si hubieras jugado papel cada ronda, habrías ganado más. Los teóricos de juegos se refieren a esta dolorosa constatación como arrepentimiento.

Los investigadores han diseñado algoritmos de aprendizaje sencillos que garantizan siempre que acabarás con arrepentimiento cero. Algoritmos de aprendizaje algo más sofisticados, llamados algoritmos “sin arrepentimiento por intercambio” (no-swap-regret), también garantizan que cualquiera que sea la acción de tu oponente, no podrías haberlo hecho mejor sustituyendo todas las ocurrencias de una jugada por otra (por ejemplo, jugando papel cada vez que en realidad jugaste tijera). En 2000, teóricos de juegos demostraron que, si enfrentas dos algoritmos sin arrepentimiento por intercambio en cualquier juego, acabarán en un tipo específico de equilibrio —uno que sería el equilibrio óptimo si solo jugaran una única ronda. Esa propiedad es atractiva porque los juegos de una sola ronda son mucho más simples que los de varias rondas. En particular porque las amenazas no funcionan ya que los jugadores no pueden ejecutarlas.

En un artículo de 2024, Jason Hartline, informático de la Universidad Northwestern, y dos estudiantes de posgrado tradujeron los resultados clásicos de 2000 a un modelo de mercado competitivo, donde los jugadores pueden fijar precios nuevos cada ronda. En ese contexto, los resultados implicaban que dos algoritmos sin arrepentimiento por intercambio se acabarían encontrando en precios competitivos cuando alcanzaran el equilibrio. La colusión sería imposible.

Sin embargo, los algoritmos sin arrepentimiento por intercambio no son las únicas estrategias de fijación de precios en los mercados en línea. ¿Qué ocurre cuando un algoritmo sin arrepentimiento por intercambio se enfrenta a un oponente distinto que también parece benigno?

El precio está equivocado

Según los teóricos de juegos, la mejor estrategia para jugar contra un algoritmo sin arrepentimiento por intercambio es simple: empieza con una probabilidad concreta para cada posible acción y, luego, en cada ronda elige una sola acción al azar, sin importar lo que haga tu oponente. La asignación ideal de probabilidades para este enfoque “no reactivo” depende del juego específico.

En el verano de 2024, Collina y su colega Eshwar Arunachaleswaran se propusieron encontrar esas probabilidades óptimas para un juego de fijación de precios entre dos jugadores. Hallaron que la mejor estrategia asignaba probabilidades sorprendentemente altas a precios muy elevados, junto con probabilidades menores distribuidas en una amplia gama de precios bajos. Si juegas contra un algoritmo sin arrepentimiento por intercambio, esta extraña estrategia maximizará tu beneficio. “Para mí fue una sorpresa total”, cuenta Arunachaleswaran.

precios
Eshwar Arunachaleswaran y Collina obtuvieron su resultado al explorar las mejores respuestas a algoritmos de precios bien definidos. Foto: Paritosh Verma

Las estrategias no reactivas parecen superficialmente inocuas. No pueden transmitir amenazas, porque no reaccionan a las jugadas del rival en absoluto. Pero pueden inducir a los algoritmos de aprendizaje a subir sus precios, y luego aprovecharse ocasionalmente vendiendo más barato que el competidor.

Al principio, Collina y Arunachaleswaran pensaron que este escenario artificial no sería relevante en el mundo real. Seguro que el jugador que usara el algoritmo sin arrepentimiento por intercambio cambiaría a otro algoritmo en cuanto se diera cuenta de que su competidor estaba obteniendo beneficios a su costa.

Pero al profundizar y al discutirlo con Roth y otros dos colegas, se dieron cuenta de que su intuición era errónea. Los dos jugadores en su escenario ya estaban en un estado de equilibrio. Sus beneficios eran casi iguales, y ambos eran tan altos como podían ser siempre que ninguno cambiara de algoritmo. Ninguno tenía incentivo a cambiar de estrategia, así que los compradores se quedarían atrapados con precios altos. Además, las probabilidades precisas no eran tan importantes. Muchas elecciones distintas conducían a precios elevados cuando se enfrentaban a un algoritmo sin arrepentimiento por intercambio. Es un resultado que cabría esperar de una colusión, pero sin que se viera ningún comportamiento colusorio.

Conviene ser tonto

¿Y qué pueden hacer los reguladores? Roth admite que no tiene respuesta. No tendría sentido prohibir los algoritmos sin arrepentimiento por intercambio: si todos usaran uno, los precios caerían. Pero una simple estrategia no reactiva podría ser una elección natural para un vendedor en un mercado en línea como Amazon, aunque conlleve el riesgo de arrepentimiento.

“Una forma de tener arrepentimiento es simplemente ser un poco tonto”, afirma Roth. “Históricamente, eso no ha sido ilegal.”

Para Hartline, el problema de la colusión algorítmica tiene una solución simple: prohibir todos los algoritmos de fijación de precios excepto los algoritmos sin arrepentimiento por intercambio que los teóricos de juegos han venido recomendando. Puede haber formas prácticas de hacerlo: en su trabajo de 2024, Hartline y sus colegas idearon un método para comprobar si un algoritmo tiene la propiedad de sin arrepentimiento por intercambio sin mirar su código.

Hartline reconoció que su solución preferida no evitaría todos los malos resultados cuando algoritmos sin arrepentimiento por intercambio compitieran con humanos. Pero sostiene que escenarios como el del trabajo de Roth no son casos de colusión algorítmica.

“La colusión es algo de doble vía”, dijo. “Fundamentalmente debe ser posible que un único jugador haga algo para no coludir.”

Sea como fuere, el nuevo trabajo deja muchas preguntas abiertas sobre cómo puede fallar la fijación de precios algorítmica en el mundo real.

“Aún no entendemos ni de lejos todo lo que quisiéramos”, dico Pai. “Es una cuestión importante para nuestro tiempo.”


El artículo original, The Game Theory of How Algorithms Can Drive Up Prices, se publicó el 22 de octubre de 2025 en Quanta Magazine.

Traducido por César Tomé López

Deja una respuesta

Tu dirección de correo electrónico no será publicada.Los campos obligatorios están marcados con *