La science économique au service de la société

Comment prendre des décisions dans un modèle dynamique ?

Lien court vers cet article : http://bit.ly/1SjhWgU

Xiaoxi Li et Xavier Venel

JPEG - 61.3 ko

Le modèle dit des « jeux stochastiques » a été introduit par Shapley en 1953 afin de simuler l’interaction entre plusieurs agents dans un modèle dynamique. Dans de nombreuses situations économiques, les décisions des agents ont une double influence : une influence sur leurs gains immédiats et une influence sur ceux qu’ils pourront obtenir dans le futur. En termes financier, les agents font face à un dilemme et doivent choisir entre maximiser leurs revenus, plus-values, etc. chaque jour, et s’assurer de pouvoir continuer à obtenir des gains jugés comme suffisants dans les jours suivants.

Dans cet article théorique, Xavier Venel et Xiaoxi Li s’intéressent au cas particulier des jeux récursifs à deux joueurs, et à sommes nulles (ce qui est gagné par l’un, est nécessairement perdu par l’autre). Dans ce modèle, il n’y a que deux agents aux objectifs parfaitement opposés qui interagissent de façon répétée. De plus, le jeu peut évoluer soit vers des états absorbants (1) que le processus ne quitte jamais, soit vers des états non-absorbants où le paiement vaut « 0 dollar » pour les deux agents. Ainsi le dilemme évoqué précédemment est simplifié car les agents n’ont pas à se préoccuper du paiement à l’état courant : chacun cherche à atteindre des états absorbants qui lui sont favorables.
Il y a plusieurs façons d’étudier ces jeux. Une première façon est de fixer une durée et de considérer la moyenne des paiements. Une deuxième façon consiste à fixer un taux d’escompte et de considérer la moyenne des paiements escomptés : un gain aujourd’hui est plus intéressant que le même gain demain (2). Dans chacun de ces cas, il existe un unique équilibre de Nash (3) qui dépend de l’état du monde initial. Dans les deux approches précédentes, les joueurs ne considèrent qu’un nombre fini d’état. En effet, même si toutes les étapes sont prises en compte dans le deuxième cas, le poids du futur devient négligeable. Une troisième approche, plus forte, consiste à définir des équilibres uniformes où chaque joueur cherche à garantir son paiement maximal en temps longs sans connaitre à priori la longueur du jeu. X. Venel et X. Li analysent ces modèles et démontrent que ces trois approches sont reliées par la notion de « convergence uniforme ». L’issue du jeu théorique moyen converge lorsque le nombre d’étapes tend vers l’infini si et seulement si l’issue du jeu théorique escompté converge lorsque les joueurs deviennent "patients" (4). En d’autre terme, à condition que le futur ait suffisamment de poids, la façon exacte (moyenne ou moyenne escomptée) dont les agents évaluent les gains influence peu l’équilibre. De plus, lorsque c’est le cas il existe un équilibre uniforme : les agents peuvent prendre des décisions optimales sans connaitre exactement le nombre d’étapes ou le taux d’escompte.

(1) Une fois atteint, l’état du monde ne change plus et les gains sont fixés
(2) Le taux d’escompte δ est fixé entre 0 et 1. Dans la moyenne escompté, le poids du gain de l’étape t est (1- δ)δ^t ainsi un gain de 1 dollar demain est équivalent à un gain de δ dollar aujourd’hui
(3) Point d’équilibre auquel les joueurs ne modifient plus leurs choix individuellement au risque d’affaiblir leur position personnelle
(4) On parle de « convergence uniforme » car la vitesse de convergence doit être indépendante de l’état initial


......................
Titre original de l’article académique : “Recursive games : uniform value, Tauberian theorem and the Mertens conjecture “Maxmin=lim vn(p) = lim vδ(p)’ ”
Publié dans : International Journal of Game Theory
Téléchargement : http://arxiv.org/abs/1506.00949

......................
© Jakub Jirsák - Fotolia.com