Th´eorie des jeux Introduction et th´eorie de la d´ecision
1/
Th´eorie des jeux
Fr´ed´eric Koessler
frederic[point]koessler[at]gmail[point]com
http ://frederic.koessler.free.fr/cours.htm
Plan g´en´eral du cours
(22 juillet 2008)
– Introduction et th´eorie de la d´ecision individuelle
– Jeux sous forme normale
– Information incompl`ete et jeux Bay´esiens
– Th´eorie des jeux comportementale (´economie exp´erimentale)
– Jeux sous forme extensive
– Jeux r´ep´et´es
2/
Manuels
– Demange et Ponssard (1994) : “Th´eorie des jeux et analyse ´economique”
– Mas-Colell et al. (1995) : “Microeconomic Theory”, chap. 6–9
– Myerson (1991) : “Game Theory : Analysis of Conflict”
– Osborne et Rubinstein (1994) : “A Course in Game Theory”
Pour des introductions plus ´el´ementaires :
– Gibbons (1992) : “Game Theory for Applied Economists”
– Kreps (1999) : “Th´eorie des jeux et mod´elisation ´economique”
– Osborne (2004) : “An Introduction to Game Theory”
– Umbhauer (2002, 2004) : “Th´eorie des jeux” et “Th´eorie des jeux appliqu´ee `a
la gestion”
– Yildizoglu (2003) : “Introduction `a la th´eorie des jeux”
– Cavagnac (2006) : “Th´eorie des jeux”
Th´eorie des jeux Introduction et th´eorie de la d´ecision
3/
Pour la th´eorie des jeux comportementale (exp´erimentale) :
– Camerer (2003) : “Behavioral Game Theory : Experiments on Strategic
Interaction”
Approches informelles et ´etudes de cas :
– Dixit et Nalebuff (1991) : “Thinking Strategically”
– Nalebuff et Brandenburger (1996) : “Co-opetition”
Livres de vulgarisation et/ou historiques :
– M´er¨o (2000) : “Les al´eas de la raison”
– Nasar (2001) : “A Beautiful Mind : The Life of Mathematical Genius and Nobel
Laureate John Nash”
– Poundstone (2003) : “Le dilemme du prisonnier : Von Neumann, la th´eorie des
jeux et la bombe”
4/
Th´eorie des jeux = th´eorie de la d´ecision (rationnelle) d’agents strat´egiquement
interd´ependants, c’est-`a-dire qui s’influencent les uns les autres et qui ont
conscience de ces influences r´eciproques
+ Th´eorie de la d´ecision interactive
+ Analyse des conflits
+ Science de la strat´egie
Jeux = situations de d´ecisions interactives dans lesquelles l’utilit´e (bien-ˆetre) de
chaque individu d´epend des d´ecisions des autres individus
+ Probl`emes ´economiques, sociaux, politiques, diplomatiques et militaires
+ Ordre naturel (interaction entre les esp`eces/g`enes)
Th´eorie des jeux Introduction et th´eorie de la d´ecision
5/
Exemples.
– Concurrence imparfaite : les prix ne sont pas donn´es mais sont les cons´equences
des d´ecisions des agents
– Ench`ere : l’issue (i.e., le gagnant et le prix qu’il a pay´e) d´epend des actions de
tous les ench´erisseurs et du type d’ench`ere utilis´ee par l’organisateur
– Comp´etition ´electorale
– D´ecisions de membres d’un jury sur un verdict
– Macro´economie ouverte : coordination internationale des politiques ´economiques
– Animaux chassant une proie
å Pas n´ecessairement de conflits purs ; jeux `a somme non nulle vs. jeux `a
somme nulle . . . image (issue “perdante-perdante”) . . .
6/
3 grands th`emes en th´eorie des jeux
(1) La th´eorie des jeux non-coop´eratifs ou strat´egiques
– Jeux sous forme normale (strat´egique) / sous forme extensive (d´evelopp´ee)
– Jeux `a information parfaite / information imparfaite
(2) La th´eorie des jeux coop´eratifs ou coalitionnels
(3) Le choix social, la th´eorie de l’impl´ementation et des m´ecanismes
(1) è joueurs ind´ependants, strat´egies, pr´ef´erences / description d´etaill´ee +
notion d’´equilibre
(2) è coalitions, valeurs des coalitions, contrats contraignants / approche
axiomatique
(3) è on modifie les param`etres du jeu (r`egles, transferts, . . . ) afin d’obtenir des
solutions qui v´erifient des propri´et´es globales souhait´ees (la Pareto-optimalit´e,
certains crit`eres de justice, la protection de l’environnement, . . . )
Th´eorie des jeux Introduction et th´eorie de la d´ecision
7/
Premier exemple : Bus ou voiture ?
N = [0, 1] = population d’une ville (les joueurs)
Choix de chaque joueur : “prendre la voiture” ou “prendre le bus” (les actions)
x % prennent le bus ⇒ utilit´es u(B, x), u(V, x) (les pr´ef´erences)
u(V, ·)
u(B, ·)
0 100
% d’individus
x en bus
w
´E
quilibre
wOptimum social
u(V, x) > u(B, x) pour tout x ⇒ tout le monde prend la voiture (x = 0)
⇒ u(V, 0) pour tous ⇒ inefficace car si tout le monde prenait le bus (x = 100)
le niveau de satisfaction de tous les individus serait plus important
(u(B, 100) > u(V, 0))
8/
Politique de transport (p´eages, lignes de bus, . . . )
à nouvelle configuration
u(V, ·)
u(B, ·)
% d’individus
x x en bus ′ x∗
0 100
w
à nouvel ´equilibre (de Nash) plus efficace (mais pas Pareto optimal)
Th´eorie des jeux Introduction et th´eorie de la d´ecision
9/
Configuration alternative : multiplicit´e d’´equilibres
-
6 6
0 100
% d’individus
en bus
u(V, ·)
u(B, ·)
A
B
C
w
w
w
A : ´equilibre stable et inefficace (Pareto domin´e)
B : ´equilibre instable et inefficace (Pareto domin´e)
C : ´equilibre stable et Pareto optimal
10/
- D´eterminez les ´equilibres (de Nash) dans la configuration suivante. Lesquels
sont stables ? Lesquels sont Pareto optimaux ?
-
6 6
0 100
% de joueurs
en bus
u(B, ·)
u(V, ·)
Th´eorie des jeux Introduction et th´eorie de la d´ecision
11/
Deuxi`eme exemple : Partage de gˆateau
N = {1, 2} = deux enfants (les joueurs)
Le premier enfant d´ecoupe le gˆateau en deux parts puis laisse le deuxi`eme enfant
choisir son morceau (les r`egles : actions, d´eroulement, . . . )
Objectif de chaque enfant : avoir la plus grosse part (les pr´ef´erences)
å Diagramme de tous les coups possibles :
Arbre de jeu ou jeu sous forme extensive
12/
Parts in´egales
Parts ´egales
Premier enfant
la + petite part
≃ moiti´e
la + grosse part
≃ moiti´e
Deuxi`eme enfant
la + petite part
grosse part
pour le premier
la + grosse part
petite part
pour le premier
Deuxi`eme enfant
Th´eorie des jeux Introduction et th´eorie de la d´ecision
13/
Meilleure strat´egie du premier enfant : essayer de partager le gˆateau de mani`ere
´egale
à Solution ´equitable, mais ne doit rien `a la g´en´erosit´e, l’altruisme ou `a un sens
de l’´equit´e (chacun poursuit rationnellement son int´erˆet personnel)
14/
Autre repr´esentation possible :
Tableau de r´esultat ou jeu sous forme strat´egique/normale
• Strat´egies du premier enfant :
E = faire des parts (`a peu pr`es) ´egales I = faire des part in´egales
• Strat´egies du deuxi`eme enfant :
G = toujours prendre la plus grosse part P = toujours prendre la plus petite
part
(P | E, G | I) = prendre la plus grosse part seulement si les parts sont in´egales
(G | E, P | I) = prendre la plus grosse part (de quelques miettes) seulement si les
parts sont ´egales
1er enfant
2`eme enfant
G P (P | E, G | I) (G | E, P | I)
E ≃ moiti´e ≃ moiti´e ≃ moiti´e ≃ moiti´e
I petite part grosse part petite part grosse part
Th´eorie des jeux Introduction et th´eorie de la d´ecision
15/
- Autre exemple simple (sauf pour Charlie Brown) d’induction `a rebours :
Ordre r´eel des d´ecisions et anticipation de la r´eponse de son rival : image
– Repr´esentez la situation sous la forme d’arbre de jeu (jeu sous forme extensive)
et d´eterminez les strat´egies optimales des joueurs
– Repr´esentez la situation sous la forme d’un tableau de r´esultat (jeu sous forme
normale)
16/
Troisi`eme exemple : Valeur strat´egique de l’information
Deux firmes
Deux projets possibles : a et b
La firme 1 choisit un des deux projets, puis la firme 2 choisit un des deux projets
apr`es avoir observ´e le choix de la firme 1
Deux ´etats/situations possibles, ´equiprobables (Pr[] = Pr[] = 1/2) :
: Seul le projet a est rentable
: Seul le projet b est rentable
• Firmes 1 et 2 non inform´ees.
Th´eorie des jeux Introduction et th´eorie de la d´ecision
17/
Arbre de jeu :
Projet b
Projet a
Firme 1
Projet b
(6, 0) si
(0, 6) si
→ (3, 3)
Projet a
(2, 2) si
(0, 0) si
→ (1, 1)
Firme 2
Projet b
(0, 0) si
(2, 2) si
→ (1, 1)
Projet a
(0, 6) si
(6, 0) si
→ (3, 3)
Firme 2
à La firme 2 choisit toujours un projet diff´erent de la firme 1, donc l’utilit´e
esp´er´ee de chaque firme est ´egale `a 3
18/
• Firme 1 inform´ee et firme 2 non inform´ee.
Arbre de jeu (`a information imparfaite) :
Nature
b
a
Firme 1
b
a
Firme 1
Firme 2
b Firme 2
(6, 0)
a
(2, 2)
b
(0, 6)
a
(0, 0)
b
(0, 0)
a
(0, 6)
b
(2, 2)
a
(6, 0)
à La firme 2 choisit le mˆeme projet que la firme 1, donc l’utilit´e esp´er´ee de
chaque firme est ´egale `a 2 < 3
à Valeur strat´egique de l’information n´egative pour la firme 1 ! (6= probl`eme de
d´ecision individuelle). Mais la firme 2 sait que la firme 1 sait . . .
Th´eorie des jeux Introduction et th´eorie de la d´ecision
19/
D´efinition g´en´erale d’un jeu
– L’ensemble des joueurs
– Les r`egles du jeu (qui peut faire quoi et quand)
– L’information dont disposent les joueurs (sur le nombre de joueurs, les r`egles,
les pr´ef´erences, et l’information des autres)
– Les pr´ef´erences des joueurs sur les enchaˆınements d’actions et leurs issues.
G´en´eralement, fonctions d’utilit´e esp´er´ees de type von Neumann et Morgenstern
Th´eorie des jeux 6= optimisation, th´eorie de la d´ecision
– R´esolution du jeu non automatique : concept de solution et solution elle-mˆeme
rarement uniques
– Probl`eme de la d´efinition circulaire de la rationalit´e
– Probl`eme des connaissances it´er´ees
⇒ quels concepts de solution “raisonnables” ?
Hypoth`eses courantes : Rationalit´e (pr´ef´erences rationnelles / maximisation de
l’utilit´e) et “Intelligence”
20/
Historique
– Cournot (1838, Chap. 7) : ´equilibre en duopole
– Edgeworth (1881) : courbe de contrat, concept de “coeur”
– Darwin (1871) : biologie ´evolutionniste, s´election naturelle
– Zermelo (1913) : positions gagnantes dans le jeu d’´echec
– Emile Borel (1921) : strat´egie mixte (al´eatoire)
– Von Neumann (1928) : th´eor`eme de maximin (comp´etition pure `a deux joueurs)
– Von Neumann et Morgenstern (1944), “Theory of Games and Economic
Behavior”
– Nash (1950b, 1951) : notion d’´equilibre, jeux g´en´eraux
– Nash (1950a, 1953) : solution de n´egociation
– Shapley (1952–1953) : “coeur” et valeur d’un jeu coop´eratif
– Aumann (1959) : jeux r´ep´et´es et “folk theorems”
Th´eorie des jeux Introduction et th´eorie de la d´ecision
21/
– Selten (1965, 1975), Kreps et Wilson (1982) : raffinements d’´equilibre
– Harsanyi (1967–1968) : information asym´etrique (espace des types)
– Aumann et Maschler (1966, 1967); Stearns (1967); Aumann et al. (1968) : jeux
r´ep´et´es `a information incompl`ete
– Aumann (1974, 1987) : ´equilibre corr´el´e, justification ´epist´emique des ´equilibres
– Lewis (1969), Aumann (1976) : connaissance commune
– Hurwicz, Maskin et Myerson (prix Nobel d’´economie 2007) : Th´eorie des
m´ecanismes
22/
Th´eorie de la d´ecision
Pr´e-requis `a l’analyse des d´ecisions interactives (jeux) : connaˆıtre les fondements
th´eoriques et les outils permettant l’analyse des d´ecisions individuelles
(rationnelles) dans les situations incertaines/risqu´ees, c’est-`a-dire dont les
cons´equences ne sont pas parfaitement connues par le preneur de d´ecision.
Environnement certain : Pr´ef´erence sur les cons´equences C
Environnement incertain : Pr´ef´erence sur les loteries L = (C)
Exemple de loterie (jeu de la roulette) :
Ensemble des cases possibles = {00, 0, 1, . . . , 36} (probabilit´e 1/38 pour chaque
case)
Th´eorie des jeux Introduction et th´eorie de la d´ecision
23/
Consid´erons les deux alternatives suivantes :
• a : Parier 10 e sur pair
• a′ : Ne pas parier
à Cons´equences C = {−10, 0, 10}
Loteries induites par les alternatives a et a′ :
20
38 −10
18
38
10
0
L 0
0
−10
0
10
1
et L 0 ′
24/
Premier crit`ere de d´ecision qui vient `a l’esprit pour l’´evaluation d’une alternative
ayant des cons´equences mon´etaires incertaines : l’esp´erance math´ematique ou
valeur actuarielle : X
i
pi xi
20
38 −10
18
38
10
0
L 0
0
−10
0
10
1
L 0 ′
E(L) =
18
38
10 −
20
38
10 = −
20
38
E(L′) = 0
Th´eorie des jeux Introduction et th´eorie de la d´ecision
25/
Exemple : Assurance. Une maison d’une valeur de 1000 peut brˆuler (´etat b) avec
probabilit´e 1/10 et ne pas brˆuler (´etat n) avec probabilit´e 9/10 :
= {b, n}, (b) = 1/10, (n) = 9/10
Consid´erons les trois alternatives (actes) a, a′ et a′′ suivantes :
• Ne pas s’assurer : a(!) =
0 si ! = b
1000 si ! = n
• Assurance totale (prime = 100) : a′(!) = 900 pour tout ! ∈
• Assurance avec franchise (prime = 70, franchise = 300) :
a′′(!) =
630 si ! = b
930 si ! = n
à Cons´equences C = {0, 630, 900, 930, 1000}
Loteries induites par les actes a, a′ et a′′ :
L =
1
10
, 0, 0, 0,
9
10
L′ = (0, 0, 1, 0, 0) L′′ =
0,
1
10
, 0,
9
10
, 0
26/
Inconv´enients de l’esp´erance math´ematique :
– Pas de prise en compte de l’attitude vis-`a-vis du risque du d´ecideur
– Cons´equences mon´etaires uniquement
– Paradoxe de Saint-P´etersbourg
Paradoxe de Saint-P´etersbourg
Une pi`ece de monnaie ´equilibr´ee est lanc´ee `a r´ep´etition tant que pile se r´ealise
D`es que face se r´ealise au k-i`eme jet le gain est de 2k euros
Esp´erance math´ematique de gain pour ce pari :
∞X
k=1
1
2k 2k = 1 + 1 + 1 + · · · = ∞
Pourtant la valeur attribu´ee `a ce pari par la plupart des gens est bien en-dessous
de 100 et mˆeme de 10 euros . . .
Th´eorie des jeux Introduction et th´eorie de la d´ecision
27/
En 1738 Daniel Bernoulli (1700–1782) propose d’int´egrer le fait que les agents ont
une utilit´e (satisfaction) marginale d´ecroissante pour la monnaie et ´evaluent un
pari par l’esp´erance de l’utilit´e des diff´erentes cons´equences
Par exemple, l’esp´erance math´ematique du logarithme du gain :
∞X
k=1
1
2k ln(2k) = (ln 2)
∞X
k=1
k
1
2
k
= (ln 2)
"
2
∞X
k=1
k
1
2
k
−
∞X
k=1
k
1
2
k
#
= (ln 2)
"
∞X
k=0
(k + 1)
1
2
k
−
∞X
k=1
k
1
2
k
#
= (ln 2)
"
1 +
∞X
k=1
1
2
k
#
= ln 4
⇒ Valeur d’un montant mon´etaire certain de 4 euros
28/
Critiques de la suggestion de Bernoulli :
– Pourquoi ln ? (ad hoc, il existe une infinit´e de fonctions croissantes `a taux
d´ecroissant)
– Pourquoi la mˆeme forme pour chaque individu ?
– Pourquoi la d´ecision doit-elle ˆetre bas´ee sur la valeur esp´er´ee des utilit´es ?
– La valeur esp´er´ee est justifi´ee `a long terme, si le pari est r´ep´et´e un grand
nombre de fois. Mais pourquoi peut-on l’appliquer si l’individu participe une
seule fois au jeu ?
1944 : von Neumann et Morgenstern fournissent une axiomatique rigoureuse
g´en´eralisant la solution propos´ee par Bernoulli
Th´eorie des jeux Introduction et th´eorie de la d´ecision
29/
Fig. 1 – John von Neumann (1903–1957)
30/
Id´ee de la construction de vNM :
Supposons
A ≻ B ≻ C
Dans un environnement certain, toutes les valeurs a > b > c sont des indices
appropri´es pour repr´esenter cette pr´ef´erence ordinale
Introduisons les paris
1
L B
1 − p
C
p
A
et L′
et supposons L L′ ⇔ p ≤ 2/3
Th´eorie des jeux Introduction et th´eorie de la d´ecision
31/
Alors, on se restreint aux indices d’utilit´e
a >
2
3
a +
1
3
c > c
et on a
u(B) − u(C) = 2[u(A) − u(B)] =
2
3
(a − c)
Ces diff´erences d’utilit´es lors du passage d’une cons´equence `a une autre
repr´esentent l’attitude vis-`a-vis du risque de l’individu, et non une amplitude de
satisfaction
32/
Hypoth`eses de von Neumann et Morgenstern :
– Rationalit´e, ou pr´eordre complet.
– Compl´etude. Pour tout L, L′ ∈ L, on a L L′ ou L′ L (ou les deux)
– Transitivit´e. Pour tout L, L′, L′′ ∈ L, si L L′ et L′ L′′, alors L L′′
– Continuit´e. Pour tout L, L′, L′′ ∈ L, les ensembles
{ ∈ [0, 1] : L + (1 − )L′ L′′}
et { ∈ [0, 1] : L′′ L + (1 − )L′}
sont ferm´es. (L L′ L′′ ⇒ ∃ ∈ [0, 1], L + (1 − )L′′ ∼ L′)
– Axiome d’ind´ependance. Pour tout L, L′, L′′ ∈ L et ∈ (0, 1) on a
L L′ ⇔ L + (1 − )L′′ L′ + (1 − )L′′
Th´eorie des jeux Introduction et th´eorie de la d´ecision
33/
Th´eor`eme de von Neumann et Morgenstern.
Si la relation de pr´ef´erence sur l’espace des loteries L est rationnelle, continue,
et v´erifie l’axiome d’ind´ependance, alors elle admet une repr´esentation sous la
forme d’utilit´e esp´er´ee de VNM
Autrement dit, on peut assigner des valeurs u(c) aux diff´erentes cons´equences
c ∈ C de sorte que pour toutes loteries L = (p1, . . . , pC) et L′ = (p′
1, . . . , p′
C) on a
L L′ ⇔
X
c∈C
pc u(c)
| {z }
U(L)
≥
X
c∈C
p′
c u(c)
| {z }
U(L′)
Propri´et´e. Une fonction d’utilit´e U : L → R a la forme d’utilit´e esp´er´ee de VNM
si et seulement si elle est lin´eaire par rapport aux probabilit´es, c’est-`a-dire
U
XK
k=1
k Lk
!
=
XK
k=1
k U(Lk),
pour toutes loteries (Lk)k et probabilit´es (k)k, avec
PK
k=1 k = 1
34/
Propri´et´e. (Cardinalit´e) Soit U : L → R une fonction d’utilit´e esp´er´ee de VNM
pour la relation de pr´ef´erence sur L. La fonction eU : L → R est une autre
fonction d’utilit´e esp´er´ee de VNM pour si et seulement si il existe > 0 et
∈ R tels que
eU(L) = U(L) +
pour tout L ∈ L.
Cons´equences mon´etaires : Loterie = variable al´eatoire repr´esent´ee par une
fonction de r´epartition F
Par exemple, la loterie `a trois cons´equences mon´etaires possibles suivante
1
2 50 e
1
4
20 e
1
4
L 30 e a la fonction de r´epartition F(x) =
0 si x < 20
1/4 si x ∈ [20, 30)
1/2 si x ∈ [30, 50)
1 si x ≥ 50
Th´eorie des jeux Introduction et th´eorie de la d´ecision
35/
x
0 20 e 30 e 50 e
1
4
1
2
1
F
r
r
r
36/
Dans ce cadre une loterie (fonction de r´epartition) F est ´evalu´ee par l’agent `a
l’aide d’une fonction d’utilit´e esp´er´ee de VNM ayant la forme
U(F) =
Z
C
u(c) dF(c)
=
Z
C
u(c)f(c) dc si la densit´e f existe
Remarques.
• Distinguer la fonction d’utilit´e esp´er´ee U : L → R d´efinie sur l’ensemble des
loteries, de la fonction u : C → R d´efinie sur des cons´equences certaines (parfois
appel´ee fonction d’utilit´e de Bernoulli)
• L’axiomatique de VNM n’impose aucune restriction sur la forme de la
fonction u, mais on suppose en g´en´erale que u est croissante
Th´eorie des jeux Introduction et th´eorie de la d´ecision
37/
Exemple de fonction d’utilit´e dans l’espace des cons´equences mon´etaires :
c
ui
1 |{2z}
E(L)
3
ui(1)
ui(2)
ui(3)
Ui(L) = 1
2ui(1) + 1
2ui(3)
L = (1/2, 1 ; 1/2, 3)
38/
Approximation et crit`ere moyenne/variance
Loterie (variable al´eatoire) ˜x
Approximation de Taylor de la fonction d’utilit´e (de Bernoulli) u au voisinage de
x = E(˜x) :
u(x) = u(x) +
u′(x)
1!
(x − x) +
u′′(x)
2!
(x − x)2 +
u′′′(x)
3!
(x − x)3 + · · ·
⇒ U(˜x) = E[u(˜x)] =
= u(x) +
u′′(x)
2!
E[(˜x − x)2] | {z }
2
x
+
u′′′(x)
3!
E[(˜x − x)3] + · · ·
⇒ l’utilit´e esp´er´ee d’une loterie peut incorporer tous les moments de la distribution
Th´eorie des jeux Introduction et th´eorie de la d´ecision
39/
Exemples.
• Fonction d’utilit´e lin´eaire u(x) = x ⇒ crit`ere d’esp´erance math´ematique
U(˜x) = x
• Fonction d’utilit´e quadratique u(x) = + x +
x2 ⇒ crit`ere
moyenne/variance (Markowitz, 1952)
U(˜x) = + x +
(x2 + 2
x )
40/
Probabilit´es objectives / subjectives
Knight (1921) : “Risk, uncertainty and profit”
– Risque : il existe des probabilit´es objectives (lanc´e de d´es, d’une pi`ece de
monnaie, tirage d’un num´ero sur une roulette ou dans une urne, . . . )
– Incertain : pas de probabilit´es objectives (r´esultats d’un match de football ou
d’une course de chevaux, ´evolution d’un prix, occurrence d’une catastrophe
naturelle, . . . )
Von Neumann et Morgenstern (1944) : hypoth`ese implicite que la situation peut
toujours ˆetre repr´esent´ee par des probabilit´es objectives parfaitement d´efinies et
connues sans ambigu¨ıt´e par le preneur de d´ecision (Õ risque)
Savage (1954) et Anscombe et Aumann (1963) : g´en´eralisation de la forme
d’utilit´e esp´er´ee sans probabilit´e objective (construction de probabilit´es
subjectives / croyances uniques)
Th´eorie des jeux Introduction et th´eorie de la d´ecision
41/
å Th´eorie de l’utilit´e esp´er´ee subjective : (sous certaines conditions) les
individus se comportent comme s’ils maximisaient une fonction d’utilit´e esp´er´ee
bas´ee sur des croyances probabilistes sur les diff´erents ´etats du monde possibles et
sur des utilit´es (de Bernoulli) sur les diff´erentes cons´equences possibles
⇒ les goˆuts et les croyances sont subjectifs
42/
Aversion pour le risque
• Un agent a de l’aversion pour le risque si
E(F) F ∀ F ∈ L
• Un agent a de l’aversion stricte pour le risque si
E(F) ≻ F ∀ F ∈ L, F 6= E(F)
• Un agent est neutre au risque si
E(F) ∼ F ∀ F ∈ L
Th´eorie des jeux Introduction et th´eorie de la d´ecision
43/
Si la relation de pr´ef´erence peut ˆetre repr´esent´ee par une fonction d’utilit´e
esp´er´ee, alors l’agent a de l’aversion pour le risque si pour tout loterie F
u[E(F)] ≡ u
Z
c dF(c)
≥
Z
u(c) dF(c) ≡ U(F)
(in´egalit´e de Jensen qui caract´erise les fonctions d’utilit´e concaves)
⇒ Un agent a de l’aversion (stricte) pour le risque si et seulement si sa fonction
d’utilit´e u est (strictement) concave. Un agent est neutre au risque si et seulement
si sa fonction d’utilit´e u est lin´eaire
44/
Exemple :
1/2
3
1/2
1
F = ( 1
2 , 1; 1
2 , 3) =
x
u
1 EC 2 3
u(1)
u(2)
u(3)
U(F)
(a) Aversion au risque
x
u
1 2 3
u(1)
u(3)
U(F)
(b) Neutralit´e vis-`a-vis du risque
Th´eorie des jeux Introduction et th´eorie de la d´ecision
45/
´Equivalent certain :
u[EC(F, u)] ≡ U(F)
Prime de risque :
(F, u) ≡ E(F) − EC(F, u)
Par d´efinition, la prime de risque est positive si l’agent a de l’aversion pour le
risque
46/
Pour en savoir plus :
– Gollier (2001) : “The Economics of Risk and Time”, Chapitres 1, 2, 3 et 27
– Fishburn (1994) : “Utility and Subjective Probability”, dans “Handbook of
Game Theory” Vol. 2, Chap. 39
– Karni et Schmeidler (1991) : “Utility Theory with Uncertainty”, dans
“Handbook of Mathematical Economics” Vol. 4
– Kreps (1988) : “Notes on the Theory of Choice”
– Kreps (1996) : “Le¸cons de th´eorie micro´economique”, Section 2.1 et Chapitre 3
– Mas-Colell et al. (1995) : “Microeconomic Theory”, Sections 1.A, 1.B, 3.C, et
Chapitre 6
– Myerson (1991) : “Game Theory”, Chapitre 1
Th´eorie des jeux Introduction et th´eorie de la d´ecision
47/
R´ef´erences
Anscombe, F. J. et R. J. Aumann (1963) : “A Definition of Subjective Probability,” Ann. Math. Statist., 34,
199–205.
Aumann, R. J. (1959) : “Acceptable Points in General Cooperative n-Person Games,” dans Contributions to the
Theory of Games IV, ed. par H. W. Kuhn et R. D. Luce, Princeton : Princeton Univ. Press., 287–324.
——— (1974) : “Subjectivity and Correlation in Randomized Strategies,” Journal of Mathematical Economics, 1,
67–96.
——— (1976) : “Agreeing to Disagree,” The Annals of Statistics, 4, 1236–1239.
——— (1987) : “Correlated Equilibrium as an Expression of Bayesian Rationality,” Econometrica, 55, 1–18.
Aumann, R. J. et M. Maschler (1966) : “Game Theoretic Aspects of Gradual Disarmament,” Report of the U.S.
Arms Control and Disarmament Agency, ST-80, Chapter V, pp. 1–55.
——— (1967) : “Repeated Games with Incomplete Information : A Survey of Recent Results,” Report of the U.S.
Arms Control and Disarmament Agency, ST-116, Chapter III, pp. 287–403.
Aumann, R. J., M. Maschler, et R. Stearns (1968) : “Repeated Games with Incomplete Information : An
Approach to the Nonzero Sum Case,” Report of the U.S. Arms Control and Disarmament Agency, ST-143,
Chapter IV, pp. 117–216.
Borel, E. (1921) : “La Th´eorie des Jeux et les ´ Equations Int´egrales `a Noyau Sym´etriques,” Comptes Rendus de
l’Acad´emie des Sciences, 173, 1304–1308.
48/
Camerer, C. F. (2003) : Behavioral Game Theory : Experiments in Strategic Interaction, Princeton : Princeton
University Press.
Cavagnac, M. (2006) : Th´eorie des jeux, M´ementos LMD, Paris : Gualino ´editeur.
Cournot, A. (1838) : Recherches sur les Principes Math´ematiques de la Th´eorie des Richesses, Paris : Hachette.
Darwin, C. (1871) : The Descent of Man, and Selection in Relation to Sex, London : John Murray.
Demange, G. et J.-P. Ponssard (1994) : Th´eorie des jeux et analyse ´economique, Presses Universitaires de France.
Dixit, A. K. et B. J. Nalebuff (1991) : Thinking Strategically, New York, London : W. W. Norton & Company.
Edgeworth, F. Y. (1881) : Mathematical Psychics : An Essay on the Application of Mathematics to the Moral
Sciences, London : Kegan Paul.
Fishburn, P. C. (1994) : “Utility and Subjective Probability,” dans Handbook of Game Theory, ed. par R. J.
Aumann et S. Hart, Elsevier Science B. V., vol. 2, chap. 39.
Gibbons, R. (1992) : Game Theory for Applied Economists, Princeton : Princeton University Press.
Gollier, C. (2001) : The Economics of Risk and Time, MIT Press.
Harsanyi, J. C. (1967–1968) : “Games with Incomplete Information Played by Bayesian Players. Parts I, II, III,”
Management Science, 14, 159–182, 320–334, 486–502.
Karni, E. et D. Schmeidler (1991) : “Utility Theory with Uncertainty,” dans Handbook of Mathematical
Economics, ed. par W. Hildenbrand et H. Sonnenschein, Elsevier, vol. 4, chap. 33.
Knight, F. H. (1921) : Risk, uncertainty and profit, Boston : Houghton Mifflin.
Th´eorie des jeux Introduction et th´eorie de la d´ecision
49/
Kreps, D. M. (1988) : Notes on the Theory of Choice, Westview Press.
——— (1996) : Le¸cons de th´eorie micro´economique, PUF.
——— (1999) : Th´eorie des jeux et mod´elisation ´economique, Paris : DUNOD.
Kreps, D. M. et R. Wilson (1982) : “Sequential Equilibria,” Econometrica, 50, 863–894.
Lewis, D. (1969) : Convention, a Philosophical Study, Harvard University Press, Cambridge, Mass.
Markowitz, H. (1952) : “Portofolio Selection,” Journal of Finance, 7, 77–91.
Mas-Colell, A., M. D. Whinston, et J. R. Green (1995) : Microeconomic Theory, New York : Oxford
University Press.
M´er¨o, L. (2000) : Les al´eas de la raison, Science ouverte, Seuil.
Myerson, R. B. (1991) : Game Theory, Analysis of Conflict, Harvard University Press.
Nalebuff, B. J. et A. M. Brandenburger (1996) : Co-opetition, London : HarperCollinsBusiness.
Nasar, S. (2001) : A Beautiful Mind : The Life of Mathematical Genius and Nobel Laureate John Nash, Simon &
Schuster.
Nash, J. F. (1950a) : “The Bargaining Problem,” Econometrica, 18, 155–162.
——— (1950b) : “Equilibrium Points in n-Person Games,” Proc. Nat. Acad. Sci. U.S.A., 36, 48–49.
——— (1951) : “Noncooperative Games,” Ann. Math., 54, 289–295.
50/
——— (1953) : “Two Person Cooperative Games,” Econometrica, 21, 128–140.
Osborne, M. J. (2004) : An Introduction to Game Theory, New York, Oxford : Oxford University Press.
Osborne, M. J. et A. Rubinstein (1994) : A Course in Game Theory, Cambridge, Massachusetts : MIT Press.
Poundstone, W. (2003) : Le dilemme du prisonnier : von neumann, la th´eorie des jeux et la bombe, Paris : Cassini.
Savage (1954) : The Foundations of Statistics, Cambridge : Cambridge Univ. Press.
Selten, R. (1965) : “Spieltheoretische Behandlung eines Oligopolmodells mit Nachfragetr¨agheit,” Zeitschrift f¨ur dis
gesamte Staatswissenschaft, 121, 301–324 and 667–689.
——— (1975) : “Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games,”
International Journal of Game Theory, 4, 25–55.
Shapley, L. S. (1953) : “A Value for n-Person Games,” dans Contributions to the Theory of Games, ed. par H. W.
Kuhn et A. W. Tucker, Princeton : Princeton University Press, vol. 2, 307–317.
Stearns, R. (1967) : “A Formal Information Concept for Games with Incomplete Information,” Report of the U.S.
Arms Control and Disarmament Agency, ST-116, Chapter IV, pp. 405–433.
Umbhauer, G. (2002) : Th´eorie des jeux appliqu´ee `a la gestion, ´ Editions EMS, Management & soci´et´e.
——— (2004) : Th´eorie des jeux, Vuibert, Dyna’Sup ´economie.
von Neumann, J. (1928) : “Zur Theories der Gesellschaftsspiele,” Math. Ann., 100, 295–320.
von Neumann, J. et O. Morgenstern (1944) : Theory of Games and Economic Behavior, Princeton, NJ :
Princeton University Press.
Th´eorie des jeux Introduction et th´eorie de la d´ecision
51/
Yildizoglu, M. (2003) : Introduction `a la th´eorie des jeux, ´ Eco Sup, Dunod.
Zermelo, E. (1913) : “Uber eine Anwendung der Mengenlehre auf die Theorie des Schachspiels,” dans Proceedings
of the Fifth International Congress of Mathematicians, ed. par E. W. Hobson et A. E. H. Love, Cambridge :
Cambridge University Press, 501–504.
1/
Th´eorie des jeux
Fr´ed´eric Koessler
frederic[point]koessler[at]gmail[point]com
http ://frederic.koessler.free.fr/cours.htm
Plan g´en´eral du cours
(22 juillet 2008)
– Introduction et th´eorie de la d´ecision individuelle
– Jeux sous forme normale
– Information incompl`ete et jeux Bay´esiens
– Th´eorie des jeux comportementale (´economie exp´erimentale)
– Jeux sous forme extensive
– Jeux r´ep´et´es
2/
Manuels
– Demange et Ponssard (1994) : “Th´eorie des jeux et analyse ´economique”
– Mas-Colell et al. (1995) : “Microeconomic Theory”, chap. 6–9
– Myerson (1991) : “Game Theory : Analysis of Conflict”
– Osborne et Rubinstein (1994) : “A Course in Game Theory”
Pour des introductions plus ´el´ementaires :
– Gibbons (1992) : “Game Theory for Applied Economists”
– Kreps (1999) : “Th´eorie des jeux et mod´elisation ´economique”
– Osborne (2004) : “An Introduction to Game Theory”
– Umbhauer (2002, 2004) : “Th´eorie des jeux” et “Th´eorie des jeux appliqu´ee `a
la gestion”
– Yildizoglu (2003) : “Introduction `a la th´eorie des jeux”
– Cavagnac (2006) : “Th´eorie des jeux”
Th´eorie des jeux Introduction et th´eorie de la d´ecision
3/
Pour la th´eorie des jeux comportementale (exp´erimentale) :
– Camerer (2003) : “Behavioral Game Theory : Experiments on Strategic
Interaction”
Approches informelles et ´etudes de cas :
– Dixit et Nalebuff (1991) : “Thinking Strategically”
– Nalebuff et Brandenburger (1996) : “Co-opetition”
Livres de vulgarisation et/ou historiques :
– M´er¨o (2000) : “Les al´eas de la raison”
– Nasar (2001) : “A Beautiful Mind : The Life of Mathematical Genius and Nobel
Laureate John Nash”
– Poundstone (2003) : “Le dilemme du prisonnier : Von Neumann, la th´eorie des
jeux et la bombe”
4/
Th´eorie des jeux = th´eorie de la d´ecision (rationnelle) d’agents strat´egiquement
interd´ependants, c’est-`a-dire qui s’influencent les uns les autres et qui ont
conscience de ces influences r´eciproques
+ Th´eorie de la d´ecision interactive
+ Analyse des conflits
+ Science de la strat´egie
Jeux = situations de d´ecisions interactives dans lesquelles l’utilit´e (bien-ˆetre) de
chaque individu d´epend des d´ecisions des autres individus
+ Probl`emes ´economiques, sociaux, politiques, diplomatiques et militaires
+ Ordre naturel (interaction entre les esp`eces/g`enes)
Th´eorie des jeux Introduction et th´eorie de la d´ecision
5/
Exemples.
– Concurrence imparfaite : les prix ne sont pas donn´es mais sont les cons´equences
des d´ecisions des agents
– Ench`ere : l’issue (i.e., le gagnant et le prix qu’il a pay´e) d´epend des actions de
tous les ench´erisseurs et du type d’ench`ere utilis´ee par l’organisateur
– Comp´etition ´electorale
– D´ecisions de membres d’un jury sur un verdict
– Macro´economie ouverte : coordination internationale des politiques ´economiques
– Animaux chassant une proie
å Pas n´ecessairement de conflits purs ; jeux `a somme non nulle vs. jeux `a
somme nulle . . . image (issue “perdante-perdante”) . . .
6/
3 grands th`emes en th´eorie des jeux
(1) La th´eorie des jeux non-coop´eratifs ou strat´egiques
– Jeux sous forme normale (strat´egique) / sous forme extensive (d´evelopp´ee)
– Jeux `a information parfaite / information imparfaite
(2) La th´eorie des jeux coop´eratifs ou coalitionnels
(3) Le choix social, la th´eorie de l’impl´ementation et des m´ecanismes
(1) è joueurs ind´ependants, strat´egies, pr´ef´erences / description d´etaill´ee +
notion d’´equilibre
(2) è coalitions, valeurs des coalitions, contrats contraignants / approche
axiomatique
(3) è on modifie les param`etres du jeu (r`egles, transferts, . . . ) afin d’obtenir des
solutions qui v´erifient des propri´et´es globales souhait´ees (la Pareto-optimalit´e,
certains crit`eres de justice, la protection de l’environnement, . . . )
Th´eorie des jeux Introduction et th´eorie de la d´ecision
7/
Premier exemple : Bus ou voiture ?
N = [0, 1] = population d’une ville (les joueurs)
Choix de chaque joueur : “prendre la voiture” ou “prendre le bus” (les actions)
x % prennent le bus ⇒ utilit´es u(B, x), u(V, x) (les pr´ef´erences)
u(V, ·)
u(B, ·)
0 100
% d’individus
x en bus
w
´E
quilibre
wOptimum social
u(V, x) > u(B, x) pour tout x ⇒ tout le monde prend la voiture (x = 0)
⇒ u(V, 0) pour tous ⇒ inefficace car si tout le monde prenait le bus (x = 100)
le niveau de satisfaction de tous les individus serait plus important
(u(B, 100) > u(V, 0))
8/
Politique de transport (p´eages, lignes de bus, . . . )
à nouvelle configuration
u(V, ·)
u(B, ·)
% d’individus
x x en bus ′ x∗
0 100
w
à nouvel ´equilibre (de Nash) plus efficace (mais pas Pareto optimal)
Th´eorie des jeux Introduction et th´eorie de la d´ecision
9/
Configuration alternative : multiplicit´e d’´equilibres
-
6 6
0 100
% d’individus
en bus
u(V, ·)
u(B, ·)
A
B
C
w
w
w
A : ´equilibre stable et inefficace (Pareto domin´e)
B : ´equilibre instable et inefficace (Pareto domin´e)
C : ´equilibre stable et Pareto optimal
10/
- D´eterminez les ´equilibres (de Nash) dans la configuration suivante. Lesquels
sont stables ? Lesquels sont Pareto optimaux ?
-
6 6
0 100
% de joueurs
en bus
u(B, ·)
u(V, ·)
Th´eorie des jeux Introduction et th´eorie de la d´ecision
11/
Deuxi`eme exemple : Partage de gˆateau
N = {1, 2} = deux enfants (les joueurs)
Le premier enfant d´ecoupe le gˆateau en deux parts puis laisse le deuxi`eme enfant
choisir son morceau (les r`egles : actions, d´eroulement, . . . )
Objectif de chaque enfant : avoir la plus grosse part (les pr´ef´erences)
å Diagramme de tous les coups possibles :
Arbre de jeu ou jeu sous forme extensive
12/
Parts in´egales
Parts ´egales
Premier enfant
la + petite part
≃ moiti´e
la + grosse part
≃ moiti´e
Deuxi`eme enfant
la + petite part
grosse part
pour le premier
la + grosse part
petite part
pour le premier
Deuxi`eme enfant
Th´eorie des jeux Introduction et th´eorie de la d´ecision
13/
Meilleure strat´egie du premier enfant : essayer de partager le gˆateau de mani`ere
´egale
à Solution ´equitable, mais ne doit rien `a la g´en´erosit´e, l’altruisme ou `a un sens
de l’´equit´e (chacun poursuit rationnellement son int´erˆet personnel)
14/
Autre repr´esentation possible :
Tableau de r´esultat ou jeu sous forme strat´egique/normale
• Strat´egies du premier enfant :
E = faire des parts (`a peu pr`es) ´egales I = faire des part in´egales
• Strat´egies du deuxi`eme enfant :
G = toujours prendre la plus grosse part P = toujours prendre la plus petite
part
(P | E, G | I) = prendre la plus grosse part seulement si les parts sont in´egales
(G | E, P | I) = prendre la plus grosse part (de quelques miettes) seulement si les
parts sont ´egales
1er enfant
2`eme enfant
G P (P | E, G | I) (G | E, P | I)
E ≃ moiti´e ≃ moiti´e ≃ moiti´e ≃ moiti´e
I petite part grosse part petite part grosse part
Th´eorie des jeux Introduction et th´eorie de la d´ecision
15/
- Autre exemple simple (sauf pour Charlie Brown) d’induction `a rebours :
Ordre r´eel des d´ecisions et anticipation de la r´eponse de son rival : image
– Repr´esentez la situation sous la forme d’arbre de jeu (jeu sous forme extensive)
et d´eterminez les strat´egies optimales des joueurs
– Repr´esentez la situation sous la forme d’un tableau de r´esultat (jeu sous forme
normale)
16/
Troisi`eme exemple : Valeur strat´egique de l’information
Deux firmes
Deux projets possibles : a et b
La firme 1 choisit un des deux projets, puis la firme 2 choisit un des deux projets
apr`es avoir observ´e le choix de la firme 1
Deux ´etats/situations possibles, ´equiprobables (Pr[] = Pr[] = 1/2) :
: Seul le projet a est rentable
: Seul le projet b est rentable
• Firmes 1 et 2 non inform´ees.
Th´eorie des jeux Introduction et th´eorie de la d´ecision
17/
Arbre de jeu :
Projet b
Projet a
Firme 1
Projet b
(6, 0) si
(0, 6) si
→ (3, 3)
Projet a
(2, 2) si
(0, 0) si
→ (1, 1)
Firme 2
Projet b
(0, 0) si
(2, 2) si
→ (1, 1)
Projet a
(0, 6) si
(6, 0) si
→ (3, 3)
Firme 2
à La firme 2 choisit toujours un projet diff´erent de la firme 1, donc l’utilit´e
esp´er´ee de chaque firme est ´egale `a 3
18/
• Firme 1 inform´ee et firme 2 non inform´ee.
Arbre de jeu (`a information imparfaite) :
Nature
b
a
Firme 1
b
a
Firme 1
Firme 2
b Firme 2
(6, 0)
a
(2, 2)
b
(0, 6)
a
(0, 0)
b
(0, 0)
a
(0, 6)
b
(2, 2)
a
(6, 0)
à La firme 2 choisit le mˆeme projet que la firme 1, donc l’utilit´e esp´er´ee de
chaque firme est ´egale `a 2 < 3
à Valeur strat´egique de l’information n´egative pour la firme 1 ! (6= probl`eme de
d´ecision individuelle). Mais la firme 2 sait que la firme 1 sait . . .
Th´eorie des jeux Introduction et th´eorie de la d´ecision
19/
D´efinition g´en´erale d’un jeu
– L’ensemble des joueurs
– Les r`egles du jeu (qui peut faire quoi et quand)
– L’information dont disposent les joueurs (sur le nombre de joueurs, les r`egles,
les pr´ef´erences, et l’information des autres)
– Les pr´ef´erences des joueurs sur les enchaˆınements d’actions et leurs issues.
G´en´eralement, fonctions d’utilit´e esp´er´ees de type von Neumann et Morgenstern
Th´eorie des jeux 6= optimisation, th´eorie de la d´ecision
– R´esolution du jeu non automatique : concept de solution et solution elle-mˆeme
rarement uniques
– Probl`eme de la d´efinition circulaire de la rationalit´e
– Probl`eme des connaissances it´er´ees
⇒ quels concepts de solution “raisonnables” ?
Hypoth`eses courantes : Rationalit´e (pr´ef´erences rationnelles / maximisation de
l’utilit´e) et “Intelligence”
20/
Historique
– Cournot (1838, Chap. 7) : ´equilibre en duopole
– Edgeworth (1881) : courbe de contrat, concept de “coeur”
– Darwin (1871) : biologie ´evolutionniste, s´election naturelle
– Zermelo (1913) : positions gagnantes dans le jeu d’´echec
– Emile Borel (1921) : strat´egie mixte (al´eatoire)
– Von Neumann (1928) : th´eor`eme de maximin (comp´etition pure `a deux joueurs)
– Von Neumann et Morgenstern (1944), “Theory of Games and Economic
Behavior”
– Nash (1950b, 1951) : notion d’´equilibre, jeux g´en´eraux
– Nash (1950a, 1953) : solution de n´egociation
– Shapley (1952–1953) : “coeur” et valeur d’un jeu coop´eratif
– Aumann (1959) : jeux r´ep´et´es et “folk theorems”
Th´eorie des jeux Introduction et th´eorie de la d´ecision
21/
– Selten (1965, 1975), Kreps et Wilson (1982) : raffinements d’´equilibre
– Harsanyi (1967–1968) : information asym´etrique (espace des types)
– Aumann et Maschler (1966, 1967); Stearns (1967); Aumann et al. (1968) : jeux
r´ep´et´es `a information incompl`ete
– Aumann (1974, 1987) : ´equilibre corr´el´e, justification ´epist´emique des ´equilibres
– Lewis (1969), Aumann (1976) : connaissance commune
– Hurwicz, Maskin et Myerson (prix Nobel d’´economie 2007) : Th´eorie des
m´ecanismes
22/
Th´eorie de la d´ecision
Pr´e-requis `a l’analyse des d´ecisions interactives (jeux) : connaˆıtre les fondements
th´eoriques et les outils permettant l’analyse des d´ecisions individuelles
(rationnelles) dans les situations incertaines/risqu´ees, c’est-`a-dire dont les
cons´equences ne sont pas parfaitement connues par le preneur de d´ecision.
Environnement certain : Pr´ef´erence sur les cons´equences C
Environnement incertain : Pr´ef´erence sur les loteries L = (C)
Exemple de loterie (jeu de la roulette) :
Ensemble des cases possibles = {00, 0, 1, . . . , 36} (probabilit´e 1/38 pour chaque
case)
Th´eorie des jeux Introduction et th´eorie de la d´ecision
23/
Consid´erons les deux alternatives suivantes :
• a : Parier 10 e sur pair
• a′ : Ne pas parier
à Cons´equences C = {−10, 0, 10}
Loteries induites par les alternatives a et a′ :
20
38 −10
18
38
10
0
L 0
0
−10
0
10
1
et L 0 ′
24/
Premier crit`ere de d´ecision qui vient `a l’esprit pour l’´evaluation d’une alternative
ayant des cons´equences mon´etaires incertaines : l’esp´erance math´ematique ou
valeur actuarielle : X
i
pi xi
20
38 −10
18
38
10
0
L 0
0
−10
0
10
1
L 0 ′
E(L) =
18
38
10 −
20
38
10 = −
20
38
E(L′) = 0
Th´eorie des jeux Introduction et th´eorie de la d´ecision
25/
Exemple : Assurance. Une maison d’une valeur de 1000 peut brˆuler (´etat b) avec
probabilit´e 1/10 et ne pas brˆuler (´etat n) avec probabilit´e 9/10 :
= {b, n}, (b) = 1/10, (n) = 9/10
Consid´erons les trois alternatives (actes) a, a′ et a′′ suivantes :
• Ne pas s’assurer : a(!) =
0 si ! = b
1000 si ! = n
• Assurance totale (prime = 100) : a′(!) = 900 pour tout ! ∈
• Assurance avec franchise (prime = 70, franchise = 300) :
a′′(!) =
630 si ! = b
930 si ! = n
à Cons´equences C = {0, 630, 900, 930, 1000}
Loteries induites par les actes a, a′ et a′′ :
L =
1
10
, 0, 0, 0,
9
10
L′ = (0, 0, 1, 0, 0) L′′ =
0,
1
10
, 0,
9
10
, 0
26/
Inconv´enients de l’esp´erance math´ematique :
– Pas de prise en compte de l’attitude vis-`a-vis du risque du d´ecideur
– Cons´equences mon´etaires uniquement
– Paradoxe de Saint-P´etersbourg
Paradoxe de Saint-P´etersbourg
Une pi`ece de monnaie ´equilibr´ee est lanc´ee `a r´ep´etition tant que pile se r´ealise
D`es que face se r´ealise au k-i`eme jet le gain est de 2k euros
Esp´erance math´ematique de gain pour ce pari :
∞X
k=1
1
2k 2k = 1 + 1 + 1 + · · · = ∞
Pourtant la valeur attribu´ee `a ce pari par la plupart des gens est bien en-dessous
de 100 et mˆeme de 10 euros . . .
Th´eorie des jeux Introduction et th´eorie de la d´ecision
27/
En 1738 Daniel Bernoulli (1700–1782) propose d’int´egrer le fait que les agents ont
une utilit´e (satisfaction) marginale d´ecroissante pour la monnaie et ´evaluent un
pari par l’esp´erance de l’utilit´e des diff´erentes cons´equences
Par exemple, l’esp´erance math´ematique du logarithme du gain :
∞X
k=1
1
2k ln(2k) = (ln 2)
∞X
k=1
k
1
2
k
= (ln 2)
"
2
∞X
k=1
k
1
2
k
−
∞X
k=1
k
1
2
k
#
= (ln 2)
"
∞X
k=0
(k + 1)
1
2
k
−
∞X
k=1
k
1
2
k
#
= (ln 2)
"
1 +
∞X
k=1
1
2
k
#
= ln 4
⇒ Valeur d’un montant mon´etaire certain de 4 euros
28/
Critiques de la suggestion de Bernoulli :
– Pourquoi ln ? (ad hoc, il existe une infinit´e de fonctions croissantes `a taux
d´ecroissant)
– Pourquoi la mˆeme forme pour chaque individu ?
– Pourquoi la d´ecision doit-elle ˆetre bas´ee sur la valeur esp´er´ee des utilit´es ?
– La valeur esp´er´ee est justifi´ee `a long terme, si le pari est r´ep´et´e un grand
nombre de fois. Mais pourquoi peut-on l’appliquer si l’individu participe une
seule fois au jeu ?
1944 : von Neumann et Morgenstern fournissent une axiomatique rigoureuse
g´en´eralisant la solution propos´ee par Bernoulli
Th´eorie des jeux Introduction et th´eorie de la d´ecision
29/
Fig. 1 – John von Neumann (1903–1957)
30/
Id´ee de la construction de vNM :
Supposons
A ≻ B ≻ C
Dans un environnement certain, toutes les valeurs a > b > c sont des indices
appropri´es pour repr´esenter cette pr´ef´erence ordinale
Introduisons les paris
1
L B
1 − p
C
p
A
et L′
et supposons L L′ ⇔ p ≤ 2/3
Th´eorie des jeux Introduction et th´eorie de la d´ecision
31/
Alors, on se restreint aux indices d’utilit´e
a >
2
3
a +
1
3
c > c
et on a
u(B) − u(C) = 2[u(A) − u(B)] =
2
3
(a − c)
Ces diff´erences d’utilit´es lors du passage d’une cons´equence `a une autre
repr´esentent l’attitude vis-`a-vis du risque de l’individu, et non une amplitude de
satisfaction
32/
Hypoth`eses de von Neumann et Morgenstern :
– Rationalit´e, ou pr´eordre complet.
– Compl´etude. Pour tout L, L′ ∈ L, on a L L′ ou L′ L (ou les deux)
– Transitivit´e. Pour tout L, L′, L′′ ∈ L, si L L′ et L′ L′′, alors L L′′
– Continuit´e. Pour tout L, L′, L′′ ∈ L, les ensembles
{ ∈ [0, 1] : L + (1 − )L′ L′′}
et { ∈ [0, 1] : L′′ L + (1 − )L′}
sont ferm´es. (L L′ L′′ ⇒ ∃ ∈ [0, 1], L + (1 − )L′′ ∼ L′)
– Axiome d’ind´ependance. Pour tout L, L′, L′′ ∈ L et ∈ (0, 1) on a
L L′ ⇔ L + (1 − )L′′ L′ + (1 − )L′′
Th´eorie des jeux Introduction et th´eorie de la d´ecision
33/
Th´eor`eme de von Neumann et Morgenstern.
Si la relation de pr´ef´erence sur l’espace des loteries L est rationnelle, continue,
et v´erifie l’axiome d’ind´ependance, alors elle admet une repr´esentation sous la
forme d’utilit´e esp´er´ee de VNM
Autrement dit, on peut assigner des valeurs u(c) aux diff´erentes cons´equences
c ∈ C de sorte que pour toutes loteries L = (p1, . . . , pC) et L′ = (p′
1, . . . , p′
C) on a
L L′ ⇔
X
c∈C
pc u(c)
| {z }
U(L)
≥
X
c∈C
p′
c u(c)
| {z }
U(L′)
Propri´et´e. Une fonction d’utilit´e U : L → R a la forme d’utilit´e esp´er´ee de VNM
si et seulement si elle est lin´eaire par rapport aux probabilit´es, c’est-`a-dire
U
XK
k=1
k Lk
!
=
XK
k=1
k U(Lk),
pour toutes loteries (Lk)k et probabilit´es (k)k, avec
PK
k=1 k = 1
34/
Propri´et´e. (Cardinalit´e) Soit U : L → R une fonction d’utilit´e esp´er´ee de VNM
pour la relation de pr´ef´erence sur L. La fonction eU : L → R est une autre
fonction d’utilit´e esp´er´ee de VNM pour si et seulement si il existe > 0 et
∈ R tels que
eU(L) = U(L) +
pour tout L ∈ L.
Cons´equences mon´etaires : Loterie = variable al´eatoire repr´esent´ee par une
fonction de r´epartition F
Par exemple, la loterie `a trois cons´equences mon´etaires possibles suivante
1
2 50 e
1
4
20 e
1
4
L 30 e a la fonction de r´epartition F(x) =
0 si x < 20
1/4 si x ∈ [20, 30)
1/2 si x ∈ [30, 50)
1 si x ≥ 50
Th´eorie des jeux Introduction et th´eorie de la d´ecision
35/
x
0 20 e 30 e 50 e
1
4
1
2
1
F
r
r
r
36/
Dans ce cadre une loterie (fonction de r´epartition) F est ´evalu´ee par l’agent `a
l’aide d’une fonction d’utilit´e esp´er´ee de VNM ayant la forme
U(F) =
Z
C
u(c) dF(c)
=
Z
C
u(c)f(c) dc si la densit´e f existe
Remarques.
• Distinguer la fonction d’utilit´e esp´er´ee U : L → R d´efinie sur l’ensemble des
loteries, de la fonction u : C → R d´efinie sur des cons´equences certaines (parfois
appel´ee fonction d’utilit´e de Bernoulli)
• L’axiomatique de VNM n’impose aucune restriction sur la forme de la
fonction u, mais on suppose en g´en´erale que u est croissante
Th´eorie des jeux Introduction et th´eorie de la d´ecision
37/
Exemple de fonction d’utilit´e dans l’espace des cons´equences mon´etaires :
c
ui
1 |{2z}
E(L)
3
ui(1)
ui(2)
ui(3)
Ui(L) = 1
2ui(1) + 1
2ui(3)
L = (1/2, 1 ; 1/2, 3)
38/
Approximation et crit`ere moyenne/variance
Loterie (variable al´eatoire) ˜x
Approximation de Taylor de la fonction d’utilit´e (de Bernoulli) u au voisinage de
x = E(˜x) :
u(x) = u(x) +
u′(x)
1!
(x − x) +
u′′(x)
2!
(x − x)2 +
u′′′(x)
3!
(x − x)3 + · · ·
⇒ U(˜x) = E[u(˜x)] =
= u(x) +
u′′(x)
2!
E[(˜x − x)2] | {z }
2
x
+
u′′′(x)
3!
E[(˜x − x)3] + · · ·
⇒ l’utilit´e esp´er´ee d’une loterie peut incorporer tous les moments de la distribution
Th´eorie des jeux Introduction et th´eorie de la d´ecision
39/
Exemples.
• Fonction d’utilit´e lin´eaire u(x) = x ⇒ crit`ere d’esp´erance math´ematique
U(˜x) = x
• Fonction d’utilit´e quadratique u(x) = + x +
x2 ⇒ crit`ere
moyenne/variance (Markowitz, 1952)
U(˜x) = + x +
(x2 + 2
x )
40/
Probabilit´es objectives / subjectives
Knight (1921) : “Risk, uncertainty and profit”
– Risque : il existe des probabilit´es objectives (lanc´e de d´es, d’une pi`ece de
monnaie, tirage d’un num´ero sur une roulette ou dans une urne, . . . )
– Incertain : pas de probabilit´es objectives (r´esultats d’un match de football ou
d’une course de chevaux, ´evolution d’un prix, occurrence d’une catastrophe
naturelle, . . . )
Von Neumann et Morgenstern (1944) : hypoth`ese implicite que la situation peut
toujours ˆetre repr´esent´ee par des probabilit´es objectives parfaitement d´efinies et
connues sans ambigu¨ıt´e par le preneur de d´ecision (Õ risque)
Savage (1954) et Anscombe et Aumann (1963) : g´en´eralisation de la forme
d’utilit´e esp´er´ee sans probabilit´e objective (construction de probabilit´es
subjectives / croyances uniques)
Th´eorie des jeux Introduction et th´eorie de la d´ecision
41/
å Th´eorie de l’utilit´e esp´er´ee subjective : (sous certaines conditions) les
individus se comportent comme s’ils maximisaient une fonction d’utilit´e esp´er´ee
bas´ee sur des croyances probabilistes sur les diff´erents ´etats du monde possibles et
sur des utilit´es (de Bernoulli) sur les diff´erentes cons´equences possibles
⇒ les goˆuts et les croyances sont subjectifs
42/
Aversion pour le risque
• Un agent a de l’aversion pour le risque si
E(F) F ∀ F ∈ L
• Un agent a de l’aversion stricte pour le risque si
E(F) ≻ F ∀ F ∈ L, F 6= E(F)
• Un agent est neutre au risque si
E(F) ∼ F ∀ F ∈ L
Th´eorie des jeux Introduction et th´eorie de la d´ecision
43/
Si la relation de pr´ef´erence peut ˆetre repr´esent´ee par une fonction d’utilit´e
esp´er´ee, alors l’agent a de l’aversion pour le risque si pour tout loterie F
u[E(F)] ≡ u
Z
c dF(c)
≥
Z
u(c) dF(c) ≡ U(F)
(in´egalit´e de Jensen qui caract´erise les fonctions d’utilit´e concaves)
⇒ Un agent a de l’aversion (stricte) pour le risque si et seulement si sa fonction
d’utilit´e u est (strictement) concave. Un agent est neutre au risque si et seulement
si sa fonction d’utilit´e u est lin´eaire
44/
Exemple :
1/2
3
1/2
1
F = ( 1
2 , 1; 1
2 , 3) =
x
u
1 EC 2 3
u(1)
u(2)
u(3)
U(F)
(a) Aversion au risque
x
u
1 2 3
u(1)
u(3)
U(F)
(b) Neutralit´e vis-`a-vis du risque
Th´eorie des jeux Introduction et th´eorie de la d´ecision
45/
´Equivalent certain :
u[EC(F, u)] ≡ U(F)
Prime de risque :
(F, u) ≡ E(F) − EC(F, u)
Par d´efinition, la prime de risque est positive si l’agent a de l’aversion pour le
risque
46/
Pour en savoir plus :
– Gollier (2001) : “The Economics of Risk and Time”, Chapitres 1, 2, 3 et 27
– Fishburn (1994) : “Utility and Subjective Probability”, dans “Handbook of
Game Theory” Vol. 2, Chap. 39
– Karni et Schmeidler (1991) : “Utility Theory with Uncertainty”, dans
“Handbook of Mathematical Economics” Vol. 4
– Kreps (1988) : “Notes on the Theory of Choice”
– Kreps (1996) : “Le¸cons de th´eorie micro´economique”, Section 2.1 et Chapitre 3
– Mas-Colell et al. (1995) : “Microeconomic Theory”, Sections 1.A, 1.B, 3.C, et
Chapitre 6
– Myerson (1991) : “Game Theory”, Chapitre 1
Th´eorie des jeux Introduction et th´eorie de la d´ecision
47/
R´ef´erences
Anscombe, F. J. et R. J. Aumann (1963) : “A Definition of Subjective Probability,” Ann. Math. Statist., 34,
199–205.
Aumann, R. J. (1959) : “Acceptable Points in General Cooperative n-Person Games,” dans Contributions to the
Theory of Games IV, ed. par H. W. Kuhn et R. D. Luce, Princeton : Princeton Univ. Press., 287–324.
——— (1974) : “Subjectivity and Correlation in Randomized Strategies,” Journal of Mathematical Economics, 1,
67–96.
——— (1976) : “Agreeing to Disagree,” The Annals of Statistics, 4, 1236–1239.
——— (1987) : “Correlated Equilibrium as an Expression of Bayesian Rationality,” Econometrica, 55, 1–18.
Aumann, R. J. et M. Maschler (1966) : “Game Theoretic Aspects of Gradual Disarmament,” Report of the U.S.
Arms Control and Disarmament Agency, ST-80, Chapter V, pp. 1–55.
——— (1967) : “Repeated Games with Incomplete Information : A Survey of Recent Results,” Report of the U.S.
Arms Control and Disarmament Agency, ST-116, Chapter III, pp. 287–403.
Aumann, R. J., M. Maschler, et R. Stearns (1968) : “Repeated Games with Incomplete Information : An
Approach to the Nonzero Sum Case,” Report of the U.S. Arms Control and Disarmament Agency, ST-143,
Chapter IV, pp. 117–216.
Borel, E. (1921) : “La Th´eorie des Jeux et les ´ Equations Int´egrales `a Noyau Sym´etriques,” Comptes Rendus de
l’Acad´emie des Sciences, 173, 1304–1308.
48/
Camerer, C. F. (2003) : Behavioral Game Theory : Experiments in Strategic Interaction, Princeton : Princeton
University Press.
Cavagnac, M. (2006) : Th´eorie des jeux, M´ementos LMD, Paris : Gualino ´editeur.
Cournot, A. (1838) : Recherches sur les Principes Math´ematiques de la Th´eorie des Richesses, Paris : Hachette.
Darwin, C. (1871) : The Descent of Man, and Selection in Relation to Sex, London : John Murray.
Demange, G. et J.-P. Ponssard (1994) : Th´eorie des jeux et analyse ´economique, Presses Universitaires de France.
Dixit, A. K. et B. J. Nalebuff (1991) : Thinking Strategically, New York, London : W. W. Norton & Company.
Edgeworth, F. Y. (1881) : Mathematical Psychics : An Essay on the Application of Mathematics to the Moral
Sciences, London : Kegan Paul.
Fishburn, P. C. (1994) : “Utility and Subjective Probability,” dans Handbook of Game Theory, ed. par R. J.
Aumann et S. Hart, Elsevier Science B. V., vol. 2, chap. 39.
Gibbons, R. (1992) : Game Theory for Applied Economists, Princeton : Princeton University Press.
Gollier, C. (2001) : The Economics of Risk and Time, MIT Press.
Harsanyi, J. C. (1967–1968) : “Games with Incomplete Information Played by Bayesian Players. Parts I, II, III,”
Management Science, 14, 159–182, 320–334, 486–502.
Karni, E. et D. Schmeidler (1991) : “Utility Theory with Uncertainty,” dans Handbook of Mathematical
Economics, ed. par W. Hildenbrand et H. Sonnenschein, Elsevier, vol. 4, chap. 33.
Knight, F. H. (1921) : Risk, uncertainty and profit, Boston : Houghton Mifflin.
Th´eorie des jeux Introduction et th´eorie de la d´ecision
49/
Kreps, D. M. (1988) : Notes on the Theory of Choice, Westview Press.
——— (1996) : Le¸cons de th´eorie micro´economique, PUF.
——— (1999) : Th´eorie des jeux et mod´elisation ´economique, Paris : DUNOD.
Kreps, D. M. et R. Wilson (1982) : “Sequential Equilibria,” Econometrica, 50, 863–894.
Lewis, D. (1969) : Convention, a Philosophical Study, Harvard University Press, Cambridge, Mass.
Markowitz, H. (1952) : “Portofolio Selection,” Journal of Finance, 7, 77–91.
Mas-Colell, A., M. D. Whinston, et J. R. Green (1995) : Microeconomic Theory, New York : Oxford
University Press.
M´er¨o, L. (2000) : Les al´eas de la raison, Science ouverte, Seuil.
Myerson, R. B. (1991) : Game Theory, Analysis of Conflict, Harvard University Press.
Nalebuff, B. J. et A. M. Brandenburger (1996) : Co-opetition, London : HarperCollinsBusiness.
Nasar, S. (2001) : A Beautiful Mind : The Life of Mathematical Genius and Nobel Laureate John Nash, Simon &
Schuster.
Nash, J. F. (1950a) : “The Bargaining Problem,” Econometrica, 18, 155–162.
——— (1950b) : “Equilibrium Points in n-Person Games,” Proc. Nat. Acad. Sci. U.S.A., 36, 48–49.
——— (1951) : “Noncooperative Games,” Ann. Math., 54, 289–295.
50/
——— (1953) : “Two Person Cooperative Games,” Econometrica, 21, 128–140.
Osborne, M. J. (2004) : An Introduction to Game Theory, New York, Oxford : Oxford University Press.
Osborne, M. J. et A. Rubinstein (1994) : A Course in Game Theory, Cambridge, Massachusetts : MIT Press.
Poundstone, W. (2003) : Le dilemme du prisonnier : von neumann, la th´eorie des jeux et la bombe, Paris : Cassini.
Savage (1954) : The Foundations of Statistics, Cambridge : Cambridge Univ. Press.
Selten, R. (1965) : “Spieltheoretische Behandlung eines Oligopolmodells mit Nachfragetr¨agheit,” Zeitschrift f¨ur dis
gesamte Staatswissenschaft, 121, 301–324 and 667–689.
——— (1975) : “Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games,”
International Journal of Game Theory, 4, 25–55.
Shapley, L. S. (1953) : “A Value for n-Person Games,” dans Contributions to the Theory of Games, ed. par H. W.
Kuhn et A. W. Tucker, Princeton : Princeton University Press, vol. 2, 307–317.
Stearns, R. (1967) : “A Formal Information Concept for Games with Incomplete Information,” Report of the U.S.
Arms Control and Disarmament Agency, ST-116, Chapter IV, pp. 405–433.
Umbhauer, G. (2002) : Th´eorie des jeux appliqu´ee `a la gestion, ´ Editions EMS, Management & soci´et´e.
——— (2004) : Th´eorie des jeux, Vuibert, Dyna’Sup ´economie.
von Neumann, J. (1928) : “Zur Theories der Gesellschaftsspiele,” Math. Ann., 100, 295–320.
von Neumann, J. et O. Morgenstern (1944) : Theory of Games and Economic Behavior, Princeton, NJ :
Princeton University Press.
Th´eorie des jeux Introduction et th´eorie de la d´ecision
51/
Yildizoglu, M. (2003) : Introduction `a la th´eorie des jeux, ´ Eco Sup, Dunod.
Zermelo, E. (1913) : “Uber eine Anwendung der Mengenlehre auf die Theorie des Schachspiels,” dans Proceedings
of the Fifth International Congress of Mathematicians, ed. par E. W. Hobson et A. E. H. Love, Cambridge :
Cambridge University Press, 501–504.