applet-magic.com
Thayer Watkins
Silicon Valley
& Tornado Alley
USA

Lev Pontryagin

Le principe de maximum de Pontryagin

Le principe de maximum de Pontryagin s'applique à un type particulier de problème appelé un problème de Bolzano. La plupart des problèmes d'optimisation peuvent être mis dans la forme d'un problème de Bolzano, mais dans plus à ce sujet plus tard.

Un problème de Bolzano implique un certain nombre de variables d'état qui peuvent changer le temps fini où le temps t fonctionne de 0 au T. Supposons les variables d'état sont X1(t), X2(t),…, Xn(t). Nous voulons maximiser


V(T) = c1X1(T) + c2X2(T) + ...+cnXn(T),
 

étant donné que nous commençons le point X1(0), X2(0),…, Xn(0), et où les coefficients c1, c2,…, cn sont indiqués et T est la certaine heure finie définie. Nous sommes donnés de prétendues fonctions de direction pour commander les changements des variables d'état; c.-à-d.,


dX1/dt = f1(X1,X2,.., Xn,u1,u2,..,um)

dX2/dt = f2(X1,X2,.., Xn,u1,u2,..,um)

...........................................................

dXn/dt = fn(X1,X2,.., Xn,u1,u2,..,um)

 

là où les variables u1, u2,…, um sont des fonctions de temps et s'appellent les variables de commande. L'objectif est de choisir les variables de commande à chaque instant de temps afin d'orienter les variables d'état de leurs valeurs initiales


X1(0), X2(0),...,Xn(0)
 

à un certain point

X1(T), X2(T),...,Xn(T)
 

là où V(T) = c1X1(T) + c2X2(T) + ...cnXn(T) est maximisé.

Ceci semble être très un difficile chargent. Le principe maximum de Pontryagin fournit une solution ordonnée et systématique. la méthode une de Pontryagin d'instrument de

To définit un hamiltonien fonction


H = φ1f1 + φ2f2 + ... + φnfn
= Σφifi,
 

là où l'ensemble de variables d'adjoint φ12,..,φn sont tels que


i/dt = - ∂H/∂Xi

= -Σi φj∂fi)/ ∂Xi
 

et φi(T)= ci pour i=1,2,..,n.

La valeur optima des variables de commande au temps t sont celle cela maximise le H.

Ceci signifie habituellement que uj(t) optimum est tel que

∂H/∂uj(t) = 0;
i.e.,

ΣiXi∂fi)/∂uj(t) = 0 for j=1,...,m.
 

Un exemple d'un problème de Bolzano dans les sciences économiques :

Supposez qu'un individu a un revenu noninterest de y(t) pour 0≤ t≤ T ce qui peut être consommé ou sauvé à un taux d'intérêt de R. L'individu veut choisir un programme c(t) de consommation pour 0≤ t≤ T ce qui maximisera l'utilité


U(T) = ∫0T ln(c(t))exp(-at)dt.
 

Les actifs financiers A(t) de l'individu sont déterminés près l'équation :


dA/dt = y + rA - c.
 

Il y a également une condition cette les actifs financiers du l'individu à la fin de sa durée de vie soit non négatif; c.-à-d.,


A(T)≥0.
 

Ceci peut être considéré un problème de Bolzano avec X1=U and X2=A.

Les fonctions de direction sont :


dU/dt = ln(c(t))exp(-at)

dA/dt = rA + y - c.
 

La fonction objective est de maximiser U(T) sujet à la contrainte cela &GE D'A(T); 0. La contrainte peut être satisfaite en faisant l'objectif fonction

V(T) = U(T) + vA(T)
 

et choisissez le λ suffisamment grand pour assurer que A(T)≥; 0.

La fonction hamiltonienne est


H(t) = φUln(c)exp(-at) + φA[rA + y - c],
 

là où les variables d'adjoint sont marquées par le nom du variable correspondante d'état.

La condition pour un c optimal(t) est


φUexp(-at)/c - φA = 0,
ou
c(t) = φUexp(-at)/φA.
 

Les variables d'adjoint sont définies près


U/dt = -∂H/∂U = 0

A/dt = -∂H/∂A = -φAr.
 

Depuis dφU/dt = 0 for all t, φU = constant. Depuis φU(T)=1, φU(t)=1 pour tous t.

L'équation pour φA implique cela


(1/φA)(dφA)/dt) = -r
 

ainsi


d(ln[φA])/dt = -r
 

et par conséquent, en raison de intégration de t à T,


ln[φA(T)] - ln[φA(t)] = -r(T-t).
 

Depuis φ(T) = λ,


ln[φA(t)] = ln(λ) + r(T-t)

φA = λexp(r(T-t)).
 

Substitution des valeurs à φU and φAdans la condition pour un optimal c(t) donne


c(t) = exp(-at)/(λ exp(r(T-t))

ou, d'une manière equivalente,

c(t) = exp(-(a-r)t)/(λ exp(rT)).
 

Quand cette expression pour c(t) est substituée dans le différentiel équation

dA/dt = y(t) + rA(t) - c(t)
 

et l'équation est résolue pour A(T), une valeur de λ peut être trouvé à faites A(T)=0.

Un exemple de trouver un
optimal de politique Employer le principe de maximum de Pontryagin

Supposez cela quand il n'y a aucune pêche la croissance des poissons la population dans un lac est donnée près


dP/dt = 0.08P(1-0.000001P),
 

là où P est le nombre de poissons.

Cette équation indique cela

dP/dt = 0 when(1-0.000001P)=0; i.e., when P = 1,000,000.

Supposez que nous voulons choisir un niveau de consommation des poissons C(t) au cours de la période 0 à T qui maximisez l'utilité. Supposez que nous voulons choisir un niveau de consommation des poissons C(t) au cours de la période 0 à T qui maximisez l'utilité


U = ∫0T exp(-0.03t)ln(C(t))dt.
 

Ceci peut être mis dans la forme d'un problème de Bolzano; c.-à-d., maximisez U sujet à :


dU/dt = exp(-0.03t)ln(C(t))

dP/dt = 0.08P(1-0.000001P)-C(t).
 

and P(T)≥0.

La contrainte P(T)≥ 0 peut être remplacé par la condition cela

U(T)+λP(T) be maximized.

La fonction hamiltonienne est


H = φUexp(-0.03t)ln(C(t)) + φP[0.08P(1-0.000001P)-C*t)]
 

et par conséquent


U/dt = 0 et

P/dt = -φP(0.08)(1 - 0.000002P).
 

Depuis φU(T)=1, φU(t) = 1 pour tous t.

La deuxième équation implique cela


(1/φP)(dφP)/dt = -(0.08)(1 - 0.000002P)

ou d(ln(φPP)/dt = -(0.08)(1 - 0.000002P).
 

Le c(t) optimal est celui qui maximise H(t). C'est réalisé où


∂H)/∂C(t) = exp(-0.03t)/C(t) - φP = 0.
 

Ainsi le c(t) optimal est donné près


C(t) = exp(-0.03t)/φPP.
 

La politique optimale est trouvée en résolvant vers l'arrière du t=T trois équations


C(t) = exp(-0.03t)/φP

dP/dt = 0.08P(1-0.000001P) - C(t), P(T)=0

d(ln(φP)/dt = -(0.08)\(1 - 0.000002P),
φP(T) = λ,
 

Une solution approximative est employer déterminé

dP/dt = [P(t)-P(t-h)]/h
ainsi
P(t-h) = P(t) - h(dP/dt).
 

Une valeur de λ est choisi et la valeur de P(0) est déterminée. Si cette valeur n'égale pas la valeur initiale indiquée de P puis valeur de λ est ajusté.


HOME PAGE OF applet-magic
HOME PAGE OF Thayer Watkins