|
applet-magic.com Thayer Watkins Silicon Valley & Tornado Alley USA |
|---|
|
|---|
|
|
Le principe de maximum de Pontryagin s'applique à un type particulier de problème appelé un problème de Bolzano. La plupart des problèmes d'optimisation peuvent être mis dans la forme d'un problème de Bolzano, mais dans plus à ce sujet plus tard.
Un problème de Bolzano implique un certain nombre de variables d'état qui peuvent changer le temps fini où le temps t fonctionne de 0 au T. Supposons les variables d'état sont X1(t), X2(t),…, Xn(t). Nous voulons maximiser
V(T) = c1X1(T)
+ c2X2(T)
+ ...+cnXn(T),
étant donné que nous commençons le point X1(0), X2(0),…, Xn(0), et où les coefficients c1, c2,…, cn sont indiqués et T est la certaine heure finie définie. Nous sommes donnés de prétendues fonctions de direction pour commander les changements des variables d'état; c.-à-d.,
dX2/dt = f2(X1,X2,..,
Xn,u1,u2,..,um)
...........................................................
dXn/dt = fn(X1,X2,..,
Xn,u1,u2,..,um)
là où les variables u1, u2,…, um sont des fonctions de temps et s'appellent les variables de commande. L'objectif est de choisir les variables de commande à chaque instant de temps afin d'orienter les variables d'état de leurs valeurs initiales
à un certain point
X1(T), X2(T),...,Xn(T)
là où V(T) = c1X1(T) + c2X2(T) + ...cnXn(T) est maximisé.
Ceci semble être très un difficile chargent. Le principe maximum de Pontryagin fournit une solution ordonnée et systématique. la méthode une de Pontryagin d'instrument de
To définit un hamiltonien fonction
là où l'ensemble de variables d'adjoint φ1,φ2,..,φn sont tels que
= -Σi
φj∂fi)/
∂Xi
et φi(T)= ci pour i=1,2,..,n.
La valeur optima des variables de commande au temps t sont celle cela maximise le H.
Ceci signifie habituellement que uj(t) optimum est tel que
ΣiXi∂fi)/∂uj(t) = 0 for j=1,...,m.
Supposez qu'un individu a un revenu noninterest de y(t) pour 0≤ t≤ T ce qui peut être consommé ou sauvé à un taux d'intérêt de R. L'individu veut choisir un programme c(t) de consommation pour 0≤ t≤ T ce qui maximisera l'utilité
Les actifs financiers A(t) de l'individu sont déterminés près l'équation :
Il y a également une condition cette les actifs financiers du l'individu à la fin de sa durée de vie soit non négatif; c.-à-d.,
Ceci peut être considéré un problème de Bolzano avec X1=U and X2=A.
Les fonctions de direction sont :
dA/dt = rA + y - c.
La fonction objective est de maximiser U(T) sujet à la contrainte cela &GE D'A(T); 0. La contrainte peut être satisfaite en faisant l'objectif fonction
et choisissez le λ suffisamment grand pour assurer que A(T)≥; 0.
La fonction hamiltonienne est
là où les variables d'adjoint sont marquées par le nom du variable correspondante d'état.
La condition pour un c optimal(t) est
Les variables d'adjoint sont définies près
dφA/dt = -∂H/∂A = -φAr.
Depuis dφU/dt = 0 for all t, φU = constant. Depuis φU(T)=1, φU(t)=1 pour tous t.
L'équation pour φA implique cela
ainsi
et par conséquent, en raison de intégration de t à T,
Depuis φ(T) = λ,
φA = λexp(r(T-t)).
Substitution des valeurs à φU and φAdans la condition pour un optimal c(t) donne
ou, d'une manière equivalente,
c(t) = exp(-(a-r)t)/(λ exp(rT)).
Quand cette expression pour c(t) est substituée dans le différentiel équation
et l'équation est résolue pour A(T), une valeur de λ peut être trouvé à faites A(T)=0.
Supposez cela quand il n'y a aucune pêche la croissance des poissons la population dans un lac est donnée près
là où P est le nombre de poissons.
Cette équation indique cela
dP/dt = 0 when(1-0.000001P)=0; i.e., when P = 1,000,000.
Supposez que nous voulons choisir un niveau de consommation des poissons C(t) au cours de la période 0 à T qui maximisez l'utilité. Supposez que nous voulons choisir un niveau de consommation des poissons C(t) au cours de la période 0 à T qui maximisez l'utilité
Ceci peut être mis dans la forme d'un problème de Bolzano; c.-à-d., maximisez U sujet à :
dP/dt = 0.08P(1-0.000001P)-C(t).
and P(T)≥0.
La contrainte P(T)≥ 0 peut être remplacé par la condition cela
U(T)+λP(T) be maximized.
La fonction hamiltonienne est
et par conséquent
dφP/dt = -φP(0.08)(1 - 0.000002P).
Depuis φU(T)=1, φU(t) = 1 pour tous t.
La deuxième équation implique cela
ou
d(ln(φPP)/dt = -(0.08)(1 - 0.000002P).
Le c(t) optimal est celui qui maximise H(t). C'est réalisé où
Ainsi le c(t) optimal est donné près
La politique optimale est trouvée en résolvant vers l'arrière du t=T trois équations
dP/dt = 0.08P(1-0.000001P) - C(t), P(T)=0
d(ln(φP)/dt = -(0.08)\(1 - 0.000002P),
φP(T) = λ,
Une solution approximative est employer déterminé
Une valeur de λ est choisi et la valeur de P(0) est déterminée. Si cette valeur n'égale pas la valeur initiale indiquée de P puis valeur de λ est ajusté.
|
HOME PAGE OF Thayer Watkins |