Università di Stato del San José

applet-magic.com
Thayer Watkins
Silicon Valley
& vicolo di ciclone
Gli S.U.A.

Termini di secondo grado per ottimizzazione:
Costretto ed Uncostretto

Lo scopo di questa lettura è la derivazione dei termini di secondo grado per l'ottimizzazione in modo che il lettore non solo capisca che cosa quegli stati di secondo grado sono ma anche perché quelli sono gli stati adeguati. Per il caso non costretto le circostanze sono dichiarate in termini di tabella dei secondi derivati denominati la tabella di tela di iuta. la tabella di tela di iuta è intuitivo comprensibile. i termini per il caso costretto possono essere dichiarati facilmente in termini di tabella denominata la tela di iuta delimitata. Generazione dopo che la generazione di allievi di matematica applicata ha accettato la tela di iuta delimitata senza un indizio quanto a perché è l'entità relativa.

Per compiere l'obiettivo di fornitura della derivazione intuitiva degli stati di secondo grado quello, due e tre casi variabili sarà dato in primo luogo prima di muoversi verso il caso generale di variabile di n.

L'un caso variabile

Anche se questo caso è così semplice sembra quasi insignificante i relativi insiemi di analisi la fase per i casi più complessi.

Lasciare la f(x) è una funzione differenziabile. approssimazione quadratica alla f(x) vicino ad un certo punto x0 è dato vicino

f(x) = f(x0) + fx(x0)(x-x0) + ½fxx(x0)(x-x0)2
o, equivalente
df = fx(x0)dx + ½fxx(x0)(dx)2

dove dx=(x-x0) e df=f(x)-f(x0).

Un punto critico è un valore di x0 tali che fx(x0)=0. Se fx(x0)=0 allora

df = ½fxx(x0)(dx)2

Per un minimo il df deve essere positivo e (dx)2 è sempre positivo significa che il fxx(x0) deve essere positivo. Da un lato per un massimo il df deve essere negativo e quello richiede quel fxx(x0) è negativo. La tabella di tela di iuta per questo caso è appena 1×1 la tabella [fxx(x0)]. (In futuro il punto a cui i secondi derivati sono valutati non saranno espressi esplicitamente in modo da la tabella di tela di iuta per questo caso sarebbe detta per essere [fxx].

Non ci sono problemi di ottimizzazione costretta corrispondenti per questo caso un variabile.

Il caso di due variabili

Approssimazione quadratica circa il punto (x0, y0) per una funzione differenziabile f(x, y) è

df = fxdx + fydy + ½[fxxdxdx + fxydxdy + fyxdydx + fyydydy]
quale può essere espresso nella forma

df = fxdx + fydy + ½(dx, dy)H(dx, dy)T

dove (dx, dy) T è il vettore della colonna che è la trasposizione del vettore di fila (dx, dy) e

  | fxx    fxy |
H = |              |
  | fyx    fyy |

Per il caso non costretto un punto critico è uno tali che fx=0 e fy=0 così

df = ½(dx, dy)H(dx, dy)T

Per un minimo che lo stato di secondo grado è quella H essere una tabella definita positiva. Il conditon affinchè una tabella siano positiva che definito è che i relativi minori principali tutti sono positivi. Per un massimo, la H deve essere una tabella definita negativa che sarà il caso se i minori pincipal alternano nel segno.

Per il caso costretto un punto critico è definito in termini di metodo di Lagrange di moltiplicatore. Supporre che il vincolo sia

pxx + pyy = I
nel qual caso
i primi stati di ordine sono
fx = λpx
fy = λpy

dove il λ, il moltiplicatore di Lagrange, è scelto in modo da fare soddisfare i valori critici il vincolo.

L'approssimazione quadratica può ora essere espressa as

df = λpxdx + λpydy + ½(dx, dy)H(dx, dy)T

Poiché tutte le deviazioni dal punto critico devono anche soddisfare il vincolo

pxdx + pydy = 0

quindi

df = λ(pxdx + pydy) + ½(dx, dy)H(dx, dy)T
= ½(dx, dy)H(dx, dy)T

ma ora la H non deve essere definito positivo o negativo per un estremo (massimo o minimo) perché il dx ed il dy non sono senza restrizione; cioè, soltanto dx e dy tali che il pxdx+pydy=0 è permesso. Ciò rende specificando le circostanze sulla H molto difficile. Ulteriore analisi del caso costretto sarà posposta fino a dopo la considerazione dell'argomento non costretto per tre variabili.

Il caso di tre variabili

Per una funzione trinary f(x, y, z) l'approssimazione quadratica delle deviazioni è

df = fxdx + fydy + fzdz + ½(dx, dy, dz)H(dx, dy, dz)T

dove ora la H è data vicino

  | fxx    fxy    fxz |
H = | fyx    fyy    fyz |
  | fzx    fzy    fzz |

Come nel caso non costretto variabile uno e due i primi termini di ordine spariscono ed i termini per un minimo è la definitività positiva della H e la definitività similmente negativa per il massimo. Quelle circostanze a loro volta possono essere dichiarate in termini di segni dei minori principali del H. Ci è niente di nuovo qui per questo caso.

L'importanza di questo caso è che il caso costretto di due variabili può essere riesposto in termini di caso di tre variabili con l'uso del metodo di Lagrange di moltiplicatore.

Nel metodo di Lagrange di moltiplicatore il problema di ottimizzazione di minimizzazione della f(x, y) riguardo alla x ed a y conforme al vincolo di pxx+pyy = I è trasformata in un problema di tre variabili di minimizzazione non costretta

L(x,y,λ) = f(x,y) - λ(pxx + pyy - I)

riguardo alla x, a y e a λ.

Il primo termine di ordine per λ è

Lλ = pxx + pyy - I = 0
quale è equivalente a soddisfare il vincolo.

L'approssimazione quadratica per la L (x, y, λ) allora è

dL = Lxdx + Lydy + Lλ
+ ½(dx, dy, dλ)H*(dx, dy, dλ)T
quale sulla base della definizione della L si riduce a
dL = fxdx + fydy + (pxx + pyy - I)dλ + ½(dx, dy, dλ)H*(dx, dy, dλ)T
e per i primi stati di ordine
dL = λpxdx + λpydy + (pxx + pyy - I)dλ
+ ½(dx, dy, dλ)H*(dx, dy, dλ)T

A causa del satisfication dei vincoli i primi due termini si riducono a zero e similarmente al terzo termine. Così il valore del dL è dato vicino

dL = + ½(dx, dy, dλ)H*(dx, dy, dλ)T

I conditons di secondo grado per il caso costretto di due variabili allora possono essere indicati in termini di tela di iuta H* per il caso corrsponding di tre variabili. Il carattere di H* è dato in primo luogo notando quello

Lx = fx - λpx
Ly = fy - λpy
Lλ = -(pxx + pyy - I)

Ed i secondi derivati sono dati così come:

  | fxx    fxy    -px |
H* = | fyx    fyy    -py |
  | -px    -py    0   |

Così questa è la tela di iuta delimitata enigmatica. La definitività positiva o negativa di H* allora costituisce i termini di secondo grado per il problema di ottimizzazione costretta.


HOME PAGE di applet-magic.com
HOME PAGE di Thayer Watkins