Matriu hessiana

De Viquipèdia
Dreceres ràpides: navegació, cerca

En matemàtiques, la matriu Hessiana d'una funció f de n variables, és una matriu quadrada n x n amb les segones derivades parcials.

Donada una funció real f de n variables reals

f(x)=f(x_1, x_2, ...,x_n)

Si totes les derivades segones parcials de f existeixen, es defineix la matriu Hessiana de f, H_f \mathbf(x) de manera que l'element i,j de la matriu es calcula:

H_f (x)_{i,j}=\frac{\partial^2 f(x)}{\partial x_i \partial x_j}

Per tant la matriu Hessiana s'escriu de la forma:

H_f = \begin{bmatrix}
\frac{\partial^2 f}{\partial x_1^2} & \frac{\partial^2 f}{\partial x_1\,\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_1\,\partial x_n} \\ \\
\frac{\partial^2 f}{\partial x_2\,\partial x_1} & \frac{\partial^2 f}{\partial x_2^2} & \cdots & \frac{\partial^2 f}{\partial x_2\,\partial x_n} \\ \\
\vdots & \vdots & \ddots & \vdots \\ \\
\frac{\partial^2 f}{\partial x_n\,\partial x_1} & \frac{\partial^2 f}{\partial x_n\,\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_n^2}
\end{bmatrix}

El terme matriu Hessiana (o discriminant Hessià) va ser introduït pel matemàtic anglès James Joseph Sylvester que les va anomenar en honor del matemàtic alemany Ludwig Otto Hesse. Les matrius Hessianes es fan servir normalment per resoldre problemes d'optimització amb funcions de diverses variables.

Simetria de la matriu Hessiana[modifica | modifica el codi]

Seguint el teorema de Young, en el cas que la funció f definida com

f \colon A \subseteq \mathbb{R}^n \to \mathbb{R}

tingui derivades parcials contínues per qualsevol punt del domini obert A, per exemple, prenguem el punt (a_1, a_2,..., a_n), llavors, segons el teorema de Clairaut, per qualsevol 1<i,j<n tenim que:

\frac{\partial^2 f}{\partial x_i\, \partial x_j}(a_1, \dots, a_n) = \frac{\partial^2 f}{\partial x_j\, \partial x_i}(a_1, \dots, a_n).

i per tant, l'ordre de derivació per obtenir derivades segones parcials no importa. En conclusió, donades aquestes circumstàncies, la matriu Hessiana de f és una matriu simètrica.

Aplicació de la matriu Hessiana[modifica | modifica el codi]

La matriu Hessiana té aplicacions en el marc de la programació lineal, per trobar punts crítics així com estudiar la concavitat i convexitat d'una funció de diverses variables. Això és especialment útil dintre del món empresarial, on molt sovint s'han de prendre decisions sobre les condicions de producció, tècniques, quantitats a produir, etc., subjectes a restriccions físiques de l'empresa o bé financeres. La programació matemàtica és l'aplicació del mètode científic a problemes relacionats amb el control d'empreses o sistemes, a fi d'obtenir les millors solucions segons els objectius de l'empresa.

Si considerem que una empresa està afectada per diversos factors, podem expresar-ho com una funció real de diverses variables, és a dir, una funció definida sobre un conjunt dintre de l'espai Rⁿ.

Una funció de diverses variables es pot derivar aplicant les regles de derivació de les funcions reals d'una variable, si considerem que totes les variables són constants excepte una. Així, podem fer la derivada parcial de la funció respecte cada una de les n variables.

Cada una de les derivades parcials es pot tornar a derivar respecte cada una de les variables. Disposant aquests resultats en una matriu obtindrem la matriu Hessiana de les derivades parcials en un punt.

La matriu hessiana en un punt, x∈Rⁿ, la representem per H(x)f. Existeixen diversos mètodes per a la seva aplicació, detallats a continuació.

Concavitat/Convexitat[modifica | modifica el codi]

Sigui A \subseteq \mathbb{R}^n un conjunt obert i f \colon A \to \mathbb{R} una funció amb derivades segones contínues:

  1. f és còncava si, i només si, \forall a \in A, la matriu Hessiana Hf(a) és semidefinida negativa.
  2. Si \forall a \in A la matriu Hessiana Hf(a) és definida negativa, llavors f és estrictament còncava.
  • Si f és una funció còncava, llavors qualsevol punt en què totes les derivades parcials són zero, és un màxim global.
  1. f és convexa si, i només si, \forall a \in A, la matriu Hessiana Hf(a) és semidefinida positiva.
  2. Si \forall a \in A la matriu Hessiana Hf(a) és definida positiva, llavors f és estrictament convexa.
  • Si f és una funció convexa, llavors qualsevol punt en què totes les derivades parcials són zero, és un mínim global.

Mètode per trobar punts crítics[modifica | modifica el codi]

Es veurà a continuació com trobar els punts crítics (màxims, mínims i punts de sella) d'una funció f de múltiples variables.

  1. S'igualen les derivades parcials primeres a zero.
  2. Es resolen les equacions anteriors i se n'obtenen les coordenades dels punts crítics.
  3. Es construeix la matriu Hessiana (derivades segones parcials).
  4. Segons els valors dels menors preferents dominants de la matriu Hessiana avaluades als diferents punts crítics. aquests punts poden ser:
  • Màxim: si la matriu Hessiana en el punt és definida negativa (tots els menors preferents dominants són diferents de 0 i, a més, alternen en signe, essent el primer negatiu).
  • Mínim: si la matriu Hessiana en el punt és definida positiva (tots els menors preferents dominants són més grans que 0).
  • Punt de Sella: si la matriu Hessiana en el punt és indefinida (no definida o semidefinida positiva ni definida o semidefinida negativa).

Matriu Hessiana orlada[modifica | modifica el codi]

Una altra aplicació de la matriu Hessiana és, en una funció f de n variables restringida a un domini determinat per una funció o funcions g = C on C es una constant , determinar si els seus punts crítics són màxims locals o mínims locals. El procés és el següent:

  • S'obté el valor o valors crítics de f restringida a g = C, així com el valor del multiplicador de Lagrange (λ).
  • Plantegem la Matriu Hessiana. La forma general de la qual és:
H(f,g) = \begin{bmatrix}
0 & \frac{\partial g}{\partial x_1} & \frac{\partial g}{\partial x_2} & \cdots & \frac{\partial g}{\partial x_n} \\ \\
\frac{\partial g}{\partial x_1} & \frac{\partial^2 f}{\partial x_1^2} & \frac{\partial^2 f}{\partial x_1\,\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_1\,\partial x_n} \\ \\
\frac{\partial g}{\partial x_2} & \frac{\partial^2 f}{\partial x_2\,\partial x_1} & \frac{\partial^2 f}{\partial x_2^2} & \cdots & \frac{\partial^2 f}{\partial x_2\,\partial x_n} \\ \\
\vdots & \vdots & \vdots & \ddots & \vdots \\ \\
\frac{\partial g}{\partial x_n} & \frac{\partial^2 f}{\partial x_n\,\partial x_1} & \frac{\partial^2 f}{\partial x_n\,\partial x_2} & \cdots & \frac{\partial^2 f}{\partial x_n^2}
\end{bmatrix}

On f de la matriu Hessiana orlada correspondria a la funció Lagrangiana.

  • Calculem la Hessiana orlada al punt crític.
  • Estudiem si el punt crític és un màxim o un mínim:
  1. Es tractarà d'un màxim local de la funció f sota les restriccions g= C si els últims n - m (on n és el nombre de variables i m el nombre de restriccions)menors principals dominants de la matriu Hessiana orlada evaluats al punt crític tenen signes alternats començant amb un signe negatiu.
  2. Es tractarà d'un mínim local de la funció f sota les restriccions g= C si els últims n - m (on n és el nombre de variables i m el nombre de restriccions)menors principals dominants de la matriu Hessiana orlada evaluats al punt crític tenen tots signe negatiu.

Vegeu també[modifica | modifica el codi]