Matriz hessiana

Em matemática , a matriz Hessiana (ou simplesmente a Hessiana ou a Hessiana ) de uma função numérica é a matriz quadrada, notada , de suas segundas derivadas parciais . $f$ $H (f)$

Definição

Dada uma função de valor real $f$

{\ displaystyle f: \ mathbb {R} ^ {n} \ to \ mathbb {R}; (x_ {1}, ..., x_ {n}) \ mapsto f (x_ {1}, ..., x_ {n})}

de que todas as segundas derivadas parciais existem, vale o coeficiente de índice da matriz Hessiana . $eu j$ $H (f)$ $H_ {ij} (f) = {\ frac {\ parcial ^ {2} f} {\ parcial x_ {i} \ parcial x_ {j}}}$

Em outras palavras,

{\ displaystyle H (f) = {\ begin {bmatrix} {\ frac {\ partial ^ {2} f} {{\ partial x_ {1}} ^ {2}}} & {\ frac {\ partial ^ { 2} f} {\ parcial x_ {1} \ parcial x_ {2}}} & \ cdots & {\ frac {\ parcial ^ {2} f} {\ parcial x_ {1} \ parcial x_ {n}}} \\ {\ frac {\ parcial ^ {2} f} {\ parcial x_ {2} \ parcial x_ {1}}} & {\ frac {\ parcial ^ {2} f} {{\ parcial x_ {2} } ^ {2}}} & \ cdots & {\ frac {\ parcial ^ {2} f} {\ parcial x_ {2} \ parcial x_ {n}}} \\\ vdots & \ vdots & \ ddots & \ vdots \\ {\ frac {\ parcial ^ {2} f} {\ parcial x_ {n} \ parcial x_ {1}}} & {\ frac {\ parcial ^ {2} f} {\ parcial x_ {n} \ parcial x_ {2}}} & \ cdots & {\ frac {\ parcial ^ {2} f} {{\ parcial x_ {n}} ^ {2}}} \ end {bmatrix}}}

Chamamos de discriminante Hessiano (ou simplesmente Hessiano ) o determinante desta matriz.

O termo "Hessian" foi introduzido por James Joseph Sylvester , em homenagem ao matemático alemão Ludwig Otto Hesse .

Deixe em particular ser uma função de classe definida em um espaço aberto , com valores reais. Sua matriz Hessiana é bem definida e em virtude do teorema de Schwarz , é simétrica . $f$ ${\ mathcal {C}} ^ {2}$ $você$ $E$

Chamado forma de Hesse a forma quadrática associada com a matriz de Hesse.

Aplicação ao estudo de pontos críticos

Assumimos uma classe função C 2 em um um aberto . A matriz Hessiana permite, em muitos casos, determinar a natureza dos pontos críticos da função , ou seja, os pontos de cancelamento do gradiente . $f$ $você$ $f$

Condição necessária extrema local

Se for um ponto mínimo local de , então é um ponto crítico e o Hessiano é positivo (ou seja, a forma Hessiana é positiva). $no$ $f$ $no$
Se for um ponto máximo local de , então é um ponto crítico e o Hessiano é negativo (ou seja, a forma Hessiana é negativa). $no$ $f$ $no$

Em particular, se o Hessiano em um ponto crítico tem pelo menos um autovalor estritamente positivo e um autovalor estritamente negativo, o ponto crítico é um ponto de sela .

Condição suficiente de extremo local

Precisamente, um ponto crítico de é dito degenerado quando o discriminante de Hessian desaparece, em outras palavras, quando 0 é o autovalor de Hessian. Em um ponto crítico não degenerado, o sinal dos valores próprios (todos diferentes de zero) determina a natureza deste ponto (ponto final local ou ponto col): $f$

se o Hessiano é definido positivo , a função atinge um mínimo local estrito no ponto crítico;
se o Hessiano é definido negativo, a função atinge um máximo local estrito no ponto crítico;
se houver autovalores de cada sinal, o ponto crítico é um ponto col (veja acima ).

Neste último caso, o índice do ponto crítico é definido como a dimensão máxima de um subespaço no qual o Hessiano é definido como negativo. É também o número de autovalores negativos.

Na dimensão dois em particular, sendo o discriminante Hessiano o produto dos autovalores, seu sinal é suficiente para determinar a natureza de um ponto crítico não degenerado.

Finalmente, para um ponto crítico degenerado, nenhuma dessas implicações é verdadeira. Um dos exemplos mais simples de um ponto crítico degenerado é a sela do macaco .

Curva de Hessian

Se for a curva algébrica da equação projetiva (homogênea) , chamamos de curva Hessiana (ou simplesmente Hessiana) da curva cuja equação projetiva é , onde está a Hessiana (o determinante da matriz Hessiana) de . O Hessian de tem por intersecção com os pontos críticos e os pontos de inflexão de . Se é de grau , seu hessiano é de grau ; de acordo com o teorema de Bézout , o número de pontos de inflexão de uma curva regular de graus é , portanto , que é um caso particular de uma das fórmulas de Plücker . $VS$ $f (x, y, z) = 0$ $VS$ $| H (f) | (x, y, z) = 0$ $| H (f) |$ $f$ $f$ $VS$ $VS$ $VS$ $d$ ${\ displaystyle 3 (d-2)}$ $d$ ${\ displaystyle 3d (d-2)}$

Extensão para a estrutura de manifolds diferenciais

Quando uma variedade diferencial e uma função numérica suave terminam , é possível definir a diferença de em qualquer ponto, mas não a matriz Hessiana, como vemos escrevendo uma fórmula de mudança de mapas. No entanto, quando é um ponto crítico para a função , a matriz Hessiana de en pode de fato ser definida. Podemos, portanto, falar de um ponto crítico degenerado ou não e definir o índice desse ponto. $M$ $f$ $M$ ${\ displaystyle \ mathrm {d} _ {x} f}$ $f$ $m$ $f$ $f$ $m$

É possível fornecer uma definição deste Hessian em um ponto crítico , sem recorrer a mapas locais. De facto, o ponto admite para imagem pelo elemento nulo da fibra no feixe co-tangente . A aplicação linear tangente chega assim ao espaço tangente neste ponto, que admite uma decomposição canônica . O Hessian é obtido considerando apenas o segundo termo dessa decomposição (o primeiro é trivial). Podemos, portanto, vê-lo como uma aplicação bilinear $m$ $m$ ${\ displaystyle \ mathrm {d} _ {m} f}$ ${\ displaystyle 0_ {m}}$ $m$ ${\ displaystyle T ^ {\ ast} M}$ ${\ displaystyle T_ {m} \ mathrm {d} f}$ ${\ displaystyle T_ {0_ {m}} T ^ {\ ast} M \ simeq T_ {m} M \ oplus T_ {m} ^ {\ ast} M}$

{\ displaystyle \ mathrm {Hess} _ {m} (f) :( v, w) \ in T_ {m} M \ vezes T_ {m} M \ mapsto T_ {m} (df) (v) (w) .}

Extensão para a estrutura de variedades Riemannianas

Definição

Quando é uma variedade Riemanniana e , a conexão de Levi-Civita da métrica Riemanniana nos permite definir o tensor de Hess $(M, g)$ ${\ displaystyle f \ in {\ mathcal {C}} ^ {\ infty} (M; \ mathbb {R})}$ $\ nabla$ $g$

{\ displaystyle \ mathrm {Hess} (f) \ in \ Gamma ^ {\ infty} (T ^ {*} M \ otimes T ^ {*} M)}

de por: $f$

{\ displaystyle \ mathrm {Hess} (f): = \ nabla \ nabla f = \ nabla \ mathrm {d} f}

Em coordenadas locais , o tensor Hessiano é expresso como: $\ {XI \}$

{\ displaystyle \ mathrm {Hess} (f) = \ nabla _ {i} \, \ partial _ {j} f \ \ mathrm {d} x_ {i} \! \ otimes \! \ mathrm {d} x_ { j} = \ left ({\ frac {\ partial ^ {2} f} {\ partial x_ {i} \ partial x_ {j}}} - \ Gamma _ {ij} ^ {k} {\ frac {\ partial f} {\ parcial x_ {k}}} \ direita) \ mathrm {d} x_ {i} \ otimes \ mathrm {d} x_ {j}}

onde são os símbolos de Christoffel da conexão . O tensor hessiano também tem as seguintes expressões: ${\ displaystyle \ Gamma _ {ij} ^ {k}}$ $\ nabla$

{\ displaystyle \ mathrm {Hess} (f) (X, Y) = g (\ nabla _ {X} \ mathrm {grad} f, Y)}

{\ displaystyle \ mathrm {Hess} (f) (X, Y) = X (Yf) - \ mathrm {d} f (\ nabla _ {X} Y)}

Formulários

Usando o tensor Hessiano, podemos estender a noção de função convexa (ou estritamente convexa) para funções numéricas em variedades Riemannianas: estas são aquelas para as quais o Hessiano é, em cada ponto, uma forma bilinear positiva (ou definida positiva).

Também podemos encontrar o fato de que a Hessiana de uma função real suave em uma variedade diferencial é bem definida, independentemente de qualquer escolha de métrica, nos pontos críticos de . Na verdade, sempre é possível fornecer uma métrica Riemanniana particular. E se for um ponto crítico de , a expressão em coordenadas locais do tensor Hessiano é: $f$ $M$ $f$ $M$ $m$ $f$ $m$

{\ displaystyle \ mathrm {Hess} (f) _ {m} = \ left. {\ frac {\ partial ^ {2} f} {\ partial x_ {i} \ partial x_ {j}}} \ right | _ {m} \ mathrm {d} x_ {i} \ otimes \ mathrm {d} x_ {j}}

Os coeficientes do tensor Hessiano de em um ponto crítico são bastante independentes da métrica Riemanniana. $f$ ${\ displaystyle m \ in \ mathrm {crit} (f)}$

Lema de Morse

O lema de Morse mostra que o comportamento de um traço regular na vizinhança de um ponto crítico não degenerado é inteiramente determinado pelo conhecimento do índice do ponto crítico .

Lema de Morse - Seja uma função sobre uma variedade diferencial de dimensão . Consideramos um ponto crítico não degenerado da função e denotamos seu índice. Então existe um sistema de coordenadas local centrado em e tal que a expressão correspondente de é $f$ ${\ mathcal C} ^ {\ infty}$ $não$ $m$ $f$ $k$ $x_ {1}, \ pontos, x_ {n}$ $m$ $f$

{\ displaystyle f (x) = f (m) - {x_ {1}} ^ {2} - \ cdots - {x_ {k}} ^ {2} + {x_ {k + 1}} ^ {2} + \ cdots + {x_ {n}} ^ {2}}

Chamamos esse sistema de coordenadas de Morse .

Resulta em particular do lema que os pontos críticos não degenerados são isolados .

O lema de Morse generaliza para espaços de Hilbert sob o nome de lema de Morse-Palais (en) .

Teoria de Morse

Uma função com todos os pontos críticos não degenerados e todos os valores críticos distintos é chamada de função de Morse . O objetivo da teoria de Morse é relacionar o estudo da topologia da variedade ao dos pontos críticos das funções que podem ser definidas ali.

Notas e referências

Como mostra o exemplo de funções constantes, o Hessian em um ponto de mínimo local (resp. De máximo local) pode não ser definido positivo (resp. Definido negativo).
(en) G. Salmon Higher Plane Curves , Stechert (1934)
Patrick Massot, Topologia diferencial , p. 46
(in) Jürgen Jost , Riemannian Geometry and Geometric Analysis ,2002[ detalhe das edições ], p. 139 .
(in) Jürgen Jost , Riemannian Geometry and Geometric Analysis ,2002[ detalhe das edições ], p. 140
(em) John Milnor , Morse Theory , Princeton University Press, 1963 ( ISBN 0-691-08008-9 ) , p. 6 .

Veja também

Link externo

G. Frasco, minicurso de otimização

Matriz hessiana

Definição

Aplicação ao estudo de pontos críticos

Condição necessária extrema local

Condição suficiente de extremo local

Curva de Hessian

Extensão para a estrutura de manifolds diferenciais

Extensão para a estrutura de variedades Riemannianas

Definição

Formulários

Lema de Morse

Teoria de Morse

Notas e referências

Veja também

Artigos relacionados

Link externo