Matriz hessiana
Em matemática , a matriz Hessiana (ou simplesmente a Hessiana ou a Hessiana ) de uma função numérica é a matriz quadrada, notada , de suas segundas derivadas parciais .
f{\ displaystyle f}
H(f){\ displaystyle H (f)}![H (f)](https://wikimedia.org/api/rest_v1/media/math/render/svg/9b46f9c382d86726fdc7a7d1814366a5a49bdfa6)
Definição
Dada uma função de valor real
f{\ displaystyle f}![f](https://wikimedia.org/api/rest_v1/media/math/render/svg/132e57acb643253e7810ee9702d9581f159a1c61)
f:Rnão→R;(x1,...,xnão)↦f(x1,...,xnão){\ displaystyle f: \ mathbb {R} ^ {n} \ to \ mathbb {R}; (x_ {1}, ..., x_ {n}) \ mapsto f (x_ {1}, ..., x_ {n})}![{\ displaystyle f: \ mathbb {R} ^ {n} \ to \ mathbb {R}; (x_ {1}, ..., x_ {n}) \ mapsto f (x_ {1}, ..., x_ {n})}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ee9c43d4d9cf49144cd8d71eba1fef378a8ff265)
de que todas as segundas derivadas parciais existem, vale o coeficiente de índice da matriz Hessiana .
eu,j{\ displaystyle i, j}
H(f){\ displaystyle H (f)}
Heuj(f)=∂2f∂xeu∂xj{\ displaystyle H_ {ij} (f) = {\ frac {\ parcial ^ {2} f} {\ parcial x_ {i} \ parcial x_ {j}}}}![H_ {ij} (f) = {\ frac {\ parcial ^ {2} f} {\ parcial x_ {i} \ parcial x_ {j}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2174d580e6232a6a9924f82e451f6f7abaf9d3c7)
Em outras palavras,
H(f)=[∂2f∂x12∂2f∂x1∂x2⋯∂2f∂x1∂xnão∂2f∂x2∂x1∂2f∂x22⋯∂2f∂x2∂xnão⋮⋮⋱⋮∂2f∂xnão∂x1∂2f∂xnão∂x2⋯∂2f∂xnão2]{\ displaystyle H (f) = {\ begin {bmatrix} {\ frac {\ partial ^ {2} f} {{\ partial x_ {1}} ^ {2}}} & {\ frac {\ partial ^ { 2} f} {\ parcial x_ {1} \ parcial x_ {2}}} & \ cdots & {\ frac {\ parcial ^ {2} f} {\ parcial x_ {1} \ parcial x_ {n}}} \\ {\ frac {\ parcial ^ {2} f} {\ parcial x_ {2} \ parcial x_ {1}}} & {\ frac {\ parcial ^ {2} f} {{\ parcial x_ {2} } ^ {2}}} & \ cdots & {\ frac {\ parcial ^ {2} f} {\ parcial x_ {2} \ parcial x_ {n}}} \\\ vdots & \ vdots & \ ddots & \ vdots \\ {\ frac {\ parcial ^ {2} f} {\ parcial x_ {n} \ parcial x_ {1}}} & {\ frac {\ parcial ^ {2} f} {\ parcial x_ {n} \ parcial x_ {2}}} & \ cdots & {\ frac {\ parcial ^ {2} f} {{\ parcial x_ {n}} ^ {2}}} \ end {bmatrix}}}![{\ displaystyle H (f) = {\ begin {bmatrix} {\ frac {\ partial ^ {2} f} {{\ partial x_ {1}} ^ {2}}} & {\ frac {\ partial ^ { 2} f} {\ parcial x_ {1} \ parcial x_ {2}}} & \ cdots & {\ frac {\ parcial ^ {2} f} {\ parcial x_ {1} \ parcial x_ {n}}} \\ {\ frac {\ parcial ^ {2} f} {\ parcial x_ {2} \ parcial x_ {1}}} & {\ frac {\ parcial ^ {2} f} {{\ parcial x_ {2} } ^ {2}}} & \ cdots & {\ frac {\ parcial ^ {2} f} {\ parcial x_ {2} \ parcial x_ {n}}} \\\ vdots & \ vdots & \ ddots & \ vdots \\ {\ frac {\ parcial ^ {2} f} {\ parcial x_ {n} \ parcial x_ {1}}} & {\ frac {\ parcial ^ {2} f} {\ parcial x_ {n} \ parcial x_ {2}}} & \ cdots & {\ frac {\ parcial ^ {2} f} {{\ parcial x_ {n}} ^ {2}}} \ end {bmatrix}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/fb7f47fa85b946f8b56f3a1591c82223b65248d4)
.
Chamamos de discriminante Hessiano (ou simplesmente Hessiano ) o determinante desta matriz.
O termo "Hessian" foi introduzido por James Joseph Sylvester , em homenagem ao matemático alemão Ludwig Otto Hesse .
Deixe em particular ser uma função de classe definida em um espaço aberto , com valores reais. Sua matriz Hessiana é bem definida e em virtude do teorema de Schwarz , é simétrica .
f{\ displaystyle f}
VS2{\ displaystyle {\ mathcal {C}} ^ {2}}
você{\ displaystyle U}
E{\ displaystyle E}![E](https://wikimedia.org/api/rest_v1/media/math/render/svg/4232c9de2ee3eec0a9c0a19b15ab92daa6223f9b)
Chamado forma de Hesse a forma quadrática associada com a matriz de Hesse.
Aplicação ao estudo de pontos críticos
Assumimos uma classe função C 2 em um um aberto . A matriz Hessiana permite, em muitos casos, determinar a natureza dos pontos críticos da função , ou seja, os pontos de cancelamento do gradiente .
f{\ displaystyle f}
você{\ displaystyle U}
f{\ displaystyle f}![f](https://wikimedia.org/api/rest_v1/media/math/render/svg/132e57acb643253e7810ee9702d9581f159a1c61)
Condição necessária extrema local
- Se for um ponto mínimo local de , então é um ponto crítico e o Hessiano é positivo (ou seja, a forma Hessiana é positiva).no{\ displaystyle a}
f{\ displaystyle f}
no{\ displaystyle a}![no](https://wikimedia.org/api/rest_v1/media/math/render/svg/ffd2487510aa438433a2579450ab2b3d557e5edc)
- Se for um ponto máximo local de , então é um ponto crítico e o Hessiano é negativo (ou seja, a forma Hessiana é negativa).no{\ displaystyle a}
f{\ displaystyle f}
no{\ displaystyle a}![no](https://wikimedia.org/api/rest_v1/media/math/render/svg/ffd2487510aa438433a2579450ab2b3d557e5edc)
Em particular, se o Hessiano em um ponto crítico tem pelo menos um autovalor estritamente positivo e um autovalor estritamente negativo, o ponto crítico é um ponto de sela .
Condição suficiente de extremo local
Precisamente, um ponto crítico de é dito degenerado quando o discriminante de Hessian desaparece, em outras palavras, quando 0 é o autovalor de Hessian. Em um ponto crítico não degenerado, o sinal dos valores próprios (todos diferentes de zero) determina a natureza deste ponto (ponto final local ou ponto col):
f{\ displaystyle f}![f](https://wikimedia.org/api/rest_v1/media/math/render/svg/132e57acb643253e7810ee9702d9581f159a1c61)
- se o Hessiano é definido positivo , a função atinge um mínimo local estrito no ponto crítico;
- se o Hessiano é definido negativo, a função atinge um máximo local estrito no ponto crítico;
- se houver autovalores de cada sinal, o ponto crítico é um ponto col (veja acima ).
Neste último caso, o índice do ponto crítico é definido como a dimensão máxima de um subespaço no qual o Hessiano é definido como negativo. É também o número de autovalores negativos.
Na dimensão dois em particular, sendo o discriminante Hessiano o produto dos autovalores, seu sinal é suficiente para determinar a natureza de um ponto crítico não degenerado.
Finalmente, para um ponto crítico degenerado, nenhuma dessas implicações é verdadeira. Um dos exemplos mais simples de um ponto crítico degenerado é a sela do macaco .
Curva de Hessian
Se for a curva algébrica da equação projetiva (homogênea) , chamamos de curva Hessiana (ou simplesmente Hessiana) da curva cuja equação projetiva é , onde está a Hessiana (o determinante da matriz Hessiana) de . O Hessian de tem por intersecção com os pontos críticos e os pontos de inflexão de . Se é de grau , seu hessiano é de grau ; de acordo com o teorema de Bézout , o número de pontos de inflexão de uma curva regular de graus é , portanto , que é um caso particular de uma das fórmulas de Plücker .
VS{\ displaystyle C}
f(x,y,z)=0{\ displaystyle f (x, y, z) = 0}
VS{\ displaystyle C}
|H(f)|(x,y,z)=0{\ displaystyle | H (f) | (x, y, z) = 0}
|H(f)|{\ displaystyle | M (f) |}
f{\ displaystyle f}
f{\ displaystyle f}
VS{\ displaystyle C}
VS{\ displaystyle C}
VS{\ displaystyle C}
d{\ displaystyle d}
3(d-2){\ displaystyle 3 (d-2)}
d{\ displaystyle d}
3d(d-2){\ displaystyle 3d (d-2)}![{\ displaystyle 3d (d-2)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2c460a3c1c29367ca10ef64427dab632af1ffc52)
Extensão para a estrutura de manifolds diferenciais
Quando uma variedade diferencial e uma função numérica suave terminam , é possível definir a diferença de em qualquer ponto, mas não a matriz Hessiana, como vemos escrevendo uma fórmula de mudança de mapas. No entanto, quando é um ponto crítico para a função , a matriz Hessiana de en pode de fato ser definida. Podemos, portanto, falar de um ponto crítico degenerado ou não e definir o índice desse ponto.
M{\ displaystyle M}
f{\ displaystyle f}
M{\ displaystyle M}
dxf{\ displaystyle \ mathrm {d} _ {x} f}
f{\ displaystyle f}
m{\ displaystyle m}
f{\ displaystyle f}
f{\ displaystyle f}
m{\ displaystyle m}![m](https://wikimedia.org/api/rest_v1/media/math/render/svg/0a07d98bb302f3856cbabc47b2b9016692e3f7bc)
É possível fornecer uma definição deste Hessian em um ponto crítico , sem recorrer a mapas locais. De facto, o ponto admite para imagem pelo elemento nulo da fibra no feixe co-tangente . A aplicação linear tangente chega assim ao espaço tangente neste ponto, que admite uma decomposição canônica . O Hessian é obtido considerando apenas o segundo termo dessa decomposição (o primeiro é trivial). Podemos, portanto, vê-lo como uma aplicação bilinear
m{\ displaystyle m}
m{\ displaystyle m}
dmf{\ displaystyle \ mathrm {d} _ {m} f}
0m{\ displaystyle 0_ {m}}
m{\ displaystyle m}
T∗M{\ displaystyle T ^ {\ ast} M}
Tmdf{\ displaystyle T_ {m} \ mathrm {d} f}
T0mT∗M≃TmM⊕Tm∗M{\ displaystyle T_ {0_ {m}} T ^ {\ ast} M \ simeq T_ {m} M \ oplus T_ {m} ^ {\ ast} M}![{\ displaystyle T_ {0_ {m}} T ^ {\ ast} M \ simeq T_ {m} M \ oplus T_ {m} ^ {\ ast} M}](https://wikimedia.org/api/rest_v1/media/math/render/svg/59dfd10ae4e9bb2c36507fee4acc15f92cf3bbb3)
Hessm(f):(v,C)∈TmM×TmM↦Tm(df)(v)(C).{\ displaystyle \ mathrm {Hess} _ {m} (f) :( v, w) \ in T_ {m} M \ vezes T_ {m} M \ mapsto T_ {m} (df) (v) (w) .}![{\ displaystyle \ mathrm {Hess} _ {m} (f) :( v, w) \ in T_ {m} M \ vezes T_ {m} M \ mapsto T_ {m} (df) (v) (w) .}](https://wikimedia.org/api/rest_v1/media/math/render/svg/edc98dbb9f6cd767311ee110d85800cdabffba06)
Extensão para a estrutura de variedades Riemannianas
Definição
Quando é uma variedade Riemanniana e , a conexão de Levi-Civita da métrica Riemanniana nos permite definir o tensor de Hess(M,g){\ displaystyle (M, g)}
f∈VS∞(M;R){\ displaystyle f \ in {\ mathcal {C}} ^ {\ infty} (M; \ mathbb {R})}
∇{\ displaystyle \ nabla}
g{\ displaystyle g}
Hess(f)∈Γ∞(T∗M⊗T∗M){\ displaystyle \ mathrm {Hess} (f) \ in \ Gamma ^ {\ infty} (T ^ {*} M \ otimes T ^ {*} M)}![{\ displaystyle \ mathrm {Hess} (f) \ in \ Gamma ^ {\ infty} (T ^ {*} M \ otimes T ^ {*} M)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5421eb29ac3341dcea06b007ee8f6eb10fea479c)
de por:
f{\ displaystyle f}![f](https://wikimedia.org/api/rest_v1/media/math/render/svg/132e57acb643253e7810ee9702d9581f159a1c61)
Hess(f): =∇∇f=∇df{\ displaystyle \ mathrm {Hess} (f): = \ nabla \ nabla f = \ nabla \ mathrm {d} f}![{\ displaystyle \ mathrm {Hess} (f): = \ nabla \ nabla f = \ nabla \ mathrm {d} f}](https://wikimedia.org/api/rest_v1/media/math/render/svg/96155f81e0557c3cb9549d2664936fa0d803e51a)
Em coordenadas locais , o tensor Hessiano é expresso como:
{xeu}{\ displaystyle \ {x_ {i} \}}![\ {XI \}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c9d90fd628e1497151325d23b808b6d0296e7701)
Hess(f)=∇eu∂jf dxeu⊗dxj=(∂2f∂xeu∂xj-Γeujk∂f∂xk)dxeu⊗dxj{\ displaystyle \ mathrm {Hess} (f) = \ nabla _ {i} \, \ partial _ {j} f \ \ mathrm {d} x_ {i} \! \ otimes \! \ mathrm {d} x_ { j} = \ left ({\ frac {\ partial ^ {2} f} {\ partial x_ {i} \ partial x_ {j}}} - \ Gamma _ {ij} ^ {k} {\ frac {\ partial f} {\ parcial x_ {k}}} \ direita) \ mathrm {d} x_ {i} \ otimes \ mathrm {d} x_ {j}}![{\ displaystyle \ mathrm {Hess} (f) = \ nabla _ {i} \, \ partial _ {j} f \ \ mathrm {d} x_ {i} \! \ otimes \! \ mathrm {d} x_ { j} = \ left ({\ frac {\ partial ^ {2} f} {\ partial x_ {i} \ partial x_ {j}}} - \ Gamma _ {ij} ^ {k} {\ frac {\ partial f} {\ parcial x_ {k}}} \ direita) \ mathrm {d} x_ {i} \ otimes \ mathrm {d} x_ {j}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/75a88da84db847ac12f82ba5645a00f8349cd5ab)
onde são os símbolos de Christoffel da conexão . O tensor hessiano também tem as seguintes expressões:
Γeujk{\ displaystyle \ Gamma _ {ij} ^ {k}}
∇{\ displaystyle \ nabla}![\ nabla](https://wikimedia.org/api/rest_v1/media/math/render/svg/a3d0e93b78c50237f9ea83d027e4ebbdaef354b2)
Hess(f)(X,Y)=g(∇Xgrnodf,Y){\ displaystyle \ mathrm {Hess} (f) (X, Y) = g (\ nabla _ {X} \ mathrm {grad} f, Y)}
Hess(f)(X,Y)=X(Yf)-df(∇XY){\ displaystyle \ mathrm {Hess} (f) (X, Y) = X (Yf) - \ mathrm {d} f (\ nabla _ {X} Y)}![{\ displaystyle \ mathrm {Hess} (f) (X, Y) = X (Yf) - \ mathrm {d} f (\ nabla _ {X} Y)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/31b3bdde78f6e9c38cc5839dfa525e445a88fc03)
.
Formulários
Usando o tensor Hessiano, podemos estender a noção de função convexa (ou estritamente convexa) para funções numéricas em variedades Riemannianas: estas são aquelas para as quais o Hessiano é, em cada ponto, uma forma bilinear positiva (ou definida positiva).
Também podemos encontrar o fato de que a Hessiana de uma função real suave em uma variedade diferencial é bem definida, independentemente de qualquer escolha de métrica, nos pontos críticos de . Na verdade, sempre é possível fornecer uma métrica Riemanniana particular. E se for um ponto crítico de , a expressão em coordenadas locais do tensor Hessiano é:
f{\ displaystyle f}
M{\ displaystyle M}
f{\ displaystyle f}
M{\ displaystyle M}
m{\ displaystyle m}
f{\ displaystyle f}
m{\ displaystyle m}![m](https://wikimedia.org/api/rest_v1/media/math/render/svg/0a07d98bb302f3856cbabc47b2b9016692e3f7bc)
Hess(f)m=∂2f∂xeu∂xj|mdxeu⊗dxj{\ displaystyle \ mathrm {Hess} (f) _ {m} = \ left. {\ frac {\ partial ^ {2} f} {\ partial x_ {i} \ partial x_ {j}}} \ right | _ {m} \ mathrm {d} x_ {i} \ otimes \ mathrm {d} x_ {j}}![{\ displaystyle \ mathrm {Hess} (f) _ {m} = \ left. {\ frac {\ partial ^ {2} f} {\ partial x_ {i} \ partial x_ {j}}} \ right | _ {m} \ mathrm {d} x_ {i} \ otimes \ mathrm {d} x_ {j}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/10b991c77ae72f39ed8fac69cd6af6f493f8db91)
Os coeficientes do tensor Hessiano de em um ponto crítico são bastante independentes da métrica Riemanniana.
f{\ displaystyle f}
m∈vsreut(f){\ displaystyle m \ in \ mathrm {crit} (f)}![{\ displaystyle m \ in \ mathrm {crit} (f)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6c6fdda109bc90811cb614aba52ca72475122496)
Lema de Morse
O lema de Morse mostra que o comportamento de um traço regular na vizinhança de um ponto crítico não degenerado é inteiramente determinado pelo conhecimento do índice do ponto crítico .
Lema de Morse - Seja uma função sobre uma variedade diferencial de dimensão . Consideramos um ponto crítico não degenerado da função e denotamos seu índice. Então existe um sistema de coordenadas local centrado em e tal que a expressão correspondente de é
f{\ displaystyle f}
VS∞{\ displaystyle {\ mathcal {C}} ^ {\ infty}}
não{\ displaystyle n}
m{\ displaystyle m}
f{\ displaystyle f}
k{\ displaystyle k}
x1,...,xnão{\ displaystyle x_ {1}, \ dots, x_ {n}}
m{\ displaystyle m}
f{\ displaystyle f}![f](https://wikimedia.org/api/rest_v1/media/math/render/svg/132e57acb643253e7810ee9702d9581f159a1c61)
f(x)=f(m)-x12-⋯-xk2+xk+12+⋯+xnão2{\ displaystyle f (x) = f (m) - {x_ {1}} ^ {2} - \ cdots - {x_ {k}} ^ {2} + {x_ {k + 1}} ^ {2} + \ cdots + {x_ {n}} ^ {2}}![{\ displaystyle f (x) = f (m) - {x_ {1}} ^ {2} - \ cdots - {x_ {k}} ^ {2} + {x_ {k + 1}} ^ {2} + \ cdots + {x_ {n}} ^ {2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/608815c8c05d1fda81c50badca1bbf791ae79bf1)
.
Chamamos esse sistema de coordenadas de Morse .
Resulta em particular do lema que os pontos críticos não degenerados são isolados .
O lema de Morse generaliza para espaços de Hilbert sob o nome de lema de Morse-Palais (en) .
Teoria de Morse
Uma função com todos os pontos críticos não degenerados e todos os valores críticos distintos é chamada de função de Morse . O objetivo da teoria de Morse é relacionar o estudo da topologia da variedade ao dos pontos críticos das funções que podem ser definidas ali.
Notas e referências
-
Como mostra o exemplo de funções constantes, o Hessian em um ponto de mínimo local (resp. De máximo local) pode não ser definido positivo (resp. Definido negativo).
-
(en) G. Salmon Higher Plane Curves , Stechert (1934)
-
Patrick Massot, Topologia diferencial , p. 46
-
(in) Jürgen Jost , Riemannian Geometry and Geometric Analysis ,2002[ detalhe das edições ], p. 139 .
-
(in) Jürgen Jost , Riemannian Geometry and Geometric Analysis ,2002[ detalhe das edições ], p. 140
-
(em) John Milnor , Morse Theory , Princeton University Press, 1963 ( ISBN 0-691-08008-9 ) , p. 6 .
Veja também
Artigos relacionados
Link externo
G. Frasco, minicurso de otimização
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">