Princípio de grandes desvios

O princípio dos grandes desvios , na teoria da probabilidade , diz respeito ao comportamento assintótico das caudas de sequência da lei da probabilidade. Algumas idéias iniciais da teoria foram fornecidas por Laplace e Cramér ; desde então, uma definição formal foi introduzida em 1966 por Varadhan . A teoria dos grandes desvios formaliza as ideias heurísticas de concentração de medidas e generaliza a noção de convergência do direito .

A teoria do grande desvio diz respeito ao declínio exponencial das medidas de probabilidade de certos tipos de cauda ou eventos de cauda , quando o número de observações é arbitrariamente grande.

Exemplos introdutórios

Um exemplo básico

Uma série de caras ou caudas independentes (não tendenciosas). Denote por $x i$ o resultado do i -ésimo lançamento, onde face dá $X i = -1$ e bateria dá $X i = 1$ . Seja $M N$ a média após N lances, ou seja

M_N: = \ frac {1} {N} \ sum_ {i = 1} ^ {N} X_i

Assim, $M N$ está entre -1 e 1. Usando a lei dos grandes números , deduzimos que $M N$ está cada vez mais próximo de 0, com probabilidade crescente, à medida que $N$ é cada vez mais grande. Deixe-nos dar uma explicação mais precisa. Para um valor fixo $0 < x <1$ , calcule a probabilidade . Vamos definir ${\ displaystyle \ mathbb {P} (M_ {N}> x)}$

{\ displaystyle I (x) = {\ frac {1} {2}} [(1 + x) \ ln (1 + x) + (1-x) \ ln (1-x)]}

Então, pela desigualdade de Chernoff , podemos mostrar isso . Este limite é ótimo no sentido de que $I$ $($ $x$ $)$ não pode ser substituído por um número maior que garantiria a desigualdade para qualquer $N$ estritamente positivo (embora o limite exponencial ainda possa ser reduzido a um fator subexponencial próximo da ordem de $1 /$ $\sqrt$ $N$ ). A probabilidade diminui exponencialmente rapidamente quando $N$ é grande, a uma taxa dependente de $x$ . ${\ displaystyle \ mathbb {P} (M_ {N}> x) <\ exp (-NI (x))}$ ${\ displaystyle \ mathbb {P} (M_ {N}> x)}$

Grandes desvios para somas de variáveis aleatórias independentes

No exemplo acima, com lançamento de moeda, cada lançamento é independente dos outros e as probabilidades são iguais para cada lançamento. Em outras palavras, as variáveis aleatórias $X i$ são iid (independentes e distribuídas de forma idêntica). Para variáveis iid cujo common law satisfaz uma determinada condição de crescimento, a teoria dos grandes desvios garante que existe o seguinte limite:

{\ displaystyle \ lim _ {N \ to \ infty} {\ frac {1} {N}} \ ln \ mathbb {P} (M_ {N}> x) = - I (x)}

A função $I ( x )$ é chamada de " função taxa (in) " ou "função de Cramér" ou às vezes "entropia". A existência de tal limite dá o decaimento exponencial mencionado anteriormente e implica que, para $N$ grande, é da forma: ${\ displaystyle \ mathbb {P} (M_ {N}> x)}$

{\ displaystyle \ mathbb {P} (M_ {N}> x) \ approx \ exp [-NI (x)].}

Observe que a desigualdade dada no primeiro parágrafo, em comparação com esta fórmula assintótica, não é mais válida em casos mais gerais.

No caso iid, se a lei de probabilidade das variáveis $X i$ é conhecida, existe uma expressão explícita da função taxa, dada pela transformada de Cramér definida por

I (x) = \ sup _ {\ theta> 0} [\ theta x - \ lambda (\ theta)],

onde a função $λ ( θ )$ é chamada de função geradora dos cumulantes , dada por

{\ displaystyle \ lambda (\ theta) = \ ln \ mathbb {E} [\ exp (\ theta X)] \,.}

Aqui, está a expectativa com relação à distribuição de probabilidade de $X$ $i$ e $X$ é uma de $X$ $i$ . Se a lei de $X$ for normal , a função de taxa é uma parábola. ${\ displaystyle \ mathbb {E} [\, \ cdot]}$

Se a condição iid for enfraquecida, especialmente se as variáveis $X i$ não forem independentes, mas satisfizerem a propriedade de Markov , o resultado de grande desvio anterior pode ser generalizado.

Definição formal

Ou $X$ um espaço polaca e uma sequcia de medidas de probabilidade de $X$ ou ${$ $um$ $N$ $}$ uma sequência de números reais tais que estritamente positivo , e, finalmente, é uma função inferior semicontínua em $X$ . O seguinte verifica o princípio de grandes desvios com uma velocidade ${$ $a$ $N$ $}$ e uma taxa $I$ , se e somente se para qualquer conjunto Boreliano mensurável ${\ displaystyle \ {\ mathbb {P} _ {N} \}}$ ${\ displaystyle \ lim _ {N} a_ {N} = + \ infty}$ ${\ displaystyle I: X \ to [0, + \ infty]}$ ${\ displaystyle \ {\ mathbb {P} _ {N} \}}$ ${\ displaystyle E \ subset X}$

{\ displaystyle - \ inf _ {x \ in E ^ {\ circ}} I (x) \ leq \ varliminf _ {N} a_ {N} ^ {- 1} \ ln \ left (\ mathbb {P} _ {N} (E) \ direita) \ leq \ varlimsup _ {N} a_ {N} ^ {- 1} \ ln \ esquerda (\ mathbb {P} _ {N} (E) \ direita) \ leq - \ inf _ {x \ in {\ bar {E}}} I (x)}

onde $E$ e $E °$ significam, respectivamente, o adesivo e o interior de $E$ .

Espaço banach

Teorema (demonstrado por Donsker e Varadhan em 1976)

Seja $X$ um espaço de Banach separável , uma lei de probabilidade em $X$ que admite momentos exponenciais finitos, $($ $X$ $i$ $)$ ${$ $i$ $> 1}$ variáveis aleatórias iid de distribuição e de média . Então, para qualquer Boreliano $E$ de $X$ , $\ mathbb {P}$ $\ mathbb {P}$ ${\ displaystyle M_ {N} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} X_ {i}}$

{\ displaystyle - \ inf _ {x \ in E ^ {\ circ}} I (x) \ leq \ varliminf _ {N} {\ frac {1} {N}} \ ln \ mathbb {P} (M_ { N} \ in E) \ leq \ varlimsup _ {N} {\ frac {1} {N}} \ ln \ mathbb {P} (M_ {N} \ in E) \ leq - \ inf _ {x \ in {\ bar {E}}} I (x)}

onde $I$ é a transformação de Cramér (ou transformação de Legendre ou transformação de Fenchel-Legendre ) definida por

{\ displaystyle I (x) = \ sup _ {\ theta> 0} \ left [\ theta x- \ ln \ mathbb {E} [\ exp (\ theta X)] \ right].}

História curta

Os primeiros resultados rigorosos relativos a grandes desvios devem-se ao matemático sueco Harald Cramér , que os aplicou para modelar problemas de seguro. Do ponto de vista das seguradoras, as receitas são mensais a uma taxa constante (pagamentos mensais), mas as despesas são aleatórias. Para que a empresa seja lucrativa após um período de vários meses, a soma total das receitas deve ser maior do que as despesas totais. Portanto, para estimar os pagamentos mensais, devemos nos perguntar: "Quais pagamentos mensais $q$ devemos escolher para que, após $N$ meses, as despesas totais $C$ $= Σ$ $X$ $i$ sejam menores que $Nq$ ?" “ O que é claramente a mesma pergunta a teoria dos grandes desvios. Cramér deu uma solução para essa questão para variáveis aleatórias iid com uma função de taxa como uma série inteira .

Os resultados acima foram obtidos mais tarde por Herman Chernoff e outros, incluindo SRS Varadhan (que ganhou o Prêmio Abel por este trabalho ), D. Ruelle e OE Lanford .

Formulários

Os princípios de grandes desvios podem ser aplicados de forma eficaz para recuperar informações de um modelo probabilístico. Assim, a teoria dos grandes desvios encontra aplicações na teoria da informação e no gerenciamento de riscos . Na física, a aplicação mais conhecida da teoria dos grandes desvios é na termodinâmica e na mecânica estatística (em conexão com a entropia correspondente à função de taxa).

Estimar desvios

A média é chamada de média empírica das variáveis iid $X$ $i$ . Observe a verdadeira média. Pela lei dos grandes números , para todo $δ$ $> 0$ , obtemos ${\ displaystyle M_ {N} = {\ frac {1} {N}} \ sum _ {i = 1} ^ {N} X_ {i}}$ ${\ displaystyle m = \ mathbb {E} [X_ {i}]}$

\ lim_ {N \ rightarrow \ infty} \ mathbb P (| M_N-m |> \ delta) = 0

Assim, o evento (anotado na definição formal) descreve o desvio entre $M$ $N$ e $m$ . ${\ displaystyle \ left \ {| M_ {N} -m |> \ delta \ right \}}$ ${\ displaystyle \ left \ {M_ {N} \ in E \ right \}}$

Caso de lei normal

Se $X i$ são as variáveis aleatórias iid de distribuição normal centrada reduzida, então $M$ $N$ tem distribuição . Então ${\ mathcal N} (0,1)$ ${\ displaystyle {\ mathcal {N}} (0,1 / N)}$

{\ displaystyle \ mathbb {P} (| M_ {N} |> \ delta) = 1 - {\ frac {1} {\ sqrt {2 \ pi}}} \ int _ {- \ delta {\ sqrt {N }}} ^ {\ delta {\ sqrt {N}}} \ mathrm {e} ^ {- {\ frac {x ^ {2}} {2}}} \ mathrm {d} x.}

Os grandes desvios são então dados por:

{\ displaystyle \ lim _ {N \ rightarrow \ infty} {\ frac {1} {N}} \ ln \ mathbb {P} (| M_ {N} |> \ delta) = - {\ frac {\ delta ^ {2}} {2}}}

Isso significa que $| M N |$ se desvia do seu comportamento típico que tomam valores grandes com um (pequeno) de probabilidade de ordem $exp (- nÔ 2 /2)$ .

Grandes desvios e entropia

A função taxa está relacionada à entropia na mecânica estatística. Isso pode ser visto heuristicamente da seguinte maneira. Na mecânica estatística, a entropia de um determinado estado macroscópico está associada ao número de estados microscópicos que correspondem a esse estado macroscópico. Em nosso exemplo de sorteio, a média $M N$ pode designar um estado macroscópico particular. E a sequência de cara ou coroa que dá um valor de $M N$ constitui um estado microscópico particular que a compõe. Mais simplesmente, um estado macroscópico com um grande número de estados microscópicos que o compõem tem uma alta entropia. E um estado com alta entropia é mais provável de ser alcançado. O estado macroscópico de média zero (tantas caudas quanto caudas) tem o maior número de estados microscópicos e é o estado com a maior entropia. Por outro lado, a função de taxa mede a probabilidade de ocorrência de uma determinada condição macroscópica. Quanto menor a função de taxa, mais provável é que o estado macroscópico apareça. Em nosso lançamento de moeda, a função de taxa é de 0 a 0. Nesse caso, podemos assimilar a função de taxa como o oposto da entropia.

Nota e bibliografia

Notas

(in) SRS Varadhan, probabilidade assintótica e equações diferenciais Communications is Pure and Applied Mathematics, 19 (1966) 261-286.
R. Azencott, Grandes devtions et applications , Summer School of Probability of Saint-Flour VIII-1978, Lecture Notes in Mathematics, 1980, Volume 774/1980, 1-176, DOI: 10.1007 / BFb0089623

Bibliografia

SRS Varadhan, Artigo especial convidado: Grandes desvios , The Annals of Probability 2008, Vol. 36, No. 2, 397-419 DOI: 10.1214 / 07-AOP348
Richard S. Ellis, Entropia, Grandes Desvios e Mecânica Estatística , Publicação Springer. ( ISBN 3-540-29059-1 )
Alan Weiss (en) e Adam Shwartz, Large Deviations for Performance Analysis , Chapman and Hall ( ISBN 0-412-06311-5 )
Amir Dembo e Ofer Zeitouni, Large Deviations Techniques and Applications , Springer ( ISBN 0-387-98406-2 )
Mark I. Freidlin e Alexander D. Wentzell., Random Perturbations of Dynamical Systems , Springer ( ISBN 0-387-98362-7 )

Veja também

links externos

(fr) Este artigo foi retirado parcial ou totalmente do artigo da Wikipedia em inglês intitulado " Teoria dos grandes desvios " ( ver a lista de autores ) .