Função de distribuição

Na teoria da probabilidade , a função de distribuição , ou função de distribuição cumulativa , de uma variável real aleatória X é a função F X que, com qualquer real x , associa a probabilidade de obter um valor menor ou igual:

.

Esta função é característica da lei da probabilidade da variável aleatória . Permite calcular a probabilidade de cada intervalo semiaberto à esquerda] a, b] onde a <b, por

.

A função de distribuição de uma medida de probabilidade definida na tribo Boreliana é a função F que para quaisquer reais x associados

Primeiras propriedades

A função de distribuição de uma variável aleatória real é sempre crescente, contínua à direita, com um limite zero em e um limite igual a 1 in .

Por outro lado, qualquer função definida e que satisfaça essas quatro propriedades é a função de distribuição de uma variável aleatória.

Exemplos de cálculos de função de distribuição

Variáveis ​​de densidade

O CDF F X de uma variável aleatória X de densidade de probabilidade f X é uma primitiva (de um modo algo libertado, ver abaixo) de este densidade f X . Mais precisamente, F X é definido, para qualquer número real x , por:

No entanto, não é, em geral, um primitivo no sentido estrito do termo: só se pode afirmar:

Mas há muitos "contra-exemplos": a função de distribuição da lei uniforme sobre um intervalo, ou a da lei exponencial , não são diferenciáveis ​​em tudo e, portanto, não são, em sentido estrito, primitivas de densidades de probabilidade.

Note-se que, ao contrário das variáveis discretas, variáveis densidade X cheques para qualquer número real tem  : consequentemente, a função de distribuição da densidade variável é contínua em todos os pontos. Na verdade, uma variável aleatória real X tem uma densidade de probabilidade se e somente se sua função de distribuição for absolutamente contínua ao longo de cada intervalo limitado.

Variáveis ​​discretas

Uma variável aleatória X é dita discreta se seu suporte S é finito ou contável , ou, de forma equivalente, se existe um conjunto finito ou contável A tal como:

A lei de X é determinada de forma inequívoca pelos dados de ( p s ) s ∈ S ou de ( p s ) s ∈ A , onde

Se, por exemplo, X é uma variável aleatória real , nós

onde 1 E é a função indicadora do conjunto E.

Para as variáveis ​​aleatórias discretas mais comuns (por exemplo, as distribuições uniformes , binomiais e de Poisson ) S é um conjunto bem ordenado  : podemos então numerar seus elementos de forma crescente, pe s 1 ≤ s 2 ≤ s 3 ≤ ... e numere as probabilidades p s de acordo, pe definindo p i = p s i , i ≥ 1 . Temos então, se x ∈ [ s i , s i + 1 [ ,

Ou, de forma mais geral:

A função de distribuição é então uma função constante por intervalos e sua representação gráfica é escalonada . Os saltos de um degrau para outro da escada estão localizados na abcissa s i , e a amplitude do salto de abscissa s é p s = F X ( s ) - F X ( s - ) . Em particular, a função de distribuição de uma variável discreta X é descontínua exatamente em pontos s como Veja a seção Propriedades da função de distribuição para uma demonstração.

Caso especial: função de distribuição contínua puramente singular

A escada Cantor F é um exemplo de uma função de distribuição contínua, mas a derivada dela é quase zero em todos os lugares. Assim, as fórmulas anteriores não são mais verdadeiras para a escada Cantor: por exemplo, para x > 0 , não temos

,

porque F assume valores estritamente positivos em ] 0, + ∞ [ , enquanto a integral que constitui o lado direito é identicamente zero. Na verdade, o todo

é da medida Lebesgue zero. Além disso, a lei da probabilidade associada à escada de Cantor é difusa (sem átomo), uma vez que F é uma função contínua on . A escada de Cantor é de fato um exemplo de uma função de distribuição contínua, mas que não é absolutamente contínua ao longo de cada intervalo: então dizemos que é puramente contínua singular.

Propriedades da função de distribuição

Propriedades características

Teorema  -  A função de distribuição de uma variável aleatória X tem as seguintes propriedades características:

  1. F X está aumentando  ;
  2. Está em toda parte contínua à direita;
  3.  ;
Demonstração

O ponto 1 segue da propriedade de crescimento das medidas de probabilidade

Como F X é uma função monotônica , o ponto 2 reduz para mostrar que

ou equivalente,

Mas os Borelianos ] –∞, x +1/não[ formam uma sequência decrescente, e

portanto, o ponto 2 é uma consequência dos axiomas das probabilidades . Como F X é monótono, o ponto 3 pode ser reduzido para mostrar que

Isso é novamente uma consequência dos axiomas de probabilidades , uma vez que

O ponto 4 decorre, da mesma forma, de

Como dissemos, os pontos 1 a 4 são característicos da função de distribuição de uma variável real aleatória X  : dada uma função real da variável real, denotada por F , satisfazendo os pontos 1 a 4, podemos construir concretamente uma variável real aleatória X tendo F para a função de distribuição, veja abaixo o teorema da recíproca . Observe que a construção usando o teorema inverso é usada concretamente para produzir, em um computador, amostras de tamanho arbitrário com uma lei de probabilidade arbitrária, que é o ingrediente básico dos métodos de Monte-Carlo .

Observação

Podemos, portanto, definir a noção de função de distribuição sem introduzir a de uma variável aleatória: ela só precisa satisfazer os pontos 1 a 4 acima. Se adicionarmos a isso a noção de função aritmética , chegaremos rapidamente à teoria probabilística dos números .

Outras propriedades

Por causa dos pontos 1, 3 e 4, F X é limitado, mais precisamente

Como qualquer função monotônica limitada, F X admite em qualquer ponto x um limite esquerdo F X ( x - ) , limite esquerdo igual ou não a F X ( x ) dependendo se F X é contínuo em x ou não. F X é uma função càdlàg .

O conhecimento da função de distribuição permite que a probabilidade de qualquer intervalo seja calculada

e

Demonstração

As últimas 5 propriedades derivam de para diferentes escolhas de A e B  :

Chamamos átomo da variável aleatória X qualquer real a para o qual . Portanto, em virtude da última propriedade da lista acima,

Propriedade  -  Os átomos da variável aleatória X são exatamente os pontos de descontinuidade da função de distribuição.

A função de distribuição de uma variável aleatória X é, portanto, contínua se e somente se X não tiver átomos, ou seja, se e somente se

Dizemos então que a lei de X é difusa , ou sem átomo , e, por extensão, que a própria variável aleatória X é difusa ou sem átomo . Em particular, variáveis ​​aleatórias reais com densidade de probabilidade são difusas. Existem, no entanto, variáveis ​​aleatórias difusas que não têm densidade de probabilidade, por exemplo, com a variável aleatória cuja função de distribuição é a escada de Cantor .

Observe que o conjunto de pontos de descontinuidade de F X é finito ou contável , como é o caso para qualquer função monotônica limitada:

Consequência  -  O conjunto S de átomos da variável aleatória X é finito ou contável .

Caracterização da lei pela função de distribuição

Teorema  -  A lei da probabilidade de uma variável aleatória real é caracterizada por sua função de distribuição.

Ou ainda: se duas variáveis ​​aleatórias reais têm a mesma função de distribuição, então elas têm a mesma lei (e vice-versa).

Demonstração

Sob a hipótese F X = F Y , podemos provar de forma elementar que tão logo A seja um boreliano "simples" (por exemplo, se A for um intervalo). Por outro lado, a prova geral (para qualquer Boreliano A ) é um caso particular do lema da unicidade das probabilidades , em si um corolário do lema de classe monotônico , aplicado à classe

É necessário verificar que

  1. a classe é estável por interseção finita,
  2. a tribo gerada por contém (e de fato é igual a) a tribo Boreliana .

O lema da unicidade das probabilidades, então, nos permite concluir.

Vamos verificar 1. Seja I um subconjunto finito de . É o elemento mínimo de I . Então

Vamos verificar 2. A tribo gerada por é anotada . A tribo Borelian é notada , com freqüência. Observação

Temos em virtude da estabilidade das tribos passando para as complementares, portanto por definição de uma tribo gerada . Podemos intercambiar e no que precede, portanto, pela dupla inclusão,

Como faz parte do conjunto de aberturas, deduzimos que

Mas devemos acima de tudo demonstrar a inclusão na direção oposta, e, para isso, demonstrar que tudo que se abre de está em (assim é uma tribo contendo todas as aberturas de , enquanto que é a menor tribo contendo todas as aberturas de ). Um argumento rápido é que

O primeiro ponto resulta do fato de que

O segundo ponto é que

CQFD

Em outras palavras, se duas variáveis ​​aleatórias reais, X e Y , satisfazem

em seguida, eles também verificam que, para qualquer boreliano A ,

Além disso, eles verificam que para qualquer função mensurável φ ,

assim que um dos dois termos de igualdade tiver um significado.

Teorema recíproco

Vamos F ser uma função de em satisfazer as 4 propriedades características. Denote por G a função definida para ω ∈] 0; 1 [ por

Então G é uma variável real aleatória definida no espaço probabilizado onde e onde denota a restrição da medida de Lebesgue sobre . O teorema afirma que:

Teorema  -  No espaço , a função de distribuição G é F .

Assim, qualquer função F do em que satisfaçam os quatro propriedades características é uma função da distribuição de uma variável aleatória verdadeiro (de L , por exemplo), ou ainda de uma medida de probabilidade em (da lei de L , por exemplo).

Demonstração

Para ω ∈ Ω =] 0; 1 [ , nota

Então G ( ω ) = inf A ω . Por causa do ponto 4, e por causa do ponto 3, A ω é limitado abaixo, então G é bem definido.

Vamos começar com um caso simples de treinamento:

F está aumentando estritamente de forma contínua

Se F é contínuo estritamente aumentando , então F é uma bijeção de em ] 0; 1 [ , e G é o recíproco de F (podemos ser convencidos disso traçando A ω usando o gráfico de F ). Como tal, G é contínuo e estritamente crescente acima de ] 0; 1 [ , e em particular G é mensurável (é portanto uma var). Nos tambem temos

portanto

Então

Caso Geral

No caso geral, também temos

e, portanto, concluímos exatamente da mesma maneira que antes, mas a demonstração da equivalência acima é menos direta. Primeiro, para ω ≤ ω ' , A ω' ⊂ A ω e, portanto, G ( ω ) ≤ G ( ω ' ) . Como G é monotônico, segue-se que G é mensurável.

Temos, por definição de A ω e G ( ω ) ,

O inverso vem do fato de que { G ( ω ) ∈ A ω } , ou seja, { ω ≤ F ( G ( ω ))} , que, com { G ( ω ) ≤ x } implica, pelo crescimento de F , { F ( G ( ω )) ≤ F ( x )} e, finalmente, { ω ≤ F ( x )} . Suponha de fato que G ( ω ) ∉ A ω , e considere uma sequência estritamente decrescente ( x n ) n ≠ 0 de elementos de A ω tal que

Por continuidade à direita de F ,

mas também, por definição de A ω ,

o que leva a G ( ω ) ∈ A ω , portanto, uma contradição (prova amplamente retirada de Sidney Resnick, A Probability Path ).

Observações.

Consequências do teorema inverso

Simulação de variáveis ​​aleatórias reais de distribuição arbitrária

Se U denota uma variável aleatória real uniforme em [0; 1] , em seguida, X = L ( L ) tem a função de distribuição F .

Assim, em qualquer linguagem de programação que tenha um gerador de números aleatórios, pode-se simular uma sequência de comprimento arbitrário de vars independentes da mesma função de distribuição F , desde que G seja conhecido: basta então chamar este gerador repetidamente e aplicar o G função para os números produzidos por essas chamadas repetidas.

Exemplos

Exemplos
densidade de probabilidade função de distribuição recíproco (generalizado) codificado
Lei de Cauchy
Lei exponencial
Lei uniforme em [ a , b ]
Lei de bernoulli
Lei uniforme em {1,2, ..., n }
Distribuição normal , distribuição binomial como não existe uma fórmula suficientemente explícita para a função de distribuição, e menos ainda de uma fórmula explícita para o inverso da última, o teorema fica inoperante.

Você encontrará tudo sobre a arte de gerar variáveis ​​aleatórias de leis arbitrárias, por exemplo, usando variáveis uniformes , em Non-Uniform Random Variate Generation , publicado pela Springer, disponível na web.

Outras consequências do teorema inverso

O inverso generalizado de F é um exemplo de var cuja função de distribuição é F , mas é um exemplo principal. Seus usos são numerosos, variando de propriedades da ordem estocástica a propriedades da distância de Wasserstein  (em) , incluindo o teorema de representação de Skorokhod , consulte a próxima seção.

Convergência na lei e função de distribuição

Considere uma sequência de variáveis ​​aleatórias ( X n ) n ≥ 0 (resp. Uma variável aleatória X ) definida em espaços probabilizados (resp. ) Possivelmente diferentes, mas todas com valores no mesmo espaço métrico ( S , d ) . Dizemos que ( X n ) n ≥ 0 converge na lei para X se, para qualquer função contínua limitada de ( S , d ) em ,

Nós temos o seguinte teorema:

Teorema  -  No caso de variáveis aleatórias verdadeiro ( ) incluem ( M n ) n ≥ 0 , F distribuições funções ( X n ) n ≥ 0 e X . Há, então, equivalência entre as três proposições abaixo:

  1. ( X n ) n ≥ 0 converge na lei para X ,
  2. para qualquer verdadeira x em que F é contínua , ,
  3. existe um espaço probabilizado , e, definidas neste espaço, variáveis ​​aleatórias reais ( X ' n ) n ≥ 0 e X' tais que, simultaneamente,
    1. X ' tem a mesma lei de X ,
    2. para cada n , X n ' tem a mesma lei que X n ,
    3. ( X ' n ) n ≥ 0 quase certamente converge para X' .

A implicação 1.⇒3. permanece verdadeiro quando as variáveis ​​aleatórias reais são substituídas por variáveis ​​aleatórias com valores em um espaço de Lusin ( S , d ) , ou seja, um espaço metrizável bastante geral ( e são exemplos disso). A implicação 1.⇒3. então leva o nome de teorema da representação de Skorokhod .

Demonstração

Uma estrutura possível para a prova é 3.⇒1.⇒2.⇒3.

3. implica 1.

Este é o mais fácil. Deve ser demonstrado que

ou equivalente,

Mas a continuidade de f garante que f ( X n ') converge quase com certeza para f ( X ') . Além disso, | f | sendo limitado, temos que

para todos n . O teorema da convergência dominada de Lebesgue pode ser aplicado aqui e fornece a conclusão desejada.

1. implica 2.

Usamos a família de funções contínuas limitadas definidas pelo gráfico ao lado. Eles verificam, para qualquer variável real aleatória Y ,

e especialmente

Notamos então que, para todo ε > 0 ,

e

Fazendo ε tender para 0, obtemos

Assim, assim que x for um ponto de continuidade de F ,

2. implica 3.

Nota ( L n ) n ≥ 0 , L , generalizada recíproco ( M n ) n ≥ 0 , F . Para o trigêmeo , escolha e tome para a tribo de Borelians e a medida de Lebesgue correspondente (ou seja, restrito a (0; 1) ). A escolha de X ' n = G n , X' = G satisfaz 3.1. e para 3.2. em virtude do teorema inverso . Além disso, como um resultado de 2, ( L n ) n = 0 converge quase certamente para L .

Notas e referências

  1. A versão pdf (gratuita e autorizada) de (en) Luc Devroye , Non-Uniform Random Variate Generation , New York, Springer-Verlag ,1986, 1 r  ed. ( leia online ) está disponível, bem como um relato humorístico das brigas de Luc Devroye com seu editor.
  2. [1]

Veja também

Artigos relacionados

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">