O termo método de Monte-Carlo , ou método de Monte-Carlo , designa uma família de métodos algorítmicos que visa calcular um valor numérico aproximado por meio de métodos aleatórios , ou seja, técnicas probabilísticas. O nome desses métodos, que faz alusão aos jogos de azar praticados no cassino de Monte-Carlo , foi cunhado em 1947 por Nicholas Metropolis e publicado pela primeira vez em 1949 em um artigo em coautoria com Stanislaw Ulam .
Os métodos de Monte-Carlo são particularmente usados para calcular integrais em dimensões maiores que 1 (em particular, para calcular áreas e volumes). Eles também são comumente usados em física de partículas , onde simulações probabilísticas permitem estimar a forma de um sinal ou a sensibilidade de um detector. A comparação dos dados medidos com essas simulações pode permitir destacar características inesperadas, por exemplo, novas partículas.
O método de simulação de Monte-Carlo também permite introduzir uma abordagem estatística ao risco na decisão financeira. Consiste em isolar um certo número de variáveis-chave do projeto, como giro ou margem, e atribuir-lhes uma distribuição de probabilidade . Para cada um desses fatores, é realizado um grande número de sorteios aleatórios nas distribuições de probabilidade determinadas anteriormente, a fim de encontrar a probabilidade de ocorrência de cada um dos resultados. Por exemplo, a escolha da forma de gestão de uma autarquia no âmbito de uma parceria público-privada (PPP) é analisada através do método de Monte-Carlo, de forma a ter em conta a distribuição dos riscos entre os agentes públicos e privados. Em seguida, falamos de "riscos avaliados" ou "valores em risco".
O verdadeiro desenvolvimento dos métodos de Monte-Carlo foi realizado sob o impulso de John von Neumann e Stanislaw Ulam em particular, durante a Segunda Guerra Mundial e pesquisas sobre a fabricação da bomba atômica . Em particular, eles usaram esses métodos probabilísticos para resolver equações diferenciais parciais na estrutura do transporte de partículas N de Monte-Carlo (MCNP).
Suponha que haja uma expressão para a expectativa matemática de uma função g da variável aleatória X , resultante do teorema de transferência, segundo o qual
onde f X é uma função densidade de X no suporte [ a , b ] . É comum ter uma distribuição uniforme em [ a , b ] :
Isso pode ser estendido para probabilidades discretas somando usando uma medida discreta ν , do tipo de Dirac .
A ideia é produzir uma amostra ( x 1 , x 2 , ..., x N ) da lei X (portanto, de acordo com a densidade f X ) no suporte [ a , b ] , e calcular um novo estimador de G conhecido como Monte-Carlo, a partir desta amostra.
A lei dos grandes números sugere construir este estimador a partir da média empírica:
que passa a ser, além disso, um estimador imparcial da expectativa.
Este é o estimador de Monte Carlo. Vemos que ao substituir a amostra por um conjunto de valores tomados do suporte de uma integral , e da função a ser integrada, podemos construir uma aproximação de seu valor, construída estatisticamente.
Esta estimativa é imparcial , no sentido de que
Também é necessário quantificar a precisão dessa estimativa, por meio da variância de . Se a amostra for considerada iid , essa variância é estimada usando a variância empírica
com
Pelo teorema do limite central , sabemos que a variável:
que é centrado e reduzido, segue aproximadamente a lei normal centrada reduzida, ou lei de Gauss . É então possível construir intervalos de confiança , o que possibilita enquadrar o erro cometido substituindo G por . Se esse erro for denotado e n , para um determinado nível de risco temos:
com probabilidade 1– α . O real é o quantil da distribuição normal centrada reduzida. Por exemplo, no nível de risco , encontramos nas tabelas e o erro é aumentado em . Este método permite, portanto, quantificar o erro cometido, com a condição de estimar σ g por sua contraparte empírica.
Podemos ver que o erro é da ordem de N –1/2 : por exemplo, multiplicar o tamanho da amostra por 100 permite que o erro de estimativa seja dividido por 10.
Deve-se notar que, na prática, σ g não é conhecido e deve ser estimado; conforme especificado acima, pode-se usar sua contraparte empírica. Vários métodos, conhecidos como técnicas de redução de variância , permitem melhorar a precisão - ou reduzir o tempo de cálculo - substituindo g ( X ) por outra variável aleatória. Essas técnicas normalmente se enquadram em uma das seguintes classes: a amostragem de importância , as variáveis de controle , a variável antitética , a laminação e embalagem .
O número de simulações necessárias para atingir uma margem de erro desejada às vezes é muito grande com o método de Monte-Carlo. Com efeito, quando queremos chegar a uma pequena margem de erro , é necessário que portanto seja muito grande quando é pequeno. Para remediar este problema, existem os chamados métodos de "redução de variância" ou "Monte-Carlo acelerado", que requerem menos simulações para atingir o mesmo nível de precisão. Entre esses métodos, existem dois tipos principais de métodos: métodos de amostragem de importância e métodos de partículas .
Este método está próximo do experimento da agulha de Buffon .
Seja M um ponto com coordenadas ( x , y ) , onde 0 < x <1 e 0 < y <1 . Chamamos a aleatoriamente os valores de x e y entre 0 e 1 de acordo com uma lei uniforme. O ponto M pertence ao disco com centro (0,0) de raio R = 1 se e somente se x 2 + y 2 ≤1 . A probabilidade de que o ponto M pertença ao disco éπ4, uma vez que o quarto de um disco tem uma área de superfície σ =π R 24=π4, e o quadrado que o contém é de área S = R 2 = 1 : se a lei da probabilidade do desenho do ponto for uniforme , a probabilidade de cair no quarto de um disco éσS=π4.
Fazendo a relação entre o número de pontos no disco e o número de impressões, obtemos uma aproximação do número π4 se o número de impressões for grande.
Este exemplo é um clássico na popularização do método Monte-Carlo. Uma área retangular ou quadrada cujos lados são de comprimento conhecido. Dentro desta área há um lago de tamanho desconhecido. Graças às medidas dos lados da área, conhecemos a área do retângulo. Para encontrar a área do lago, um exército é solicitado a disparar X tiros de canhão aleatoriamente naquela área. Em seguida, contamos o número N de bolas que permaneceram no solo; podemos determinar o número de bolas que caíram dentro do lago: X - N . Então, é suficiente estabelecer uma relação entre os valores:
Por exemplo, se o terreno é 1000 m 2 , o exército dispara 500 bolas e 100 projéteis caíram no lago, então uma estimativa da área do corpo d'água é: 1000 × 100 ÷ 500 = 200 m 2 .
A qualidade da estimativa melhora (lentamente) aumentando o número de tiros e garantindo que os artilheiros nem sempre apontem para o mesmo local, mas cubram bem a área, uniformemente. Esta última observação deve ser colocada em paralelo com a qualidade do gerador aleatório que é essencial para se ter bons resultados no método de Monte-Carlo. Um gerador enviesado é como um canhão que sempre atira no mesmo lugar: a informação que ele fornece é reduzida.
O método Monte-Carlo pode ser usado para determinar a área sob a interseção de duas curvas, que é apenas uma superfície particular.
As curvas podem ser as curvas que representam as densidades de probabilidade de duas leis. Isso é, por exemplo, usado no método de resistência ao estresse :
A probabilidade complementar - os casos de falha, para os quais R ≤ S - é a área sob a intersecção das duas curvas que representam as leis.
Podemos determinar a probabilidade P (R> S) fazendo sorteios aleatórios em R e S e contando os casos para os quais “R> S” é verdadeiro.
No xadrez, como em muitos jogos de tabuleiro, é possível medir o valor de uma posição e, portanto, dos movimentos que conduzem a ela, avaliando quantitativamente a posição obtida: número de peças no tabuleiro, valores das peças (1 ponto por peão, 5 por turno ...), posição relativa das peças entre elas, e ponderando o valor encontrado pelas liberdades, as proteções das peças, etc. Esta avaliação baseada em análises e conhecimentos é mais rápida de medir à medida que o jogo avança, porque o número de peças diminui.
No jogo Go, a avaliação de uma posição global permanece muito difícil com os métodos de análise convencionais devido ao emaranhamento e complexidade das posições locais e ao número quase infinito de sequências de movimentos possíveis. Em 2006, o matemático Rémi Coulom fez progressos significativos nesta função de avaliação e na eficiência do software de jogo Go usando o método Monte-Carlo: um grande número de finais são jogados "ao acaso". Jogos realistas a partir da posição "em avaliação" e a proporção de jogos vencedores / perdedores é contada. Esta estimativa estatística é refinada enviesando a chance, eliminando movimentos estúpidos a priori . Este método prova ser muito eficaz. É usado em particular pelos programas AlphaGo e AlphaZero .
Às vezes, para saber se uma jogada ambígua deve ser feita (troca de peças por exemplo), quando há falta de informação, ou para escolher entre várias jogadas todas levando a perdas de material, é possível lançar vários jogos rápidos no ao mesmo tempo, acaso, de saber qual é a menos ruim ou a melhor solução.
De acordo com a hipótese dos mercados eficientes , os desempenhos do mercado de ações são aleatórios e seguem uma distribuição normal. Nessas condições, é possível fazer milhares de sorteios aleatórios para determinar as probabilidades de atingir determinados desempenhos do mercado de ações no futuro.