Algoritmo Freivalds

O algoritmo Freivalds (nomeado após Rūsiņš Mārtiņš Freivalds ) é um teste probabilístico para verificar o resultado de um produto de matriz . Dadas três matrizes , e o problema é verificar se . Para resolvê-lo, o algoritmo ingênuo calcula o produto explicitamente e compara o resultado termo a termo com . No entanto, o algoritmo de produto de matriz mais conhecido é executado no tempo . O algoritmo Freivalds usa randomização para reduzir esse limite com uma alta probabilidade. Ele pode verificar um produto de matriz no tempo com uma probabilidade de falha menor que . $NO$ $B$ $VS$ ${\ displaystyle A \ times B = C}$ ${\ displaystyle A \ times B}$ $VS$ ${\ displaystyle O (n ^ {2,3729})}$ $O (n ^ 2)$ ${\ displaystyle O (kn ^ {2})}$ ${\ displaystyle 2 ^ {- k}}$

Algoritmo

Procedimento

O princípio do algoritmo consiste em verificar se, durante três n × n matrizes observou , e se a igualdade se verifica ou não. $NO$ $B$ $VS$ ${\ displaystyle A \ times B = C}$

As três etapas são então realizadas:

Gere um vetor aleatório de componentes 0 ou 1. $\ vec {r}$
Calcule . ${\ displaystyle {\ vec {P}} = A \ vezes (B {\ vec {r}}) - C {\ vec {r}}}$
Retorne Sim se ; Não o contrário. ${\ displaystyle {\ vec {P}} = (0,0, \ ldots, 0) ^ {T}}$

Erro

Se , então o algoritmo sempre retorna Sim . Se , então a probabilidade de que o algoritmo retorne Sim é menor ou igual a 1/2. ${\ displaystyle A \ times B = C}$ ${\ displaystyle A \ times B \ neq C}$

Ao repetir o algoritmo k vezes e retornar Sim se e somente se todas as iterações retornarem Sim , a complexidade de tempo do teste é e sua probabilidade de erro é menor ou igual a . ${\ displaystyle O (kn ^ {2})}$ ${\ displaystyle 1/2 ^ {k}}$

Exemplo

Suponha que queremos verificar se:

{\ displaystyle AB = {\ begin {bmatrix} 2 e 3 \\ 3 & 4 \ end {bmatrix}} {\ begin {bmatrix} 1 e 0 \\ 1 & 2 \ end {bmatrix}} {\ stackrel {? } {=}} {\ begin {bmatrix} 6 e 5 \\ 8 e 7 \ end {bmatrix}} = C.}

Um vetor aleatório 2 × 1 de componentes iguais a 0 ou 1 é selecionado - por exemplo, - e usado para calcular: ${\ displaystyle {\ vec {r}} = {\ begin {bmatrix} 1 \\ 1 \ end {bmatrix}}}$

{\ displaystyle {\ begin {alinhados} A \ times (B {\ vec {r}}) - C {\ vec {r}} & = {\ begin {bmatrix} 2 & 3 \\ 3 & 4 \ end { bmatrix}} \ left ({\ begin {bmatrix} 1 & 0 \\ 1 & 2 \ end {bmatrix}} {\ begin {bmatrix} 1 \\ 1 \ end {bmatrix}} \ right) - {\ begin { bmatrix} 6 e 5 \\ 8 e 7 \ end {bmatrix}} {\ begin {bmatrix} 1 \\ 1 \ end {bmatrix}} \\ & = {\ begin {bmatrix} 2 & 3 \\ 3 & 4 \ end {bmatrix}} {\ begin {bmatrix} 1 \\ 3 \ end {bmatrix}} - {\ begin {bmatrix} 11 \\ 15 \ end {bmatrix}} \\ & = {\ begin {bmatrix} 11 \\ 15 \ end {bmatrix}} - {\ begin {bmatrix} 11 \\ 15 \ end {bmatrix}} \\ & = {\ begin {bmatrix} 0 \\ 0 \ end {bmatrix}}. \ End { alinhado}}}

O resultado é o vetor zero que sugere a possibilidade de AB = C. No entanto, se o vetor for selecionado para uma segunda iteração, o resultado será: ${\ displaystyle {\ vec {r}} = {\ begin {bmatrix} 1 \\ 0 \ end {bmatrix}}}$

{\ displaystyle A \ times (B {\ vec {r}}) - C {\ vec {r}} = {\ begin {bmatrix} 2 e 3 \\ 3 & 4 \ end {bmatrix}} \ left ({ \ begin {bmatrix} 1 & 0 \\ 1 & 2 \ end {bmatrix}} {\ begin {bmatrix} 1 \\ 0 \ end {bmatrix}} \ right) - {\ begin {bmatrix} 6 e 5 \\ 8 e 7 \ end {bmatriz}} {\ begin {bmatrix} 1 \\ 0 \ end {bmatrix}} = {\ begin {bmatrix} -1 \\ - 1 \ end {bmatrix}}.}

O resultado não é mais zero, o que prova que AB ≠ C.

Existem quatro vetores 0/1 de dois componentes. Metade deles leva ao vetor zero ( e ) de forma que a probabilidade de escolher aleatoriamente esses dois vetores (e, portanto, de concluir erroneamente que AB = C) é 1/2 2 ou 1/4. No caso geral, a proporção de vetores r que conduzem ao vetor zero pode ser menor que 1/2. Um grande número de tentativas são realizadas para tornar a probabilidade de erro muito baixa. ${\ displaystyle {\ vec {r}} = {\ begin {bmatrix} 0 \\ 0 \ end {bmatrix}}}$ ${\ displaystyle {\ vec {r}} = {\ begin {bmatrix} 1 \\ 1 \ end {bmatrix}}}$

Probabilidade de erro

Seja p a probabilidade de erro. Se A × B = C então p = 0, e se A × B ≠ C então p ≤ 1/2.

Caso A × B = C

{\ displaystyle {\ begin {align} {\ vec {P}} & = A \ times (B {\ vec {r}}) - C {\ vec {r}} \\ & = (A \ times B) {\ vec {r}} - C {\ vec {r}} \\ & = (A \ times BC) {\ vec {r}} \\ & = {\ vec {0}} \ end {alinhado}} }

Esse resultado é independente do valor de porque usa apenas igualdade . Portanto, a probabilidade de erro neste caso é: $\ vec {r}$ ${\ displaystyle A \ times BC = 0}$

{\ displaystyle \ Pr [{\ vec {P}} \ neq 0] = 0}

Caso A × B ≠ C

{\ displaystyle {\ vec {P}} = D \ times {\ vec {r}} = (p_ {1}, p_ {2}, \ dots, p_ {n}) ^ {T}}

{\ displaystyle D = A \ times BC = (d_ {ij})}

Uma vez que alguns componentes de são necessariamente diferentes de zero. Suponha o elemento . Pela definição do produto de matriz , vem: ${\ displaystyle A \ times B \ neq C}$ $D$ ${\ displaystyle d_ {ij} \ neq 0}$

{\ displaystyle p_ {i} = \ sum _ {k = 1} ^ {n} d_ {ik} r_ {k} = d_ {i1} r_ {1} + \ cdots + d_ {ij} r_ {j} + \ cdots + d_ {in} r_ {n} = d_ {ij} r_ {j} + y}

para alguns . Pelo teorema de Bayes , temos: $y$

{\ displaystyle \ Pr [p_ {i} = 0] = \ Pr [p_ {i} = 0 | y = 0] \ cdot \ Pr [y = 0] \, + \, \ Pr [p_ {i} = 0 | y \ neq 0] \ cdot \ Pr [y \ neq 0]}

Usando os resultados

{\ displaystyle \ Pr [p_ {i} = 0 | y = 0] = \ Pr [r_ {j} = 0] = {\ frac {1} {2}}}

{\ displaystyle \ Pr [p_ {i} = 0 | y \ neq 0] = \ Pr [r_ {j} = 1 \ land d_ {ij} = - y] \ leq \ Pr [r_ {j} = 1] = {\ frac {1} {2}}}

na equação anterior, o resultado é:

{\ displaystyle {\ begin {alinhados} \ Pr [p_ {i} = 0] & \ leq {\ frac {1} {2}} \ cdot \ Pr [y = 0] + {\ frac {1} {2 }} \ cdot \ Pr [y \ neq 0] \\ & = {\ frac {1} {2}} \ cdot \ Pr [y = 0] + {\ frac {1} {2}} \ cdot (1 - \ Pr [y = 0]) \\ & = {\ frac {1} {2}} \ end {alinhado}}}

Portanto,

{\ displaystyle \ Pr [{\ vec {P}} = 0] = \ Pr [p_ {1} = 0 \ land \ dots \ land p_ {i} = 0 \ land \ dots \ land p_ {n} = 0 ] \ leq \ Pr [p_ {i} = 0] \ leq {\ frac {1} {2}}.}

Isso encerra a prova.

Complexidade

Uma análise simples desse algoritmo mostra uma complexidade de tempo de O ( n 2 ) que bate o algoritmo determinístico clássico em O ( n 3 ). A análise de erro mostra que após k execuções do algoritmo, a probabilidade de erro é menor que . Na prática, o algoritmo é rápido devido às implementações eficientes de cálculo de um produto matriz-vetor. Portanto, o uso de algoritmos aleatórios pode acelerar um algoritmo determinístico lento. O melhor algoritmo determinístico para a verificação do produto da matriz é atualmente uma variante do algoritmo Coppersmith-Winograd com um tempo de execução assintótico em O ( n 2,3729 ). ${\ displaystyle {\ frac {1} {2 ^ {k}}}}$

O algoritmo Freivalds freqüentemente aparece nas introduções aos algoritmos probabilísticos devido à sua simplicidade. Na prática, também ilustra a superioridade dos algoritmos probabilísticos em certos problemas.

Veja também

Lema de Schwartz-Zippel

Notas

(fr) Este artigo foi retirado parcial ou totalmente do artigo da Wikipedia em inglês intitulado “ Freivalds 'algorithm ” ( veja a lista de autores ) .

Referências

Virginia Vassilevska Williams, " Quebrando a barreira Coppersmith-Winograd "
Prabhakar Raghavan , “ Randomized algoritms, ” ACM Computing Surveys , vol. 28,1997( DOI 10.1145 / 234313.234327 , lido online , acessado em 16 de dezembro de 2008 )

Freivalds, R. (1977), “Probabilistic Machines Can Use Less Running Time”, IFIP Congress 1977, pages 839-842.