Imagem completa

Uma imagem integral (ou tabela de áreas somadas ) é uma representação na forma de uma imagem digital e um algoritmo, permitindo calcular rapidamente somas de valores em áreas retangulares.

Originalmente proposto como um método de computação gráfica em 1984, as imagens completas tornaram-se mais conhecidas na visão computacional desde 2001 por sua reformulação no método de Viola e Jones .

É uma representação em forma de imagem, do mesmo tamanho da imagem original, que em cada um dos seus pontos contém a soma dos pixels localizados acima e à esquerda deste ponto. Mais formalmente, a imagem integral é definida a partir da imagem por:

Graças a esta representação em forma de tabela de correspondência , a soma dos valores em uma zona retangular pode ser calculada em apenas 4 acessos à imagem completa (6 acessos para duas zonas retangulares contíguas), e portanto em tempo constante qualquer o tamanho da área.

Esta soma pode ser calculada por indução, por:

onde é a soma cumulativa da linha x até a coluna y. A imagem integral pode, portanto, ser calculada com uma única varredura da imagem original.

Uma vez calculada a imagem completa, a soma dos pixels dentro de qualquer retângulo ABCD pode ser avaliada em apenas 4 acessos:

Extensões

O método foi estendido para áreas retangulares orientadas a 45 ° em 2002. O princípio é idêntico, exceto que a soma agora é calculada em um semi-retângulo orientado a 45 °:

O cálculo da soma no retângulo desejado a partir da imagem integral é sempre realizado como uma soma simples de 4 elementos da imagem integral.

A ideia na base das imagens integrais foi retomada em 2005 para propor o histograma integral, que permite o cálculo rápido de histogramas locais.

Formulários

Imagens integrais têm sido usadas principalmente para calcular características pseudo-Haar no método de Viola e Jones e seus derivados, mas também para calcular outros tipos de características que requerem o cálculo de somas locais de pixels, por exemplo histogramas de gradientes orientados .

Notas e referências

  1. Franklin Crow (1984). “  Tabelas de área somada para mapeamento de textura  ” SIGGRAPH '84: Anais da 11ª conferência anual sobre computação gráfica e técnicas interativas : 207–212 p .. 
  2. Paul Viola e Michael Jones, Detecção robusta de objetos em tempo real IJCV 2001
  3. Rainer Lienhart e Jochen Maydt, um conjunto alargado de Haar-like Features para a detecção rápida de objetos , Em IEEE ICIP de 2002
  4. Rainer Lienhart, Alexander Kuranov e Vadim Pisarevsky. Análise empírica de cascatas de detecção de classificadores otimizados para detecção rápida de objetos . páginas 297–304. 2003
  5. Porikli, F., "Integral Histogram: A Fast Way to Extract Histograms in Cartesian Spaces", anais da IEEE Conference on Computer Vision and Pattern Recognition (CVPR), junho de 2005
  6. Qiang Zhu, Shai Avidan, Mei C. Yeh e Kwang T. Cheng. Detecção humana rápida usando uma cascata de histogramas de gradientes orientados . Em IEEE CVPR , p.   1491-1498. 2006.
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">