Qualidade de imagem perceptual

A imagem perceptual de qualidade é uma medida da degradação da imagem percebida (muitas vezes em comparação com a chamada imagem de referência não degradada). Os sistemas de processamento de sinal geralmente introduzem artefatos (ou distorções) no sinal. Além disso, a medição da qualidade tornou-se importante. Normalmente existem três categorias de medição de qualidade de imagem:

Medição de qualidade no contexto da fotografia

A obtenção de imagens por dispositivos fotográficos ou por câmeras é a formação no plano da imagem de medidas obtidas eletronicamente no caso de dispositivos digitais ou quimicamente no caso de dispositivos analógicos. Classicamente, o modelo projetivo conhecido como Pinhole (ou “pinhole”) esquematiza a operação do dispositivo de disparo por seu centro focal e seu plano de imagem de modo que os raios de luz convergem em direção ao centro focal impactando o plano de imagem. Na verdade, este modelo é uma aproximação da formação da imagem e a qualidade da imagem fornece informações sobre o valor dessa aproximação.

Um modelo ideal que descreve a medição de luz da câmera durante uma fotografia deve descrever a taxa de luz que chega a cada um dos pontos em um determinado momento. Este tipo de modelo é apenas aproximado e a qualidade da imagem mede a taxa de deriva entre este modelo e a realidade. Esta medida deve responder a várias perguntas, incluindo:

No campo da fotografia, contamos com ferramentas como o critério de Johnson  (in) que determina a qualidade da imagem necessária para a detecção de alvos em visão noturna .

Elementos característicos da medição da qualidade da imagem

Existem muitas e muitas causas para a perda de qualidade das imagens. Aqui estão alguns exemplos relativos às vezes ao campo da fotografia e às vezes ao da multimídia:

A nitidez ou nitidez de uma imagem Nitidez ( Nitidez em inglês) define os pequenos detalhes de uma imagem. Sua percepção é afetada pelo conjunto de lentes utilizadas (design e fabricação da lente, distância focal, diafragma e distância ao centro da imagem) e pelo conjunto de sensores (número de pixels, filtro antialiasing). Também pode ser afetado pelo movimento da câmera ao tirar fotos (um bom tripé pode ser útil), precisão de foco e distúrbios atmosféricos. Freqüentemente, a perda de nitidez de uma imagem só pode ser parcialmente reparada por processos de restauração, porque tentar restaurar uma imagem demais pode degradá-la! Isso freqüentemente resulta em "halos" em torno dos limites de contraste. Infelizmente, verifica-se que esse risco de restauração excessiva de uma imagem às vezes ocorre com câmeras digitais compactas para compensar a qualidade relativamente baixa das imagens obtidas. O barulho O ruído é uma variação aleatória na intensidade da imagem perceptível como a granulação dos filmes ou a variação no número de pixels em uma imagem digital (redução da resolução). Vem de fenômenos físicos dentro de sensores de imagem: a natureza dos fótons e a energia térmica do calor. A suavização é um dos processos clássicos de redução de ruído, evitando bordas entre contrastes. Este processo, embora eficaz, deteriora contrastes fracos. A dinamica A dinâmica de uma câmera representa a faixa de intensidades que ela pode capturar, geralmente medidas em EV (valor de exposição) ou áreas. Tem uma ligação estreita com ruído e textura, uma vez que EV é uma combinação de tempo de exposição e a abertura do diafragma (número f); quanto maior o tempo de exposição, mais degradada a textura; da mesma forma, quanto menor o número f, mais luz incide nos sensores. A reprodução do tom  (em) A reprodução da cor corresponde à capacidade de traduzir corretamente a luminância (intensidade da luz emitida pelos objetos) em termos de luminosidade (percepção da luminosidade por humanos e dispositivos digitais). Normalmente, a reprodução de cores de uma cena em uma fotografia em preto e branco. Contraste O contraste é uma medida relativa e não absoluta da intensidade da luz. Essa medida é expressa pela diferença de intensidade entre duas regiões ou dois objetos. É uma das características fundamentais do sistema visual humano. Um forte contraste leva a uma diminuição da dinâmica, o que resulta na perda de detalhes, mascaramento de informações causado por realces e sombras. Fidelidade de cor reproduzida A fidelidade das cores reproduzidas é importante, embora delicada, devido à alta subjetividade dessa característica para o sistema visual humano. Além disso, ao contrário da nossa primeira impressão, esta característica intervém apenas ligeiramente no processo de análise e interpretação dos dados visuais pelo cérebro humano. Distorções focais As distorções focais causam distorções significativas, como o efeito de barril, almofada ou bigode. Esses fenômenos aparecem com câmeras de baixo custo ou mesmo com uma lente grande angular. O software de calibração pode corrigir essas distorções. Vinhetas Vinhetas é o escurecimento das bordas da imagem. Este fenômeno vem da má qualidade da lente fotográfica ou da má adaptação da lente ao plano da imagem: não cobre todo o plano da imagem; seja por um filtro para um efeito voluntário ou não. Tempo de exposição O ajuste fino do tempo de exposição pode ser muito útil com câmeras totalmente automatizadas e outras camcorders que oferecem pouca ou nenhuma possibilidade de ajuste de tonalidade (cf. reprodução de tonalidade) no pós-processamento. Algumas câmeras oferecem uma memorização dos parâmetros de exposição: certos objetos mais claros ou mais escuros do que a cena podem então aparecer sem perturbar as configurações de fotografia. Aberrações cromáticas As aberrações cromáticas, ou franjas de dispersão cromática, vêm principalmente de um defeito de qualidade nas lentes objetivas. Esse fenômeno é mais facilmente observado com lentes grande angulares, cujas lentes são mais difíceis de projetar. Esta é uma quebra não intencional da luz nas bordas das lentes devido à mudança no índice de refração do material. Essas aberrações têm efeitos prejudiciais no demosaicing de câmeras digitais (cf. matriz Bayer) Reflexões focais Reflexos focais, fator de flare , neblina, causados ​​por dispersão de luz parasita dentro de uma lente, causam uma queda geral no contraste da imagem obtida e, além disso, sua dinâmica em intensidade e cromaticidade. Quanto mais complexo o conjunto de lentes com lentes múltiplas, mais provável é que esses reflexos apareçam. Moiré cromático O moiré cromático apresenta faixas artificiais de cores na imagem cujos padrões de alta frequência se repetem causando ilusões de ótica. A finura das lentes, os filtros antialiasing (low pass) e o demosaicing são as principais causas.

Medição de qualidade no contexto de multimídia

Em alguns casos, a imagem da qual queremos saber a qualidade não é obtida diretamente no formato raw (RAW) de uma câmera fotográfica digital (APN), mas sofreu deformações devido às técnicas de codificação de imagens, armazenamento em disco e rede transmissão. A menos que você tenha usado uma técnica de compactação sem perdas, como GIFF ou PNG, a imagem descompactada não é igual à imagem capturada originalmente. Por exemplo, uma fotografia digital (obtida por uma câmera digital) que foi compactada em JPEG e transmitida por uma rede sem fio e que foi descompactada necessariamente sofreu perdas que podem ou não ser visivelmente incômodas.

A medida de qualidade é então a diferença perceptível entre o original ( formato RAW ) e as imagens descompactadas. Os artefatos geralmente se referem a danos devido ao tratamento sofrido pela imagem em sua transmissão remota ou ao passar RAW para outro formato causando perdas como JPEG e JPEG2000. Esses mesmos artefatos são evidentemente encontrados em vídeos digitais.

Quando a medição da qualidade da imagem é automatizada por algoritmo, a medição é considerada objetiva . Devemos então ser capazes de verificar se o algoritmo usado está correto. Em outras palavras, a medição objetiva deve estar alinhada com a percepção humana. Para fazer isso, ele é avaliado usando bancos de dados de imagens de teste fornecidos com medições subjetivas , medições feitas por testadores a jusante do algoritmo ou a montante.

Diferentes tipos de medição de qualidade de imagem

Existem várias técnicas e medidas de qualidade de imagem que podem ser desenvolvidas como um algoritmo de medição de qualidade de imagem objetivo. Esses algoritmos podem ser classificados em três categorias principais:

Algoritmos com referências

Entre os algoritmos de FR encontramos VIF , IFC , SSIM , VSNR e MSVD .

Graças aos modelos de mistura gaussiana multiescala, VIF e IFC modelam por um lado a percepção da imagem de referência no cérebro e por outro a percepção da imagem distorcida. VIF e IFC estimam informações mútuas entre esses dois modelos em todos os níveis de resolução. O IFC oferece a melhor medição objetiva atualmente, em comparação com as medições subjetivas feitas a montante.

SSIM é sem dúvida o mais eficiente em termos de complexidade algorítmica, bem como em termos de adequação à percepção humana. Seu princípio geral é baseado em estatísticas que podemos identificar nas chamadas cenas naturais. O critério de qualidade compreende três medidas de acordo com as mudanças de contraste, luminosidade e estrutura entre a imagem de referência e a imagem distorcida. Deve-se notar que o SSIM fornece uma medida de qualidade entre 0 (baixa qualidade) e 1 (alta qualidade) e um mapa das deformações associadas à imagem distorcida observada. Para cada pixel, este mapa indica a intensidade da deformação assumida. Graças a isso, as deteriorações são localizadas, o que torna possível considerar o uso de SSIM dentro do software de compactação / descompactação para aumentar o desempenho.

Existem várias versões do SSIM, incluindo M-SSIM [REF] e IW-SSIM [REF]. M-SSIM usa análise de multiresolução wavelet (AMR) para explicar o fato de que as informações são distorcidas em vários níveis de escala. Em cada nível de resolução, o SSIM é aplicado. A medida geral é uma soma dos SSIMs para cada nível de resolução ponderado pelo inverso do nível de resolução. Ao usar o princípio SIIM, o IW-SSIM enfatiza o estágio de agrupamento dos valores de deformação de pixel.

O VSNR usa um AMR de imagens de referência e distorcidas para medir as distorções. O MSVD mede as diferenças de energia das duas imagens em todos os níveis de resolução. Este algoritmo propõe uma abordagem baseada nos gradientes de intensidade das imagens de referência e distorcidas. Módulos e fases desses gradientes são contornos extraídos, áreas texturizadas e uniformes. A distância de Hamming é usada para medir as diferenças dentro de cada um desses componentes. A medição final é a soma das distâncias obtidas.

Notas e referências

  1. OD Faugeras: Three-Dimensional Computer Vision: a Geometric Viewpoint , MIT Press, 1993. ( ISBN  0-262-06158-9 ) .
  2. A. Harltey, A. Zisserman: Multiple view geometry in computer vision (2. ed.). , Cambridge University Press, p I-XVI, 1-655, 2006, ( ISBN  978-0-521-54051-3 ) .
  3. O modelo projetivo é adequado para câmeras digitais e estáticas, com exceção de câmeras omnidirecionais  (en) e scanners de varredura  (en) . Deve-se notar que a distinção entre câmera e dispositivo digital está cada vez mais confusa.
  4. F. Cottet: Signal Processing and Data Acquisition , Collection Sup Sciences - 3 e ed, Dunod, 2009. ( ISBN  9782100525386 ) .
  5. F. Cottet: tratamento auxiliar de memória do signa , colecção: Ciências Sup - 2 nd ed., Dunod, 2011, ( ISBN  9782100565443 ) .
  6. RC Gonzalez, RE Woods: geometria de múltiplas vistas em visão computacional (2. ed.). , Prentice Hall, 2008, ( ISBN  9780131687288 ) .
  7. G. Blanchet, M. Charbit: Sinais e imagens em Matlab: métodos, aplicações e exercícios corrigidos , Hermes Science Publications, 2001 - 689 páginas
  8. WB Pennebaker, JL Mitchell: JPEG: Still Image Data Compression Standard , Springer, 1993, ( ISBN  0-442-01272-1 e 978-0-442-01272-4 ) .
  9. D. Taubman e MW Marcellin, JPEG2000 Image Compression Fundamentals, Standards and Practice , Springer, 2002, ( ISBN  9780792375197 ) .
  10. Banco de dados de imagens AO VIVO
  11. Banco de dados de imagens TID
  12. HR Sheikh, AC Bovik: Abordagens Teóricas da Informação para Avaliação da Qualidade de Imagem , no Manual de Processamento de Imagem e Vídeo. Elsevier, 2005, Editor AC Bovik.
  13. (in) HR Sheikh e AC Bovik, "  informação de imagem e qualidade visual  " , IEEE Transactions em Processamento de Imagem , vol.  15, n o  2Fevereiro de 2006, p.  430- 444 ( ler online )
  14. (in) HR Sheikh, AC Bovik e G. de Veciana, "  Critério de fidelidade do ano de informação para avaliação da qualidade de imagem usando estatísticas de cena natural  " , IEEE Transactions on Image Processing , vol.  14, n o  12,dezembro de 2005, p.  2117- 2128 ( ler online )
  15. (em) Z. Wang, EP Simoncelli e AC Bovik, "  similaridade estrutural Multi-scale for image quality assessment  " , IEEE Asilomar Conference Signals, Systems and Computers ,novembro de 2003
  16. (em) DM Chandler e SS Hemami, "  VSNR: A Wavelet Visual Signal-to-Noise Ratio for Natural Images  " , IEEE Transactions on Image Processing , vol.  16, n o  9,2007, p.  2284-2298 ( ler online )
  17. (em) Wujie Zhou Gangyi Jiang Xiaodong Wang, Mei Yu, Feng Shao e Zongju Peng, "  A Novel Image Quality Assessment Metric based on Image Gradient Vectors  " , International Journal on Advances in Information Sciences and Service Sciences , vol.  4, n o  18,outubro de 2012( leia online )

Veja também

Artigos relacionados

Link externo