Pegada acústica

Uma impressão digital acústica é um resumo digital gerado a partir de um sinal de áudio . Esta impressão digital permite identificar uma amostra de som ou localizar uma sequência de som em um banco de dados de áudio.

Os usos práticos são múltiplos, por exemplo, a identificação de canções, gravações, melodias, anúncios, emissões de rádio, efeitos sonoros ou sequências de vídeo entre outros.

Características

Uma pegada acústica deve satisfazer várias condições.

Especificidade

A impressão deve ser precisa o suficiente para que dois sons muito diferentes não tenham a mesma impressão.

Robustez para distorções

Um algoritmo de impressão digital acústica deve levar em consideração as características audíveis do som. Se duas amostras forem percebidas como idênticas pelo ouvido humano, sua pegada deve ser igual ou muito próxima, mesmo que sua representação numérica seja muito diferente. Como tal, as impressões digitais acústicas não são impressões digitais no sentido usual do termo. A maioria das técnicas de compressão de áudio ( MP3 , WMA , OGG ) produzem mudanças significativas na codificação binária de um arquivo de áudio, sem afetar a maneira como é visualizado. Um bom algoritmo de impressão digital acústica tornará possível identificar uma gravação, mesmo depois de ter sofrido tal compressão. Uma ligeira variação na velocidade ou um ligeiro ruído também não deve alterar muito a área ocupada.

Eficiência

Para ser usada, a pegada deve ser fácil de calcular, ou seja, ter uma pequena complexidade de tempo e fácil de armazenar, ou seja, compacta, curta.

Implementações

Veja também

Notas e referências

  1. Pedro Cano, Eloi Batlle, Ton Kalker e Jaap Haitsma, “A Review of Algorithms for Audio Fingerprinting” , in International Workshop on Multimedia Signal Processing, US Virgin Islands , dezembro de 2002) ( leia online ) .