A indexação (ou indexação de assunto ) é uma etapa do canal documental que consiste em identificar e expressar o conteúdo de um documento por meio de um vocabulário geralmente padronizado. Expressado de acordo com as regras de uma linguagem natural ou linguagem documental , o assunto tratado no documento é então integrado ao registro bibliográfico . A indexação é usada nos metadados de uma página da web , em bancos de dados bibliográficos ou em catálogos de bibliotecas .
A indexação é, portanto, uma etapa importante da catalogação, na medida em que oferece um critério de busca que permite encontrar um documento sem saber sua existência. Ele permite que os usuários com necessidades de informação localizem mais facilmente os documentos relevantes às suas necessidades. Padrões nacionais ou internacionais regem o trabalho do indexador. No entanto, este trabalho requer uma análise e uma escolha, portanto uma parte interpretativa e parcial, cuja relevância e eficácia dependem do indexador, da linguagem utilizada e da antecipação das necessidades do leitor.
A indexação inclui pelo menos duas etapas importantes: análise de documentos e representação de assuntos. A análise permite identificar e selecionar os conceitos contidos em um documento. Eles são então representados por termos que permitem sua identificação.
O número de etapas varia de acordo com os autores consultados. A análise do documento, a seleção dos temas e a tradução destes em termos de indexação são etapas geralmente percorridas.
Inicialmente, a análise do documento permite identificar o (s) assunto (s) principal (s) e secundário (s) que nele são tratados sob uma determinada perspectiva ou ponto de vista. Para isso, várias partes do documento podem ser consultadas. Por exemplo, para um documento textual, podem ser: título, resumo, introdução, conclusão, títulos de capítulos ou seções, índice, etc.
Em seguida, é feita uma seleção nesses assuntos identificados, de acordo com o nível de precisão desejado para a indexação. O objetivo é, por exemplo, reter apenas o mais importante para o usuário em questão, ou o mais geral para não sobrecarregar desnecessariamente as instruções. A seleção destes pode depender de vários fatores: o indexador, o departamento e a organização, os assuntos normalmente pesquisados pelos usuários e o vocabulário que utilizam durante suas pesquisas. Os assuntos principais costumam ser encontrados no registro bibliográfico do documento.
Uma indexação exaustiva pressupõe que todos os assuntos identificados durante a análise sejam selecionados. Embora a recuperação seja favorecida, é possível obter mais ruído ao pesquisar.
Na maioria dos casos, a indexação é seletiva. A escolha dos temas é feita de acordo com os comportamentos e necessidades dos usuários em questão ou de acordo com sua importância no documento. Embora o recall possa ser menor, a precisão é favorecida.
Por fim, os temas escolhidos são expressos de forma mais ou menos padronizada em termos de indexação. Estas são as chaves para acessar os documentos relevantes para os usuários.
Quando poucas restrições são impostas à expressão dos assuntos, falamos em indexação em linguagem livre ou natural. Os assuntos assim expressos são chamados de palavras-chave . Em contraste, a formulação do sujeito também pode ser submetida a um sistema de restrições, que visa padronizar a formulação. Em seguida, falamos de indexação em linguagem controlada e os assuntos expressos dessa forma são chamados de cabeçalhos de assuntos . Todas as restrições impostas à expressão do sujeito constituem as bases de uma linguagem documental .
Restrições | Língua | Resultado |
---|---|---|
pouco | gratuitamente | palavra-chave |
sim | ao controle | título de assunto |
O uso de linguagem livre ou controlada é baseado em dois princípios: unidade de significado e especificidade. O princípio da unidade de sentido pressupõe que, dentro de um mesmo índice, os termos escolhidos representam sempre os mesmos sujeitos. Em contrapartida, os conceitos são sempre traduzidos pelos mesmos termos de indexação. O princípio da especificidade implica que os termos escolhidos tenham a mesma extensão semântica que os sujeitos que representam.
O assunto coberto por um documento pode ser:
No primeiro caso, uma ferramenta de linguagem controlada é freqüentemente usada para descrever o objeto, o conceito, a noção. Noutros casos, a forma de designar a pessoa, o lugar ... pode ser fixada por uma norma.
Existem várias ferramentas de indexação, compostas por tesauros documentários e outras linguagens controladas.
No Canadá francófono, existem duas ferramentas principais:
Na França, o Unified Encyclopedic and Alphabetical Matter Authority Directory (RAMEAU), que vem do RVM, é comumente usado em bibliotecas municipais e universitárias. Existe também uma ferramenta de indexação de documentos para jovens, de Martine Blanc-Montmayeur e que leva seu nome.
Ferramentas especializadas como AGROVOC também existem.
VMJ Home Page
VMJ Home Page 2
Pesquisa VMJ
Exemplo de resultado VMJ
O Serviço de Documentário Multimídia para Livros Infantis é um diretório de cabeçalhos de assuntos infantis. É distribuído por um site acessível em uma assinatura paga por nome de usuário e senha.
O sistema de pesquisa permite que você pesquise por Título exato, Títulos que começam com e Títulos por palavras-chave. É aconselhável fazer uma pesquisa de palavras-chave masculino-plural.
Ex: Tubarões
Ex: Apple
Ex: frutas
Ex: Escritos operários EP - Literatura operária - Literatura proletária - Poesia operária - Trabalhadores, Escritos - Trabalhadores, Escritos - Escritos operários
Ex: Crianças TG - Famílias - Grupos etários
TS (107 termos específicos) - Artesanato para crianças - Crianças bonitas - Bilinguismo em crianças - Catequese de crianças - Últimos nascidos, etc.
Ex: aniversário TA -Festivais -Férias
Para enquadrar o trabalho dos indexadores, existem normas internacionais e nacionais que apresentam modelos teóricos e conselhos gerais. Não visam a uniformidade mundial dada a natureza subjetiva do processo de indexação e a influência das características específicas do ambiente e dos usuários sobre os assuntos representados.
Os padrões úteis a saber são:
Para garantir que os resultados produzidos pelo processo de indexação sejam relevantes e consistentes, a presença de uma política de indexação institucional pode ser útil para os indexadores.