Desenvolvimento de Softwares de Indexação Automática: breve Avaliação dos Principais Critérios
No Thumbnail Available
Date
2015-12
Journal Title
Journal ISSN
Volume Title
Publisher
Informação & Tecnologia
Abstract
Este estudo apresenta um resultado de pesquisa sobre critérios utilizados na construção de softwares
para indexação automática. O objetivo principal foi realizar um mapeamento panorâmico, a partir
da análise de literatura da área, desde a década de 1950 até o ano de 2008, para verificar quais
critérios foram apontados pelos autores como relevantes para o desenvolvimento dos softwares.
Como suporte teórico e metodológico analisou-se: a semântica e a sintaxe; a Linguística
computacional e o Tratamento de documentos textuais para fins de recuperação da informação. Para
tal, utilizou-se do procedimento metodológico de Análise de Conteúdo, identificando os critérios de
indexação automática desenvolvidos e utilizados no período através de relato de experiência dos
próprios pesquisadores autores. Priorizaram-se aqueles que têm como preocupação central o
tratamento das questões semânticas do documento textual. Como resultados finais, obteve-se o
levantamento dos principais critérios e a proposição de possíveis combinações entre eles, visando
auxiliar aos profissionais na primeira etapa do processo de indexação, que trata da extração de
termos relevantes para representação de assuntos. Tornou-se possível, desta forma, a utilização dos
critérios que estavam dispersos na literatura através de relatos de experiências e que nem sempre
são divulgadas nas áreas de interseção com a Ciência da Informação - CI, tais como a Linguística e
a Ciência da Computação. Entre os objetivos alcançados, encontram-se: (1) listagem dos critérios
encontrados na literatura; (2) caracterização de cada critério e (3) listagem dos critérios mais
recorrentes. Obteve-se um conjunto de critérios ideais para o desenvolvimento de softwares de
extração automática.
Description
Keywords
Indexação Automática. Critérios de Indexação Automática. Software de Indexação automática. Representação da informação.
