O FLUXO TEMPORAL DE TERMOS RELEVANTES: uma análise em teses da UFMG de 2007 a 2018 nas ciências humanas.
No Thumbnail Available
Date
2021
Journal Title
Journal ISSN
Volume Title
Publisher
Revista Múltiplos Olhares em Ciência da Informação
Abstract
O objetivo geral desta pesquisa foi analisar se há uma variação temporal característica da distribuição
de valores de termos relevantes ao longo do tempo da produção de textos que possa contribuir como
um critério para o processo de sua indexação automática. Foram analisadas as teses de doutorado dos
programas de pós-graduação (PPGs) da área de Ciências Humanas da UFMG, considerando-se 7
PPGs distintos, sendo cada um deles um corpus, com um total de 929 teses defendidas período de 12
anos, de 2007 a 2018. Os termos considerados foram todos os sintagmas nominais contidos nos
próprios textos das teses. Cada sintagma nominal recebeu um valor associado à sua relevância como
descritor de acordo com os critérios de frequência do termo na própria tese (TF - Term Frequency) e
com o inverso da frequência de ocorrência do termo no total de teses de cada PPG (IDF - Inverse
Document Frequency). As teses foram divididas em 12 grupos em cada PPG para o cálculo da data
média de defesa das teses e da média de pontuação consolidada dos termos relevantes nas teses. Como resultados, identificou-se o comportamento característico de cada PPG através de um gráfico de
dispersão do nível médio de pontuação de relevância ao longo do tempo. Para cada gráfico de cada
um dos 7 PPGs foi adicionada uma linha de tendência, considerando seu respectivo R2, e feita sua
análise específica. Todos os comportamentos de distribuição temporais foram caracterizados em
equações e podem ser aplicados como critério para indexação automática.
Description
Keywords
Recuperação da Informação Temporal. Indexação Automática. Sintagmas Nominais.
