Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores.
Nenhuma Miniatura disponível
Data
2014
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
O problema de ambiguidade de nomes em citações bibliográficas tem sido amplamente estudado principalmente pela comunidade científica de bibliotecas digitais envolvendo nomes de autores. Normalmente, os métodos propostos na literatura seguem abordagens supervisionadas ou não supervisionadas. Os métodos supervisionados são normalmente os mais efetivos, mas geralmente requerem que uma grande quantidade de exemplos sejam manualmente rotulados e, além disso, também não são capazes de resolver a ambiguidade para todos os nomes devido a inerente dificuldade do problema. Recentemente, com o objetivo de melhorar o resultado do processo de desambiguação, alguns trabalhos têm utilizado a colaboração de usuários na desambiguação manual de alguns registros. Neste trabalho é proposto um método para combinar resultados de técnicas supervisionadas de aprendizado de máquina com a colaboração de usuários para resolver tal problema. Inicialmente, o método explora os atributos dos registros de citações para agrupar registros que pertençam a um único autor. A partir desses grupos, classificadores são combinados para gerar uma função de similaridade que, juntamente com a colaboração do usuário, contribuem para agrupar grupos separados de registros de citações que pertencem a um mesmo autor real. Apesar de usar técnicas supervisionadas, o único esforço exercido por parte do usuário é fornecer a sua colaboração desambiguando alguns nomes de autores. O método foi comparado com outros métodos representativos e o ganho em relação a eles atinge cerca de 20% nos resultados de desambiguação.
Descrição
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
Palavras-chave
Sistemas de recuperação da informação, Bibliotecas digitais
Citação
SOUZA, E. A. de. Uma proposta para combinar classificadores e colaboração de usuários na resolução do problema de ambiguidade de nomes de autores. 2014. 86 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2014.