Exploiting a loss and a synthetic dataset protocol for biometrics system.
Nenhuma Miniatura disponível
Data
2022
Autores
Título da Revista
ISSN da Revista
Título de Volume
Editor
Resumo
Os sistemas biométricos são um assunto comum no cotidiano do ser humano. Os esforços para
aumentar a segurança desses sistemas estão aumentando a cada ano devido à sua necessidade
por robustez. Os sistemas baseados em uma modalidade biométrica não tem um desempenho
próximo da perfeição em ambientes não cooperativos, o que exige abordagens mais complexas.
Devido a isso, novos estudos são desenvolvidos para melhorar o desempenho de sistemas
baseados em biometria, criando novas formas de ensinar um algoritmo de machine learning a
criar novas representações. Atualmente, vários pesquisadores estão direcionando seus esforços
para desenvolver novas abordagens de metric learning para arquiteturas de deep learning para
uma ampla gama de problemas, incluindo biometria. Neste trabalho, propõe-se uma função
de perda baseada em dados biométricos para criar representações profundas a serem utilizadas
em sistemas biométricos, chamada de D-loss. Os resultados mostram a eficácia da função
de perda proposta com a menor taxa de equal-error rate (EER) de 5,38%, 13,01% e 7,96%
para MNIST-Fashion, CIFAR-10 e CASIA-V4. Uma estratégia diferente para aumentar a
robustez de um sistema é a fusão de duas ou mais modalidades biométricas. No entanto,
é impossível encontrar um conjunto de dados com todas as combinações de modalidades
biométricas possíveis. Uma solução simples é criar um conjunto de dados sintéticos, embora a
metodologia para criar um ainda seja um problema em aberto na literatura. Neste trabalho,
propõe-se a criação de um critério para mesclar duas ou mais modalidades de tal forma a criar
conjuntos de dados sintéticos semelhantes: o critério de Doddington Zoo. Várias estratégias
de mesclagem são avaliadas: fusões ao nível de score (mínimo, multiplicação e soma) e nível
de características (concatenação simples e metric learning). Um EER próximo a zero também
é observado usando os critérios de fusão propostos com a fusão de soma de pontuação e as
modalidades de Eletrocardiograma (CYBHi), olho e face (FRGC). Dois conjuntos de dados
com mais de 1.000 indivíduos (UFPR-Periocular e UofTDB) são usados para avaliar os
critérios de mesclagem junto com a D-loss e outras funções de metric learning. Os resultados
mostram o aspecto do critério do Doddington Zoo de criar conjuntos de dados semelhantes
(pequeno desvio padrão em relação ao critério randômico) e a robustez do D-loss (2,50% EER
contra 2,17% da função de perda triplets e 5,74, da função de perda multi-similarity).
Descrição
Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
Palavras-chave
Machine learning, Synthetic dataset, Metric learning, Biometrics, Chimeric dataset
Citação
SILVA, Pedro Henrique Lopes. Exploiting a loss and a synthetic dataset protocol for biometrics system. 2022. 81 f. Tese (Doutorado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2022.