Exploiting a loss and a synthetic dataset protocol for biometrics system.

Silva, Pedro Henrique Lopes

Exploiting a loss and a synthetic dataset protocol for biometrics system.

Arquivos

TESE_ExploitingLossSynthetic.pdf (13.97 MB)

Data

2022

Autores

Silva, Pedro Henrique Lopes

Resumo

Os sistemas biométricos são um assunto comum no cotidiano do ser humano. Os esforços para aumentar a segurança desses sistemas estão aumentando a cada ano devido à sua necessidade por robustez. Os sistemas baseados em uma modalidade biométrica não tem um desempenho próximo da perfeição em ambientes não cooperativos, o que exige abordagens mais complexas. Devido a isso, novos estudos são desenvolvidos para melhorar o desempenho de sistemas baseados em biometria, criando novas formas de ensinar um algoritmo de machine learning a criar novas representações. Atualmente, vários pesquisadores estão direcionando seus esforços para desenvolver novas abordagens de metric learning para arquiteturas de deep learning para uma ampla gama de problemas, incluindo biometria. Neste trabalho, propõe-se uma função de perda baseada em dados biométricos para criar representações profundas a serem utilizadas em sistemas biométricos, chamada de D-loss. Os resultados mostram a eficácia da função de perda proposta com a menor taxa de equal-error rate (EER) de 5,38%, 13,01% e 7,96% para MNIST-Fashion, CIFAR-10 e CASIA-V4. Uma estratégia diferente para aumentar a robustez de um sistema é a fusão de duas ou mais modalidades biométricas. No entanto, é impossível encontrar um conjunto de dados com todas as combinações de modalidades biométricas possíveis. Uma solução simples é criar um conjunto de dados sintéticos, embora a metodologia para criar um ainda seja um problema em aberto na literatura. Neste trabalho, propõe-se a criação de um critério para mesclar duas ou mais modalidades de tal forma a criar conjuntos de dados sintéticos semelhantes: o critério de Doddington Zoo. Várias estratégias de mesclagem são avaliadas: fusões ao nível de score (mínimo, multiplicação e soma) e nível de características (concatenação simples e metric learning). Um EER próximo a zero também é observado usando os critérios de fusão propostos com a fusão de soma de pontuação e as modalidades de Eletrocardiograma (CYBHi), olho e face (FRGC). Dois conjuntos de dados com mais de 1.000 indivíduos (UFPR-Periocular e UofTDB) são usados para avaliar os critérios de mesclagem junto com a D-loss e outras funções de metric learning. Os resultados mostram o aspecto do critério do Doddington Zoo de criar conjuntos de dados semelhantes (pequeno desvio padrão em relação ao critério randômico) e a robustez do D-loss (2,50% EER contra 2,17% da função de perda triplets e 5,74, da função de perda multi-similarity).

Descrição

Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.

Palavras-chave

Machine learning, Synthetic dataset, Metric learning, Biometrics, Chimeric dataset

Citação

SILVA, Pedro Henrique Lopes. Exploiting a loss and a synthetic dataset protocol for biometrics system. 2022. 81 f. Tese (Doutorado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2022.

URI

http://www.repositorio.ufop.br/jspui/handle/123456789/15073

Coleções

PPGCC - Doutorado (Teses)

Página do item completo