Detecção de fraudes financeiras em contas digitais : explorando abordagens hierárquicas e técnicas de aprendizado profundo.

dc.contributor.advisorLuz, Eduardo José da Silvapt_BR
dc.contributor.advisorMoreira, Gladston Juliano Pratespt_BR
dc.contributor.authorSouza, Andressa Oliveira
dc.contributor.refereeLuz, Eduardo José da Silvapt_BR
dc.contributor.refereeMoreira, Gladston Juliano Pratespt_BR
dc.contributor.refereeLima, Helen de Cássia Sousa da Costapt_BR
dc.contributor.refereeSilva, Rodrigo César Pedrosapt_BR
dc.contributor.refereeOliveira, Samuel Evangelista Lima dept_BR
dc.date.accessioned2023-09-26T20:29:15Z
dc.date.available2023-09-26T20:29:15Z
dc.date.issued2023pt_BR
dc.descriptionPrograma de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.pt_BR
dc.description.abstractNos últimos anos, houve um aumento na oferta de serviços financeiros por meio de aplicativos e internet banking, mas isso também levou a um aumento de contas digitais fraudulentas. Em problemas de detecção de fraudes financeiras, é comum encontrar um desbalanceamento significativo entre amostras não fraudulentas e fraudulentas, dificultando sua identificação. Dessa forma, este trabalho aborda a detecção dessas contas, utilizando métodos de sobreamostragem e classificação hierárquica para lidar com o desbalanceamento das classes. Também é investigado se o uso de deep learning com dados matriciais pode superar os classificadores tradicionais Random Forest e XGBoost. Os dados foram fornecidos pela Efí S.A. e incluem 45.209 contas organizadas de forma hierárquica. As contas são categorizadas em primeiro nível como Fraude ou Não Fraude, e no segundo nível, as não fraudes são divididas em quatro classes (A, B, C e D), enquanto as fraudes são divididas em duas (E e F). O problema foi abordado como classificação binária e multiclasse. A análise abrangente revelou que o uso dos métodos de sobreamostragem SMOTE e Borderline SMOTE melhorou as métricas de Sensibilidade e F-score para as classes fraudulentas nos classificadores tradicionais, na classificação binária e na multiclasse. A abordagem hierárquica destacou-se nas métricas de Precisão e F-score para as classes E e F, enquanto a abordagem plana apresentou o melhor desempenho em Sensibilidade para essas classes. O uso de deep learning com dados matriciais superou os classificadores tradicionais apenas na métrica de Sensibilidade na classificação binária.pt_BR
dc.description.abstractenIn recent years, there has been an increase in the provision of financial services through applications and internet banking, but this has also led to a rise in fraudulent digital accounts. In financial fraud detection problems, it is common to encounter a significant class imbalance between non-fraudulent and fraudulent samples, making their identification challenging. Thus, this work addresses the detection of these accounts by using oversampling methods and hierarchical classification to deal with class imbalance. It also investigates whether the use of deep learning with matrix data can outperform the traditional classifiers Random Forest and XGBoost. The data was provided by Ef ́ı S.A. and includes 45,209 hierarchically organized accounts. The accounts are categorized at the first level as Fraud or Non-Fraud, and at the second level, the non-fraud accounts are further divided into four classes (A, B, C, and D), while the fraud accounts are divided into two classes (E and F). The problem was approached as binary and multiclass classification. The comprehensive analysis revealed that the use of oversampling methods SMOTE and Borderline SMOTE improved the Sensitivity and F-score metrics for the fraudulent classes in the traditional classifiers, in both binary and multiclass classification. The hierarchical approach stood out in the Precision and F-score metrics for classes E and F, while the flat approach showed the best performance in Sensitivity for these classes. The use of deep learning with matrix data outperformed the traditional classifiers only in the Sensitivity metric in binary classification.pt_BR
dc.identifier.citationSOUZA, Andressa Oliveira. Detecção de fraudes financeiras em contas digitais: explorando abordagens hierárquicas e técnicas de aprendizado profundo. 2023. 125 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2023.pt_BR
dc.identifier.urihttp://www.repositorio.ufop.br/jspui/handle/123456789/17482
dc.language.isopt_BRpt_BR
dc.rightsabertopt_BR
dc.rights.licenseAutorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 15/09/2023 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho, desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.pt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectFraudept_BR
dc.subjectRedes neuraispt_BR
dc.subjectClassificação hierárquicapt_BR
dc.titleDetecção de fraudes financeiras em contas digitais : explorando abordagens hierárquicas e técnicas de aprendizado profundo.pt_BR
dc.typeDissertacaopt_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
DISSERTAÇÃO_DetecçãoFraudesFinanceiras.pdf
Tamanho:
6.3 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: