Please use this identifier to cite or link to this item: http://www.repositorio.ufop.br/handle/123456789/6538
Title: Discretizador heurístico para o contexto de classificação hierárquica.
Authors: Galvão, Leandro Ribeiro
metadata.dc.contributor.advisor: Merschmann, Luiz Henrique de Campos
Keywords: Distribuição - probabilidades
Classificação - computadores
Programação heurística
Issue Date: 2016
metadata.dc.contributor.referee: Silla Júnior, Carlos Nascimento
Pappa, Gisele Lobo
Ferreira, Almeida Ferreira
Citation: GALVÂO, Leandro Ribeiro. Discretizador heurístico para o contexto de classificação hierárquica. 54f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016.
Abstract: Diferentes tipos de problemas de classificação podem ser encontrados na literatura, cada qual possuindo seu nível de complexidade. Diversos algoritmos de aprendizado de máquina requerem atributos discretos e nesses casos o pré-processamento da base de dados né necessário. Na literatura, os trabalhos apresentam diversos métodos de discretização, porém até o momento, não há nenhum método de discretização supervisionado projetado para ser utilizada em conjunto com classificadores hierárquicos globais. Neste trabalho é proposto um método supervisionado de discretização capaz de lidar com bases do contexto de classificação hierárquica. Esse método corresponde a uma heurística, denominada Agglomerative Discretization Heuristic for Hierarchical Classification - ADH2C, que foi projetada para ser utilizada em conjunto com classificadores hierárquicos globais. A avaliação da qualidade da discretização realizada pela heurística ADH2C foi feita a partir de experimentos comparativos com métodos de discretização não-supervisionados Equal-Width (EW) e Equal-Frequency (EF). A qualidade da discretização foi medida por meio do desempenho preditivo pelo classificador hierárquico Global Model Naive Bayes (GMNB) utilizando-se 9 bases de dados de bioinformática pré-processadas pelos métodos de discretização EW, EF e ADH2C. Os experimentos realizados neste trabalho mostraram que para a maioria das bases de dados utilizadas, o classificador GMNB alcançou o melhor desempenho preditivo (hF) quando utilizou as bases de dados pré-processadas pela heurística ADH2C. A melhora no desempenho preditivo do GMNB, utilizando as bases de dados pré-processadas pela heurística ADH2C, evidencia sua aplicabilidade no contexto de classificação hierárquica monorrótulo. _____________________________________________________________________________________
ABSTRACT: Several classification tasks in different application domains can be seen as hierarchical classification problems. Many machine learning algorithms require discrete data. Then, it is mandatory the use of a discretization method. In order to be used together with global hierarchical methods, the use of the existing supervised flat discretization methods is not appropriate. For this reason, there has been used unsupervised discretization methods which ignores the class attribute. In this work, we propose a supervised discretization method for hierarchical classification scenario. The proposed heuristic, known as Agglomerative Discretization Heuristic for Hierarchical Classification - ADH2C, is able to deal with hierarchical class structure and can be used with global hierarchical classifiers. Experimental evaluation is performed through the preprocessing of 9 bioinformatics datasets. The hierarchical classification method Global Model Naive Bayes - GMNB, was adopted to measure the quality of the discretization. As far as we known, there is no supervised discretization method able to be used with hierarchical classification methods. Due to it, as baseline methods for experimental comparison, we adopted the unsupervised methods Equal-Frequency and Equal-Width. Analyses of the experimental results showed that, for most of datasets, the GMNB classifier achieved higher predictive performance when they were preprocessed using ADH2C method. The proposed supervised discretization method has shown good performance in the hierarchical classification scenario and, therefore, can be used together with global hierarchical classification methods.
Description: Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
URI: http://www.repositorio.ufop.br/handle/123456789/6538
metadata.dc.rights.license: Autorização concedida ao Repositório Institucional da UFOP pelo autor, 13/06/2016, com as seguintes condições: disponível sob Licença Creative Commons 4.0, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Appears in Collections:PPGCC - Mestrado (Dissertações)

Files in This Item:
File Description SizeFormat 
DISSERTAÇÃO_DiscretizadorHeurísticoContexto.pdf10,02 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons