Please use this identifier to cite or link to this item: http://www.repositorio.ufop.br/handle/123456789/7360
Title: Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados.
Authors: Stiilpen Júnior, Milton
metadata.dc.contributor.advisor: Merschmann, Luiz Henrique de Campos
Keywords: Mineração de dados - computação
Redes sociais on-line
Processamento da linguagem natural - computação
Issue Date: 2016
metadata.dc.contributor.referee: Merschmann, Luiz Henrique de Campos
Ferreira, Anderson Almeida
Souza, Fabrício Benevenuto de
Citation: STIILPEN JÚNIOR, Milton. Um arcabouço de processamento de textos informais em português brasileiro para aplicações de mineração de dados. 2016. 41f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2016.
Abstract: Redes Sociais online (RSO) surgiram no início do século XXI e dão indícios de que terão vida longa. Cerca de 64% dos usuários de mídias sociais dizem acessar ao menos uma rede social todos os dias. Desse modo, é imensa a quantidade de dados gerados por esses canais de comunicação. O Processamento de Linguagem Natural em textos de redes sociais é um tema de pesquisa recente que vem atraindo um número cada vez maior de pesquisadores. Portanto, neste trabalho, é proposta um arcabouço capaz de lidar com a diversidade do português brasileiro, com o informalismo, com a natureza de tempo real e com a falta de contextualização de textos publicados em redes sociais. O arcabouço proposto foi avaliado em duas tarefas (Categorização de Texto e Mineração de Opinião) e os resultados experimentais mostraram que os mecanismos de pré-processamento existentes no arcabouço foram importantes para obtenção de bons resultados.
metadata.dc.description.abstracten: Social Networks emerged at the beginning of 21st century and give us evidence that they are going to have a long life. Almost two-thirds of overall social media users affirm an everyday usage of a social media website and, therefore, the data volume across this platforms is huge. Natural language processing of social media texts is an attractive topic among researchers of this area. While there are many studies about natural language processing of social media texts for some languages (e.g., English), the researches for Brazilian Portuguese language are still limited. Then, in this work, a framework is proposed to deal with peculiarities of the Brazilian Portuguese language in informal, short and noisy texts, where the lack of context poses obstacles in text mining. The proposed framework has been evaluated in two tasks (Text Categorization and Opinion Mining) and experiments showed that the preprocessing mechanisms included in this framework were important to achieve better results.
Description: Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
URI: http://www.repositorio.ufop.br/handle/123456789/7360
metadata.dc.rights.license: Autorização concedida ao Repositório Institucional da UFOP pelo autor(a), 09/03/2017, com as seguintes condições: disponível sob Licença Creative Commons 4.0, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Appears in Collections:PPGCC - Mestrado (Dissertações)

Files in This Item:
File Description SizeFormat 
DISSERTAÇÃO_ArcabouçoProcessamentoTextos.pdf3,38 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.