Please use this identifier to cite or link to this item: http://www.repositorio.ufop.br/handle/123456789/3024
Title: Detecção de outliers multivariados em redes de sensores.
Authors: Valadares, Fabricio Geraldo
metadata.dc.contributor.advisor: Pereira Junior, Álvaro Rodrigues
Keywords: Redes de sensores sem fio
Valores estranhos - estatística
Análise multivariada
Simulação - computadores
Issue Date: 2012
Publisher: Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
Citation: VALADARES, F. G. Detecção de outliers multivariados em redes de sensores. 2012. 53 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal de Ouro Preto, Ouro Preto, 2012.
Abstract: Esse trabalho apresenta uma análise, via detecção de outliers, sobre os dados multivariados proveniente de uma rede de sensores. Inicialmente, caracterizamos o problema de detecção de outliers nestas redes. Em seguida, realizamos, via simulação, uma comparação entre três métodos gerais para a identificação dos outliers, Minimum Volume Ellipsoid (MVE), Minimum Covariance Determinant (MCD) e Max-Eigen Difference (MED), considerando cenários específicos de uma rede de sensores. Os dados utilizados na simulação foram gerados a partir de uma base de dados reais proveniente da medição de poluentes no ar. Essa geração nos permitiu representar o cenário de uma rede de sensores. O fenômeno avaliado segue um comportamento Normal, e utilizamos outras duas distribuições, Skew-Normal e T-Student, para representar a imprecisão inerente do processo de sensoriamento, que nem sempre consegue representar satisfatoriamente o ambiente monitorado. Adicionalmente, representamos a presença de ruídos nos dados (outliers pontuais), inseridos com base em uma distribuição de Bernoulli. Essa distribuição foi utilizada para selecionar quais amostras seriam substituídas por ruídos. A avaliação da representatividade dos dados após a remoção dos outliers é realizada por intermédio de um ferramental estatístico formado pelos seguintes testes, valor absoluto do erro relativo, ANOVA, medidas de tendência central e a contagem de outliers. Todas as simulações foram realizadas no software estatístico R. Os resultados das avaliações demonstraram que os erros encontrados podem ser tolerados por grande parte das aplicações em redes de sensores, quando aplicados os métodos MVE e MCD. O método MED não conseguiu identificar todos os outliers, logo, sua aplicação não traz benefícios às aplicações consideradas.
metadata.dc.description.abstracten: This work presents an analysis based on outliers detection on multivariate dataset of sensor networks. Initially, we characterize the outliers detection problem in these networks. Then, three general methods for outliers detection methods Minimum Volume Ellipsoid (MVE), Minimum Covariance Determinant (MCD) and Max-Eigen Difference (MED) were used and evalueted. The dataset used in the simulation was generated from an air pollutants dataset. This generation allowed the use of this dataset in sensor networks scenarios. The phenomenon has characterized by a Normal distribution. To represent the sensor perception fails, two different distributions was used, the Skew-Normal and T-Student. In addition, the sensor noise was inserted by using a Bernoulli process. The data representativeness, after the outlier removal, was performed by statistical tools: the absolute relative error, ANOVA, measures of central tendency and the number of outliers. The simulations were performed by software R. The results showed that the MVE and MCD can be used satisfatory in general sensor networks applications. The MED does not remove all outliers, so, its usage is not recommended in these applications
URI: http://www.repositorio.ufop.br/handle/123456789/3024
Appears in Collections:PPGCC - Mestrado (Dissertações)

Files in This Item:
File Description SizeFormat 
DISSERTAÇÃO_DetecçãoOutliersMultivariados.PDF1,86 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.