Please use this identifier to cite or link to this item: http://www.repositorio.ufop.br/handle/123456789/9352
Title: Extração e análise de características da linguagem para identificação de evidências da patologia dislexia.
Authors: Ribeiro, Fernanda Maria
metadata.dc.contributor.advisor: Bianchi, Andrea Gomes Campos
Pereira Junior, Álvaro Rodrigues
Keywords: Processamento de sinais
Issue Date: 2018
metadata.dc.contributor.referee: Bianchi, Andrea Gomes Campos
Pereira Junior, Álvaro Rodrigues
Ferreira, Anderson Almeida
Barbosa, Adriano Vilela
Alves, Luciana Mendonça
Citation: RIBEIRO, Fernanda Maria. Extração e análise de características da linguagem para identificação de evidências da patologia dislexia. 2018. 87 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2018.
Abstract: As patologias da linguagem são alterações na leitura de um texto, ocasionadas por traumatismos físicos ou genéticos. Devido a falta de ferramentas específicas e ao alto custo de uso do software proprietário, de tecnologias de processamento de sinais de áudio para ajudar no processo de identificação de patologias genéticas, muitas pessoas ficam sem tratamento, e, às vezes, à margem da sociedade. Foi desenvolvido uma metodologia por especialistas, que extrai características da leitura de um texto em voz alta e retorna a hipótese de diagnóstico. Neste trabalho, descreve-se uma nova abordagem computacional com o intuito de automatizar de forma eficiente a indicação de probabilidade da dislexia. A análise é feita em gravações (sinais de áudio) da leitura de textos pré-definidos com crianças em idade escolar. São extraídas características diretas e indiretas do sinal de áudio. As diretas são extraídas por meio da metodologia de separação de pausas e sílabas, enquanto as características indiretas são extraídas através da metodologia de alinhamento de sinais de áudio, Hidden Markov Model e pelo desenvolvimento de algumas heurísticas de melhoria. Após a obtenção das características realiza-se a indicação da probabilidade da dislexia por meio de duas metodologias de classificação, a primeira análoga a de especialistas humanos, baseada em pesos; e a segunda por meio de dois classificadores conhecidos na literatura, KNN e SVM. Os testes foram realizados sobre uma base de dados de 40 áudios, 30 sem dislexia e 10 com dislexia, contendo a gravação da leitura de um texto padrão por crianças, sendo comparados a classificação realizada pelo especialista, do texto completo, obtendo 100% de acurácia sobre a indicação de probabilidade de dislexia, sobre os três métodos. A diferença entre os valores das características obtidas automaticamente e os valores de teste foi abaixo de 20% para a maioria das características. Finalmente, os resultados apresentados nesta dissertação mostram que existe um campo de atuação muito promissor do processamento de sinais de áudio, no que diz respeito ao auxílio a especialistas na tomada de decisão relacionadas a patologias da linguagem.
metadata.dc.description.abstracten: The pathologies of language are alterations in the reading of a text, caused by physical or genetic traumas. Due to the lack of specific tools and high cost of using proprietary software, audio signal processing technologies to aid in the process of identifying genetic pathologies, many people go untreated, and sometimes out of society. A methodology was developed by specialists, which extracts characteristics from reading a text aloud and returns the diagnosis hypothesis. In this work, a new computational approach is described in order to efficiently automate the indication of the probability of dyslexia. Direct and indirect characteristics of the audio signal are extracted. The direct ones are extracted by means of the pauses and syllables separation methodology, while the indirect characteristics are extracted through the audio signal alignment methodology, Hidden Markov Model and the development of some improvement heuristics. After obtaining the characteristics the risk of dyslexia is indicated by means of two classification methodologies, the first one analogous to human specialists, based on weights; And the second by means of two classifiers known in the literature, KNN and SVM. The tests were performed on a database of 40 audios, 30 without dyslexia and 10 with dyslexia, containing the recording of the reading of a default text by children, being compared the classification performed by the specialist, of the complete text, obtaining 100% Of accuracy on the indication of probability of dyslexia, on the three methods. The difference between the values of the automatically obtained characteristics and the test values was small for most features, below 20% average difference. Finally, the results presented in this dissertation show that there is a very promising field of action for the processing of audio signals, with respect to the aid to specialists in decision making related to language pathologies.
Description: Programa de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.
URI: http://www.repositorio.ufop.br/handle/123456789/9352
metadata.dc.rights.license: Autorização concedida ao Repositório Institucional da UFOP pelo autor, 19/01/2018, com as seguintes condições: disponível sob Licença Creative Commons 4.0, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.
Appears in Collections:PPGCC - Mestrado (Dissertações)

Files in This Item:
File Description SizeFormat 
DISSERTACAO_ExtraçãoAnáliseCaracterísticas.pdf1,56 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons