Contributions to automating the analysis of conventional Pap smears.

dc.contributor.advisorSouza, Marcone Jamilson Freitaspt_BR
dc.contributor.advisorBianchi, Andrea Gomes Campospt_BR
dc.contributor.authorDiniz, Débora Nasser
dc.contributor.refereeSouza, Marcone Jamilson Freitaspt_BR
dc.contributor.refereeBianchi, Andrea Gomes Campospt_BR
dc.contributor.refereeCarneiro, Cláudia Martinspt_BR
dc.contributor.refereeLuz, Eduardo José da Silvapt_BR
dc.contributor.refereePessin, Gustavopt_BR
dc.contributor.refereeSouza, Jefferson Rodrigo dept_BR
dc.contributor.refereeVeras, Rodrigo de Melo Souzapt_BR
dc.date.accessioned2024-02-07T21:06:47Z
dc.date.available2024-02-07T21:06:47Z
dc.date.issued2023pt_BR
dc.descriptionPrograma de Pós-Graduação em Ciência da Computação. Departamento de Ciência da Computação, Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto.pt_BR
dc.description.abstractThis thesis, organized as a compilation of articles, develops and presents contri- butions to the automated analysis of conventional Pap smear slides. A conventional Pap smear slide is a sample of cervical cells collected and prepared on a glass slide for subsequent cytopathological analysis. The main contributions are to detect and classify cervical cell nuclei to develop a decision support tool for cytopathologists. The first arti- cle resulting from this research utilizes a hierarchical methodology using Random Forest for the nucleus classification of the Herlev and Center for Recognition and Inspection of Cells (CRIC) Searchable Image Database databases based on 232 handcrafted fea- tures. In this article, we investigate balancing techniques, perform statistical analyses using Shapiro-Wilk and Kruskal-Wallis tests, and introduce the CRIC Searchable Image Database segmentation base. Our result defined the state-of-the-art in five metrics for nucleus classification in five and seven classes and the state-of-the-art in precision and F1-score for two-class classification. The second article introduces a method for nu- cleus detection in synthetic Pap smear images from the Overlapping Cervical Cytology Image Segmentation Challenge dataset proposed at the 11th International Symposium on Biomedical Imaging (ISBI’14). In this second article, we investigate clustering al- gorithms for image segmentation. We also explore four traditional machine learning techniques (Decision Tree (DT), Nearest Centroid (NC), k-Nearest Neighbors (k-NN), and Multi-layer Perceptron (MLP)) for classification and propose an ensemble method using DT, NC, and k-NN. Our result defined the state-of-the-art recall using this dataset. The third article proposes an ensemble method using EfficientNets B1, B2, and B6 to classify images from the CRIC Searchable Image Database dataset. Here, we investigate ten neural network architectures to choose those used in the ensemble method and present a data augmentation methodology using image transformation techniques. Our result de- fined the five state-of-the-art metrics for nucleus classification in two and three classes. Furthermore, we introduce results for six-class classification. Lastly, the fourth article introduces the Cytopathologist Eye Assistant (CEA), an intuitive and user-friendly tool that uses deep learning to detect and classify cervical cells in Pap smear images, support- ing cytopathologists in providing diagnoses. We investigate You Only Look Once (YOLO) v5 and YOLOR for performing both tasks (detection and classification) and also explore the combination of using YOLOv5 for detection and the ensemble of EfficientNets from the third article for classification. The article explores data balancing techniques, under- sampling, and oversampling using Python’s Clodsa library. The CRIC Cervix database was used for tool evaluation, considering four scenarios: original images, resized im- ages, augmented resized images, and balanced resized images. The application of CEA was validated by specialists with years of experience in cytopathology, highlighting the tool’s ease of use and potential to address specific queries.pt_BR
dc.description.abstractenEsta tese, organizada no formato de coletânea de artigos, desenvolve e apresenta contribuições para a análise automática de lâminas convencionais do exame de Papani- colaou. Uma lâmina convencional do exame de Papanicolaou é uma amostra de células cervicais coletada e preparada em uma lâmina de vidro para posterior análise citopa- tológica. As principais contribuições estão relacionadas à detecção e classificação dos núcleos das células cervicais, com o objetivo de desenvolver uma ferramenta de suporte à decisão para citopatologistas. O primeiro artigo originado através desta pesquisa utiliza uma metodologia hierárquica utilizando Random Forest para a classificação de núcleos das bases de dados Herlev e Center for Recognition and Inspection of Cells (CRIC) Searchable Image Database utilizando 232 handcrafted features. Neste artigo investig- amos técnicas de balanceamento, performamos análises estatísticas utilizando Shapiro- Wilk e Kruskal-Wallis e introduzimos a base de segmentação do CRIC Searchable Image Database. Nosso resultado foi o estado da arte em cinco métricas para a classificação dos núcleos em cinco e sete classes, além de ter sido o estado da arte em termos de precisão e F1-score para a classificação em duas classes. O segundo artigo introduz um método para detecção de núcleos em imagens sintéticas do exame de Papanicolaou da base do Overlapping Cervical Cytology Image Segmentation Challenge proposta no 11th International Symposium on Biomedical Imaging (ISBI’14). Neste segundo artigo investigamos algoritmos de clusterização para segmentar a imagem. Também investiga- mentos quatro técnicas tradicionais de aprendizado de máquina (Decision Tree (DT), Nearest Centroid (NC), k-Nearest Neighbors (k-NN) e Multi-layer Perceptron (MLP)) para realizar a classificação e propusemos um método ensemble utilizando DT, NC e k-NN. Nosso resultado é o estado da arte em termos de revocação utilizando a base de dados. O terceiro artigo propõe um método ensemble utilizando EfficientNets B1, B2 e B6 para classificar imagens da base de classificação do CRIC Searchable Image Database. Nele, investigamos 10 arquiteturas de redes neurais para escolher quais seriam utilizadas no método ensemble e também apresentamos uma metodologia para aumento de dados utilizando técnicas de transformações nas imagens. Nosso resultado foi o estado da arte em cinco métricas para a classificação dos núcleos em duas e três classes. Além disso, introduzimos os resultados para a classificação em seis classes. Por fim, o quarto artigo apresenta o Cytopathologist Eye Assistant (CEA), uma ferramenta intuitiva e fácil de usar que emprega deep learning para detectar e classificar células cervicais das imagens do exame de Papanicolaou, suportando os citopatologistas a dar o diagnóstico. Investig- amos a You Only Look Once (YOLO) v5 e a YOLOR realizar ambas tarefas (detecção e classificação) e também investigamos a combinação de utilizar a YOLOv5 para detecção e o ensemble de EfficientNets do terceiro artigo para a classificação. O artigo explora as técnicas de balanceamento de dados undersampling e oversampling utilizando a bib- lioteca Clodsa do Python. A base de dados CRIC Cervix foi utilizada para avaliação da ferramenta, considerando quatro cenários: imagens originais, imagens redimensionadas, imagens redimensionadas aumentadas e imagens redimensionadas balanceadas. A apli- cação do CEA foi validada por especialistas com anos de experiência em citopatologia e eles destacaram a facilidade de uso da ferramenta e seu potencial para responder a consultas específicas.pt_BR
dc.identifier.citationDINIZ, Débora Nasser. Contributions to automating the analysis of conventional Pap smears. 2023. 106 f. Tese (Doutorado em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2023.pt_BR
dc.identifier.urihttp://www.repositorio.ufop.br/jspui/handle/123456789/18071
dc.language.isopt_BRpt_BR
dc.rightsabertopt_BR
dc.rights.licenseAutorização concedida ao Repositório Institucional da UFOP pelo(a) autor(a) em 06/02/2024 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho, desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.pt_BR
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectInteligência computacionalpt_BR
dc.subjectCâncerpt_BR
dc.subjectDor cervicalpt_BR
dc.subjectTeste de Papanicolaoupt_BR
dc.subjectMáquinas - aprendizagempt_BR
dc.titleContributions to automating the analysis of conventional Pap smears.pt_BR
dc.typeTesept_BR
Arquivos
Pacote Original
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
TESE_ContributionsAutomatingAnalysis.pdf
Tamanho:
43.77 MB
Formato:
Adobe Portable Document Format
Descrição:
Licença do Pacote
Agora exibindo 1 - 1 de 1
Nenhuma Miniatura disponível
Nome:
license.txt
Tamanho:
1.71 KB
Formato:
Item-specific license agreed upon to submission
Descrição: