Skip navigation
Universidade Federal da Bahia |
Repositório Institucional da UFBA
Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/43945
Tipo: Dissertação
Título: Detecção de outliers em dados de alta dimensionalidade em processos químicos
Título(s) alternativo(s): Outlier detection in high-dimensional data in chemical processes
Autor(es): Souza, Lucas Silva
Primeiro Orientador: Sant'Anna, Ângelo Márcio Oliveira
metadata.dc.contributor.advisor-co1: Carmona, Luis Alberto Pargas
metadata.dc.contributor.referee1: Sant'Anna, Ângelo Márcio Oliveira
metadata.dc.contributor.referee2: Carmona, Luis Alberto Pargas
metadata.dc.contributor.referee3: Filho, Danilo Marcondes
metadata.dc.contributor.referee4: Peruchi, Rogério Santana
Resumo: Os processos petroquímicos caracterizam-se por sua elevada complexidade operacional devido ao monitoramento simultâneo de múltiplas variáveis de processo com o objetivo de garantir alta confiabilidade, estabilidade e resposta rápida a desvios. Nesse contexto, a identificação precoce de outliers é fundamental para reduzir impactos operacionais e financeiros. Este trabalho propõe um método baseado em métodos clássicos para identificação de observações divergentes em grupos amostrais, utilizando Principal Component Analysis (PCA) e Biplots, para detecção de outliers em dados multivariados de processos petroquímicos. A abordagem busca suprir lacunas na literatura, oferecendo uma solução aplicável a diferentes níveis hierárquicos, inclusive equipes sem conhecimento estatístico avançado, através do uso da distância Euclidiana no primeiro plano de um GH-Biplot, que aproxima a distância de Mahalanobis, oferecendo uma representação mais adequada para variáveis correlacionadas, não dependendo de suposições distributivas, logo é robusto e aplicável a diferentes cenários, desde que exista uma referência clara de comportamento em controle do processo. O método oferece uma abordagem visual para a detecção de outliers e identificação de padrões emergentes em dados de alta dimensionalidade. O método foi avaliado frente a três conjunto de dados reais, sendo o primeiro deles um estudo caso proposto e os outros dois conjunto de dados foram largamente utilizados na literatura e tem acesso público, ambos contêm outliers explicitamente rotulados. Os resultados indicaram que a proposta foi eficaz na detecção de outliers com eficácia superior a 70% nos três conjuntos de dados avaliados.
Abstract: Chemical processes are characterized by high operational complexity, simultaneous monitoring of multiple process variables, as well as require high levels of reliability, stability, and rapid response to deviations. In this context, the early identification of outliers is essential to mitigate operational and financial impacts. This study proposes a method grounded in classical approaches for identifying out of control observations in sample groups, employing Principal Component Analysis (PCA) and Biplots to detect outliers in multivariate data from real petrochemical process. The proposed approach aims to address gaps in the existing literature by offering a solution applicable across different organizational hierarchies, including teams without advanced statistical expertise. The method relies on the Euclidean distance in the first plane of a GH-Biplot, which approximates the Mahalanobis distance, thereby providing a more suitable representation for correlated variables. Moreover, the methodology does not depend on distributional assumptions, making it robust and applicable to a wide range of scenarios. However, it required a clear reference of in control process behavior to allow develpoment. The visual nature of the approach further facilitates the detection of outliers and the identification of emerging patterns in high-dimensional data. The proposed method was evaluated using three real-world datasets. The first corresponds to the case study introduced in this work, while the other two are publicly available datasets, which are widely used in the literature, both containing explicitly labeled outliers. The results indicate that the proposed approach was effective in detecting outliers, achieving an accuracy greater than 70% across all three datasets evaluated.
Palavras-chave: Biplots
Controle de processo multivariado
Processo petroquímico
CNPq: CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO::GERENCIA DE PRODUCAO::GARANTIA DE CONTROLE DE QUALIDADE
CNPQ::ENGENHARIAS::ENGENHARIA QUIMICA::PROCESSOS INDUSTRIAIS DE ENGENHARIA QUIMICA
Idioma: por
País: Brasil
Editora / Evento / Instituição: Universidade Federal da Bahia
Sigla da Instituição: UFBA
metadata.dc.publisher.department: Escola Politécnica
metadata.dc.publisher.program: Programa de Pós-Graduação em Engenharia Industrial (PEI) 
Citação: SOUZA, Lucas Silva. Detecção de outliers em dados de alta dimensionalidade em processos químicos. 2025. 82 f. Dissertação (Mestrado) - Curso de Engenharia Industrial, Universidade Federal da Bahia, Salvador, 2026.
Tipo de Acesso: Acesso Aberto
URI: https://repositorio.ufba.br/handle/ri/43945
Data do documento: 16-Dez-2025
Aparece nas coleções:Dissertação de Mestrado Profissional (PEI)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertação_LucasSouza_2025.2(rev260126)_final.pdf5,98 MBAdobe PDFVisualizar/Abrir
Mostrar registro completo do item Visualizar estatísticas


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.