https://repositorio.ufba.br/handle/ri/43945| Tipo: | Dissertação |
| Título: | Detecção de outliers em dados de alta dimensionalidade em processos químicos |
| Título(s) alternativo(s): | Outlier detection in high-dimensional data in chemical processes |
| Autor(es): | Souza, Lucas Silva |
| Primeiro Orientador: | Sant'Anna, Ângelo Márcio Oliveira |
| metadata.dc.contributor.advisor-co1: | Carmona, Luis Alberto Pargas |
| metadata.dc.contributor.referee1: | Sant'Anna, Ângelo Márcio Oliveira |
| metadata.dc.contributor.referee2: | Carmona, Luis Alberto Pargas |
| metadata.dc.contributor.referee3: | Filho, Danilo Marcondes |
| metadata.dc.contributor.referee4: | Peruchi, Rogério Santana |
| Resumo: | Os processos petroquímicos caracterizam-se por sua elevada complexidade operacional devido ao monitoramento simultâneo de múltiplas variáveis de processo com o objetivo de garantir alta confiabilidade, estabilidade e resposta rápida a desvios. Nesse contexto, a identificação precoce de outliers é fundamental para reduzir impactos operacionais e financeiros. Este trabalho propõe um método baseado em métodos clássicos para identificação de observações divergentes em grupos amostrais, utilizando Principal Component Analysis (PCA) e Biplots, para detecção de outliers em dados multivariados de processos petroquímicos. A abordagem busca suprir lacunas na literatura, oferecendo uma solução aplicável a diferentes níveis hierárquicos, inclusive equipes sem conhecimento estatístico avançado, através do uso da distância Euclidiana no primeiro plano de um GH-Biplot, que aproxima a distância de Mahalanobis, oferecendo uma representação mais adequada para variáveis correlacionadas, não dependendo de suposições distributivas, logo é robusto e aplicável a diferentes cenários, desde que exista uma referência clara de comportamento em controle do processo. O método oferece uma abordagem visual para a detecção de outliers e identificação de padrões emergentes em dados de alta dimensionalidade. O método foi avaliado frente a três conjunto de dados reais, sendo o primeiro deles um estudo caso proposto e os outros dois conjunto de dados foram largamente utilizados na literatura e tem acesso público, ambos contêm outliers explicitamente rotulados. Os resultados indicaram que a proposta foi eficaz na detecção de outliers com eficácia superior a 70% nos três conjuntos de dados avaliados. |
| Abstract: | Chemical processes are characterized by high operational complexity, simultaneous monitoring of multiple process variables, as well as require high levels of reliability, stability, and rapid response to deviations. In this context, the early identification of outliers is essential to mitigate operational and financial impacts. This study proposes a method grounded in classical approaches for identifying out of control observations in sample groups, employing Principal Component Analysis (PCA) and Biplots to detect outliers in multivariate data from real petrochemical process. The proposed approach aims to address gaps in the existing literature by offering a solution applicable across different organizational hierarchies, including teams without advanced statistical expertise. The method relies on the Euclidean distance in the first plane of a GH-Biplot, which approximates the Mahalanobis distance, thereby providing a more suitable representation for correlated variables. Moreover, the methodology does not depend on distributional assumptions, making it robust and applicable to a wide range of scenarios. However, it required a clear reference of in control process behavior to allow develpoment. The visual nature of the approach further facilitates the detection of outliers and the identification of emerging patterns in high-dimensional data. The proposed method was evaluated using three real-world datasets. The first corresponds to the case study introduced in this work, while the other two are publicly available datasets, which are widely used in the literature, both containing explicitly labeled outliers. The results indicate that the proposed approach was effective in detecting outliers, achieving an accuracy greater than 70% across all three datasets evaluated. |
| Palavras-chave: | Biplots Controle de processo multivariado Processo petroquímico |
| CNPq: | CNPQ::ENGENHARIAS::ENGENHARIA DE PRODUCAO::GERENCIA DE PRODUCAO::GARANTIA DE CONTROLE DE QUALIDADE CNPQ::ENGENHARIAS::ENGENHARIA QUIMICA::PROCESSOS INDUSTRIAIS DE ENGENHARIA QUIMICA |
| Idioma: | por |
| País: | Brasil |
| Editora / Evento / Instituição: | Universidade Federal da Bahia |
| Sigla da Instituição: | UFBA |
| metadata.dc.publisher.department: | Escola Politécnica |
| metadata.dc.publisher.program: | Programa de Pós-Graduação em Engenharia Industrial (PEI) |
| Citação: | SOUZA, Lucas Silva. Detecção de outliers em dados de alta dimensionalidade em processos químicos. 2025. 82 f. Dissertação (Mestrado) - Curso de Engenharia Industrial, Universidade Federal da Bahia, Salvador, 2026. |
| Tipo de Acesso: | Acesso Aberto |
| URI: | https://repositorio.ufba.br/handle/ri/43945 |
| Data do documento: | 16-Dez-2025 |
| Aparece nas coleções: | Dissertação de Mestrado Profissional (PEI) |
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Dissertação_LucasSouza_2025.2(rev260126)_final.pdf | 5,98 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.