Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/36100
Registro completo de metadados
Campo DCValorIdioma
dc.creatorOliveira, Marcos Ricardo Santos-
dc.date.accessioned2022-10-04T14:57:47Z-
dc.date.available2022-10-04T14:57:47Z-
dc.date.issued2022-07-06-
dc.identifier.citationOLIVEIRA, Marcos Ricardo Santos. PSGF (Phase Space Gap Filling): um novo método para substituição de valores ausentes em séries temporais caóticas. 2022. 83 f. Dissertação (Mestrado em Ciências da Computação) Instituto de Computação, Universidade Federal da Bahia, Salvador, Ba, 2022.pt_BR
dc.identifier.urihttps://repositorio.ufba.br/handle/ri/36100-
dc.description.abstractThe preprocessing step performed to deal with missing or invalid information in datasets is a relevant task in Machine Learning (ML) applications to avoid producing wrong models and make feasible the usage of specific algorithms that do not work in such a condition. In general, missing values occours for different reasons as, for instance, problems in the device used to monitor a system, network issues between monitoring and storage services, and the authentic absence of data. By collecting data in an i.i.d (independent and identically distributed) manner, traditional ML models are able to replace missing values. However, when there are temporal dependencies between collected observations, e.g., time series, such models are unsuitable for not considering the existing relationship in time instants. The treatment of missing data in time series is performed by several techniques such as interpolation methods (e.g. Lagrange, Newton, and Splines) and Singular Spectrum Analysis (SSA). Experiments during this project highlighted that these methods provided poor results when the time series present a chaotic behavior once their attractors in the phase space are not taken into account. Therefore, this work presents a new method that considers Dynamical System and Chaos Theory tools to unfold series from the temporal domain into phase space, making it possible the adoption of ML models to replace missing values. Our results emphasize the importance of this new paradigm to deal with missing values, outperforming the state-of-the-art.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal da Bahiapt_BR
dc.subjectSubstituição de dados ausentespt_BR
dc.subjectSéries temporais caóticaspt_BR
dc.subjectAprendizado de máquinapt_BR
dc.subject.otherMissing value imputationpt_BR
dc.subject.otherChaotic time seriespt_BR
dc.subject.otherMachine learningpt_BR
dc.titlePSGF (phase space gap filling): um novo método para substituição de valores ausentes em séries temporais caóticaspt_BR
dc.title.alternativePSGF (phase space gap filling): a new gap filling method for chaotic time seriespt_BR
dc.typeDissertaçãopt_BR
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação (PGCOMP) pt_BR
dc.publisher.initialsUFBApt_BR
dc.publisher.countryBrasilpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRApt_BR
dc.contributor.advisor1Rios, Ricardo Araújo-
dc.contributor.advisor1ID0000-0003-1449-4745pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/0427387583450747pt_BR
dc.contributor.referee1Rios, Ricardo Araújo-
dc.contributor.referee1ID0000-0003-1449-4745pt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/0427387583450747pt_BR
dc.contributor.referee2Ishii, Renato Porfirio-
dc.contributor.referee2ID0000-0003-0825-8420pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/8992362063539452pt_BR
dc.contributor.referee3Santana, Ewaldo Eder Carvalho-
dc.contributor.referee3ID0000-0002-8894-5353pt_BR
dc.contributor.referee3Latteshttp://lattes.cnpq.br/0660692009750374pt_BR
dc.creator.Latteshttp://lattes.cnpq.br/0324710830372167pt_BR
dc.description.resumoO tratamento de informações ausentes ou inválidas em bases de dados representa um grande desafio na área de Aprendizado de Máquina (AM) que, se não for realizado da maneira adequada, pode afetar a qualidade do modelo produzido ou, até mesmo, impedir a sua utilização. Em geral, esse problema ocorre por diversas razões como, por exemplo, erro no dispositivo utilizado para coleta de informações, problemas na transmissão entre os dispositivos de coleta e de armazenamento, e a ausência real de informação no sistema monitorado. Quando os dados são coletados de maneira independente e identicamente distribuída, os próprios modelos tradicionais de AM podem ser utilizados para tratar esse problema. Entretanto, quando há dependência temporal entre as observações coletadas, e.g. quando os dados são organizados como séries temporais, tais modelos não são adequados por não considerar o relacionamento existente entre os instantes de tempo das coletas. Para o tratamento desse tipo de dado, há diversas técnicas como métodos de interpolação (e.g. Lagrange, Newton e Splines) e Singular Spectrum Analysis (SSA). Contudo, experimentos realizados durante este projeto de mestrado demonstraram que as técnicas existentes apresentam resultados insatisfatórios quando as séries temporais possuem comportamento caótico, uma vez que informações sobre seus atratores no espaço de coordenadas de atraso (espaço fase) não são levados em consideração. Neste sentido, este projeto de mestrado apresenta um novo método que utiliza ferramenta de Sistemas Dinâmicos e Teoria do Caos para desdobrar séries do domínio temporal para o espaço fase, viabilizando, assim, a aplicação de técnicas de Aprendizado de Máquina na substituição de valores ausentes. Resultados obtidos enfatizam a importância desse novo paradigma de substituição de valores ausentes, apresentando uma superioridade do método proposto com relação às técnicas conhecidas no estado da arte.pt_BR
dc.publisher.departmentInstituto de Computação - ICpt_BR
Aparece nas coleções:Dissertação (PGCOMP)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertacao - Marcos Oliveira.pdfDissertação de Marcos Oliveira3,71 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.