On deep learning features for noisy time series classification

Canário, João Paulo Pereira de Sá

Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/36105

Tipo:	Tese
Título:	On deep learning features for noisy time series classification
Título(s) alternativo(s):	Sobre recursos de aprendizagem profunda para classificação de séries temporais ruidosas
Autor(es):	Canário, João Paulo Pereira de Sá
Primeiro Orientador:	Rios, Ricardo Araújo
metadata.dc.contributor.referee1:	Rios, Ricardo Araújo
metadata.dc.contributor.referee2:	Simas Filho, Eduardo Furtado de
metadata.dc.contributor.referee3:	Albertini, Marcelo Keese
metadata.dc.contributor.referee4:	Lemes, Rubisley de Paula
metadata.dc.contributor.referee5:	Saldías, Millaray Curilem
Resumo:	A adoção de métodos da Deep Neural Network (DNN) para resolver problemas em cenários reais tem vindo a aumentar à medida que o volume de dados cresce. Embora tais métodos apresentem resultados impressionantes na aprendizagem supervisionada, sabe-se que a ocorrência de ruídos que modificam o comportamento original dos dados pode afetar as precisões do modelo e, consequentemente, o processo de generalização, que é altamente relevante nas tarefas de aprendizagem. Foram propostas várias abordagens para reduzir o impacto do ruído no modelo final, variando desde a aplicação de etapas de pré-processamento para o desenho de camadas robustas de DNN. No entanto, temos notado que tais abordagens não foram sistematicamente avaliadas para compreender como as influências sonoras têm sido propagadas ao longo das arquiteturas do DNN. Esta lacuna motivou-nos a conceber este trabalho, que se focava na modelação de dados ruidosos com dependências temporais, tipicamente referidos como séries temporais ou sinais. Em resumo, a nossa principal pretensão foi criar uma rede capaz de funcionar como um filtro de ruído e estar facilmente ligada às redes existentes. Para atingir este objetivo, definimos uma metodologia, que foi organizada em quatro fases: (i) execução de um estudo sobre a aplicação de DNNs a sinais de modelo recolhidos de um problema no mundo real; (ii) investigação de diferentes instrumentos de pré-processamento para transformar esses sinais e reduzir as influências sonoras; (iii) análises sobre o impacto do aumento/redução do ruído no modelo final; e (iv) criação de um novo DNN que pode ser incorporado nas arquiteturas DNN e funcionar como camada de filtragem de ruído para manter as performances globais. A primeira e segunda fases foram conseguidas em colaboração com investigadores da Universidad de La Frontera, que forneceram um conjunto de sinais diretamente recolhidos do vulcão Llaima no Chile. A modelação realizada em tais sinais permitiu a criação de uma nova arquitetura chamada SismyNet. Conhecendo o comportamento ou tais sinais, poderíamos criar um cenário controlado com diferentes níveis de ruído aditivo e saídas produzidas pelos nossos modelos originais, cumprindo assim a terceira fase da metodologia descrita. Em seguida, fizemos dois novos estudos para entender o impacto dos ruídos no nosso cenário. Em primeiro lugar, utilizamos testes estatísticos para confirmar a variação de erro quando o ruído é adicionado aos sinais esperados. Depois, usamos XAI (eXplainable Artificial Intelligence) para compreender visualmente a propagação do ruído nas camadas de DNN. Finalmente, conseguimos terminar a última fase e atingir o nosso objetivo primordial: o desenho de uma nova arquitetura da rede neural com a incorporação da filtragem de ruído para suprimir a fase de pré-processamento. Interpretando os resultados obtidos, entendemos que esta abordagem inovadora aprendeu melhor as características ruidosas e foi capaz de apresentar resultados estáveis para além do nível de ruído no sinal.
Abstract:	The adoption of Deep Neural Network (DNN) methods to solve problems in real-world scenarios has been increasing as the data volume grows. Although such methods present impressive results in supervised learning, it is known that the occurrence of noises modifying the original data behavior can affect the model accuracies and, consequently, the generalization process, which is highly relevant in learning tasks. Several approaches have been proposed to reduce the impact of noise on the final model, varying since the application of preprocessing steps to the design of robust DNN layers. However, we have noticed that such approaches were not systematically assessed to understand how the noise influences have been propagated throughout the DNN architectures. This gap motivated us to design this work, which was focused on modeling noisy data with temporal dependencies, typically referred to as time series or signals. In summary, our main claim was to create a network capable of acting as a noise filter and being easily connected to existing networks. To reach this goal, we have defined a methodology, which was organized into four phases: (i) execution of a study about the application of DNNs to model signals collected from a real-world problem; (ii) investigation of different preprocessing tools to transform such signals and reduce noise influences; (iii) analysis about the impact of increasing/reducing the noise on the final model; and (iv) creation of a new DNN that can be embedded into DNN architectures and act as noise filtering layer to keep the overall performances. The first and second phases were achieved in collaboration with researchers from the Universidad de La Frontera, which provided a set of signals directly collected from the Llaima volcano in Chile. The modeling performed on such signals allowed the creation of a new architecture called SeismicNet. By knowing the behavior or such signals, we could create a controlled scenario with different additive noise levels and outputs produced by our original models, thus meeting the third phase of the described methodology. Next, we performed two new studies to understand the impact of noises in our scenario. Firstly, we used statistical tests to confirm the error variation when noise is added to the expected signals. Then, we used XAI (eXplainable Artificial Intelligence) to visually comprehend the noise propagation into the DNN layers. Finally, we were able to finish up the last phase and accomplish our primary goal: the design of new neural network architecture with embedding noise filtering to suppress the preprocessing phase. Interpreting the obtained results, we understand that this novel approach learned the noisy features better and was capable of delivering stable results apart from the noise level on the signal.
Palavras-chave:	Computação Redes Neurais Análises de Series Temporais
CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Idioma:	eng
País:	Brasil
Editora / Evento / Instituição:	Universidade Federal da Bahia
Sigla da Instituição:	UFBA
metadata.dc.publisher.department:	Instituto de Computação - IC
metadata.dc.publisher.program:	Programa de Pós-Graduação em Ciência da Computação (PGCOMP)
Citação:	CANÁRIO, João Paulo Pereira de Sá. On deep learning features for noisy time series classification. 2022. 85 f. Tese (Doutorado em Ciências da Computação) Instituto de Computação, Universidade Federal da Bahia, Salvador, BA, 2022.
URI:	https://repositorio.ufba.br/handle/ri/36105
Data do documento:	4-Jul-2022
Aparece nas coleções:	Tese (PGCOMP)

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
PGCOMP-2022-Tese_Doutorado-Joao_Paulo_Pereira_de_Sa_Canario.pdf	Tese de Doutorado de João Paulo Pereira de Sá Canário	20,48 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas