Please use this identifier to cite or link to this item: https://repositorio.ufba.br/handle/ri/36909
metadata.dc.type: Dissertação
Title: Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais
metadata.dc.creator: Viana, Luiz Alberto Guimarães
metadata.dc.contributor.advisor1: Fernandes Júnior, Antônio Carlos Lopes
metadata.dc.contributor.advisor-co1: Simas Filho, Eduardo Furtado de
metadata.dc.contributor.referee1: Fernandes Júnior, Antônio Carlos Lopes
metadata.dc.contributor.referee2: Simas Filho, Eduardo Furtado de
metadata.dc.contributor.referee3: Montalvão Filho, Jugurta Rosa
metadata.dc.contributor.referee4: Prates, Ricardo Menezes
metadata.dc.contributor.referee5: Attux, Romis Ribeiro de Fassoil
metadata.dc.description.resumo: A estimativa de andamento é uma das tarefas mais fundamentais da Recuperação da Informação Musical (MIR - Musical Information Retrieval). Neste trabalho foi utilizada uma representação do sinal de áudio como uma imagem bidimensional através do escalograma wavelet. Foram testadas diferentes formas de geração do escalograma wavelet, variando a função wavelet analisadora e os níveis de escala. As imagens foram utilizadas para treinar uma Rede Neural Convolucional (CNN - Convolutional Neural Network) realizando um aprendizado supervisionado, relacionando a imagem com um valor de andamento alvo. O método de validação cruzada k-fold foi utilizado para gerar uma maior confiabilidade estatística do modelo proposto e definir o melhor resultado para as escolhas envolvendo os parâmetros de geração dos escalogramas. Foi implementado o aumento artificial de dados de forma online, modificando os escalogramas durante a rotina de treinamento. Por fim, o modelo foi avaliado em bancos de dados amplamente utilizados na literatura e os resultados foram comparados ao estado da arte. Resultados compatíveis ao estado da arte foram atingidos em um dos bancos de dados de avaliação, o "GiantSteps", atingindo uma acurácia (Tipo 2 - ACC2) de 92,6% com as wavelets analisadoras Morlet e Shannon.
Abstract: Audio tempo estimation is one of the most fundamental tasks in Music Information Retrieval (MIR). In this work, a wavelet scalogram is used as a two-dimensional image representation of the audio signal. Different ways of generating the wavelet scalogram were tested by varying the mother wavelet function and scale levels. The images were used to train a Convolutional Neural Network (CNN) through supervised learning, relating the image to a target tempo value. The k-fold cross-validation method was used to produce greater statistical reliability of the proposed model and to define the best result for choices involving the parameters of scalogram generation. Data augmentation was implemented online, modifying the scalograms during training. Finally, the model was evaluated on widely used databases in the literature, and the results were compared to the state-of-the-art. Results compatible with state-of-the-art were achieved on the "GiantSteps" evaluation database achieving an accuracy (Type 2 - ACC2) of 92.6\% with the Morlet and Shannon mother wavelets.
Keywords: Andamento musical
Wavelet
Escalograma
Rede neural convolucional
Aumento artificial de dados
metadata.dc.subject.cnpq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
metadata.dc.language: por
metadata.dc.publisher.country: Brasil
Publisher: Universidade Federal da Bahia
metadata.dc.publisher.initials: UFBA
metadata.dc.publisher.department: Escola Politécnica
metadata.dc.publisher.program: Departamento de Engenharia Elétrica (DEEC) 
Citation: VIANA, Luiz Alberto Guimarães. Estimativa de Andamento Musical Através de Escalogramas Wavelet e Redes Neurais Convolucionais. 2023. 83f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal da Bahia, Salvador, 2023.
metadata.dc.rights: Attribution 3.0 Brazil
metadata.dc.rights.uri: http://creativecommons.org/licenses/by/3.0/br/
URI: https://repositorio.ufba.br/handle/ri/36909
Issue Date: 13-Feb-2023
Appears in Collections:Dissertação (PPGEE)

Files in This Item:
File Description SizeFormat 
Dissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdfViana, L. A. G. - Estimativa de Andamento Musical48,26 MBAdobe PDFView/Open


This item is licensed under a Creative Commons License Creative Commons