Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/36909
Tipo: Dissertação
Título: Estimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionais
Autor(es): Viana, Luiz Alberto Guimarães
Primeiro Orientador: Fernandes Júnior, Antônio Carlos Lopes
metadata.dc.contributor.advisor-co1: Simas Filho, Eduardo Furtado de
metadata.dc.contributor.referee1: Fernandes Júnior, Antônio Carlos Lopes
metadata.dc.contributor.referee2: Simas Filho, Eduardo Furtado de
metadata.dc.contributor.referee3: Montalvão Filho, Jugurta Rosa
metadata.dc.contributor.referee4: Prates, Ricardo Menezes
metadata.dc.contributor.referee5: Attux, Romis Ribeiro de Fassoil
Resumo: A estimativa de andamento é uma das tarefas mais fundamentais da Recuperação da Informação Musical (MIR - Musical Information Retrieval). Neste trabalho foi utilizada uma representação do sinal de áudio como uma imagem bidimensional através do escalograma wavelet. Foram testadas diferentes formas de geração do escalograma wavelet, variando a função wavelet analisadora e os níveis de escala. As imagens foram utilizadas para treinar uma Rede Neural Convolucional (CNN - Convolutional Neural Network) realizando um aprendizado supervisionado, relacionando a imagem com um valor de andamento alvo. O método de validação cruzada k-fold foi utilizado para gerar uma maior confiabilidade estatística do modelo proposto e definir o melhor resultado para as escolhas envolvendo os parâmetros de geração dos escalogramas. Foi implementado o aumento artificial de dados de forma online, modificando os escalogramas durante a rotina de treinamento. Por fim, o modelo foi avaliado em bancos de dados amplamente utilizados na literatura e os resultados foram comparados ao estado da arte. Resultados compatíveis ao estado da arte foram atingidos em um dos bancos de dados de avaliação, o "GiantSteps", atingindo uma acurácia (Tipo 2 - ACC2) de 92,6% com as wavelets analisadoras Morlet e Shannon.
Abstract: Audio tempo estimation is one of the most fundamental tasks in Music Information Retrieval (MIR). In this work, a wavelet scalogram is used as a two-dimensional image representation of the audio signal. Different ways of generating the wavelet scalogram were tested by varying the mother wavelet function and scale levels. The images were used to train a Convolutional Neural Network (CNN) through supervised learning, relating the image to a target tempo value. The k-fold cross-validation method was used to produce greater statistical reliability of the proposed model and to define the best result for choices involving the parameters of scalogram generation. Data augmentation was implemented online, modifying the scalograms during training. Finally, the model was evaluated on widely used databases in the literature, and the results were compared to the state-of-the-art. Results compatible with state-of-the-art were achieved on the "GiantSteps" evaluation database achieving an accuracy (Type 2 - ACC2) of 92.6\% with the Morlet and Shannon mother wavelets.
Palavras-chave: Andamento musical
Wavelet
Escalograma
Rede neural convolucional
Aumento artificial de dados
CNPq: CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Idioma: por
País: Brasil
Editora / Evento / Instituição: Universidade Federal da Bahia
Sigla da Instituição: UFBA
metadata.dc.publisher.department: Escola Politécnica
metadata.dc.publisher.program: Departamento de Engenharia Elétrica (DEEC) 
Citação: VIANA, Luiz Alberto Guimarães. Estimativa de Andamento Musical Através de Escalogramas Wavelet e Redes Neurais Convolucionais. 2023. 83f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal da Bahia, Salvador, 2023.
Tipo de Acesso: Attribution 3.0 Brazil
metadata.dc.rights.uri: http://creativecommons.org/licenses/by/3.0/br/
URI: https://repositorio.ufba.br/handle/ri/36909
Data do documento: 13-Fev-2023
Aparece nas coleções:Dissertação (PPGEE)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdfViana, L. A. G. - Estimativa de Andamento Musical48,26 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons