Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/36909
Registro completo de metadados
Campo DCValorIdioma
dc.creatorViana, Luiz Alberto Guimarães-
dc.date.accessioned2023-04-24T11:26:59Z-
dc.date.available2023-04-24T11:26:59Z-
dc.date.issued2023-02-13-
dc.identifier.citationVIANA, Luiz Alberto Guimarães. Estimativa de Andamento Musical Através de Escalogramas Wavelet e Redes Neurais Convolucionais. 2023. 83f. Dissertação (Mestrado em Engenharia Elétrica) - Universidade Federal da Bahia, Salvador, 2023.pt_BR
dc.identifier.urihttps://repositorio.ufba.br/handle/ri/36909-
dc.description.abstractAudio tempo estimation is one of the most fundamental tasks in Music Information Retrieval (MIR). In this work, a wavelet scalogram is used as a two-dimensional image representation of the audio signal. Different ways of generating the wavelet scalogram were tested by varying the mother wavelet function and scale levels. The images were used to train a Convolutional Neural Network (CNN) through supervised learning, relating the image to a target tempo value. The k-fold cross-validation method was used to produce greater statistical reliability of the proposed model and to define the best result for choices involving the parameters of scalogram generation. Data augmentation was implemented online, modifying the scalograms during training. Finally, the model was evaluated on widely used databases in the literature, and the results were compared to the state-of-the-art. Results compatible with state-of-the-art were achieved on the "GiantSteps" evaluation database achieving an accuracy (Type 2 - ACC2) of 92.6\% with the Morlet and Shannon mother wavelets.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal da Bahiapt_BR
dc.rightsAttribution 3.0 Brazil*
dc.rights.urihttp://creativecommons.org/licenses/by/3.0/br/*
dc.subjectAndamento musicalpt_BR
dc.subjectWaveletpt_BR
dc.subjectEscalogramapt_BR
dc.subjectRede neural convolucionalpt_BR
dc.subjectAumento artificial de dadospt_BR
dc.subject.otherAudio tempo estimationpt_BR
dc.subject.otherMusical tempopt_BR
dc.subject.otherWaveletpt_BR
dc.subject.otherScalogrampt_BR
dc.subject.otherConvolutional neural networkspt_BR
dc.subject.otherData augmentationpt_BR
dc.subject.otherMusical information retrieval (MIR)pt_BR
dc.titleEstimativa de andamento musical através de escalogramas wavelet e redes neurais convolucionaispt_BR
dc.typeDissertaçãopt_BR
dc.publisher.programDepartamento de Engenharia Elétrica (DEEC) pt_BR
dc.publisher.initialsUFBApt_BR
dc.publisher.countryBrasilpt_BR
dc.subject.cnpqCNPQ::ENGENHARIAS::ENGENHARIA ELETRICApt_BR
dc.contributor.advisor1Fernandes Júnior, Antônio Carlos Lopes-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/2586671440653430pt_BR
dc.contributor.advisor2Latteshttp://lattes.cnpq.br/6012321412801915pt_BR
dc.contributor.advisor-co1Simas Filho, Eduardo Furtado de-
dc.contributor.referee1Fernandes Júnior, Antônio Carlos Lopes-
dc.contributor.referee2Simas Filho, Eduardo Furtado de-
dc.contributor.referee3Montalvão Filho, Jugurta Rosa-
dc.contributor.referee4Prates, Ricardo Menezes-
dc.contributor.referee5Attux, Romis Ribeiro de Fassoil-
dc.creator.Latteshttp://lattes.cnpq.br/4552555694780012pt_BR
dc.description.resumoA estimativa de andamento é uma das tarefas mais fundamentais da Recuperação da Informação Musical (MIR - Musical Information Retrieval). Neste trabalho foi utilizada uma representação do sinal de áudio como uma imagem bidimensional através do escalograma wavelet. Foram testadas diferentes formas de geração do escalograma wavelet, variando a função wavelet analisadora e os níveis de escala. As imagens foram utilizadas para treinar uma Rede Neural Convolucional (CNN - Convolutional Neural Network) realizando um aprendizado supervisionado, relacionando a imagem com um valor de andamento alvo. O método de validação cruzada k-fold foi utilizado para gerar uma maior confiabilidade estatística do modelo proposto e definir o melhor resultado para as escolhas envolvendo os parâmetros de geração dos escalogramas. Foi implementado o aumento artificial de dados de forma online, modificando os escalogramas durante a rotina de treinamento. Por fim, o modelo foi avaliado em bancos de dados amplamente utilizados na literatura e os resultados foram comparados ao estado da arte. Resultados compatíveis ao estado da arte foram atingidos em um dos bancos de dados de avaliação, o "GiantSteps", atingindo uma acurácia (Tipo 2 - ACC2) de 92,6% com as wavelets analisadoras Morlet e Shannon.pt_BR
dc.publisher.departmentEscola Politécnicapt_BR
dc.type.degreeMestrado Acadêmicopt_BR
Aparece nas coleções:Dissertação (PPGEE)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertação Mestrado - Viana, L.A.G. - Estimativa de Andamento Musical.pdfViana, L. A. G. - Estimativa de Andamento Musical48,26 MBAdobe PDFVisualizar/Abrir


Este item está licenciada sob uma Licença Creative Commons Creative Commons