Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/33633
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisorRios, Ricardo Araújo-
dc.contributor.authorRibeiro, Rosana Guimarães-
dc.creatorRibeiro, Rosana Guimarães-
dc.date.accessioned2021-06-25T19:26:53Z-
dc.date.available2021-06-25T19:26:53Z-
dc.date.issued2021-06-25-
dc.date.submitted2020-07-29-
dc.identifier.urihttp://repositorio.ufba.br/ri/handle/ri/33633-
dc.description.abstractTécnicas de Aprendizado de Máquina Não-Supervisionado foram desenvolvidas visando encontrar estruturas e padrões em conjuntos de dados sem considerar qualquer informação prévia fornecida, por exemplo, por um especialista. Essa ausência de informação impacta diretamente no processo de validação devido à dificuldade em mensurar o conhecimento obtido por meio destas técnicas. Visando solucionar este problema, diversas pesquisas têm sido publicadas na literatura propondo critérios que integram diferentes áreas do conhecimento como Ciência da Computação e Estatı́stica. Esses critérios são comumente divididos em 3 categorias: relativo, externo e interno. Em geral, tais critérios são desenvolvidos com base em ı́ndices com diferentes objetivos e vieses de análise. Entretanto, grande parte desses ı́ndices são aplicados sobre dados caracterizados por serem independentes e identicamente distribuı́dos. A realização de uma Revisão Sistemática da Literatura demonstrou que há um número reduzido de pesquisas que investigam ı́ndices de validação de agrupamento para dados com dependência temporal entre suas observações. Este número é ainda mais reduzido quando se trata de ı́ndices que utilizam critério interno de validação. Para superar essa limitação, este trabalho de mestrado apresenta um novo ı́ndice interno de validação baseado na estatı́stica GAP (Gap Statistic). Este novo ı́ndice foi desenvolvido com o objetivo de mensurar e validar informações extraı́das de dados temporais com comportamento caótico a partir da aplicação de técnicas de Sistemas Dinâmicos e de Aprendizado de Máquina não-supervisionado. Resultados experimentais demonstraram a eficiência do novo ı́ndice interno de validação para dados com dependência temporal e confirmaram a importância do mesmo para o estado da arte.pt_BR
dc.description.abstractUnsupervised Machine Learning techniques have been developed to find out structures in datasets with-out considering any prior information. In such a context, the main challenge is to confirm whether the obtained structure indeed contains relevant data patterns. Aiming at solving this issue, there are several validation indexes proposed under different categories (e.g. internal, external, and relative) that allow to, for example, compare clustering algorithms or define the best parameter configurations. However, most of those indices are applied to data characterized for being collected in an independent and identically distributed manner. Thus, after performing a Systematic Literature Review, we noticed there are few researches investigating validation indexes specifically designed to deal with time-dependent data. The absence of researches for such context has motivated this work that was devoted to developing a new internal index based on Gap Statistic. Our index supports the estimation of the optimal number of clusters in a dataset only composed of time series. To reach this goal, we performed three important modifications in Gap Statistic: i) the use of a measure to calculate the distance between time series; ii) the adoption of a clustering method based on medoid; and iii) the modeling of time series in phase space using Dynamical System tools. Our results emphasize the importance of the proposed index, by accurately clustering sets of chaotic time series.pt_BR
dc.language.isopt_BRpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectSéries Temporais -- Análisept_BR
dc.subjectÍndice Internopt_BR
dc.subjectValidação de Agrupamentopt_BR
dc.subjectEstatística GAPpt_BR
dc.titleEstatística GAP temporal: um novo índice interno de validação de agrupamento de dados temporaispt_BR
dc.typeDissertaçãopt_BR
dc.contributor.refereesAlbertini, Marcelo Keese-
dc.contributor.refereesBarreto, Marcos Ennes-
dc.publisher.departamentUniversidade Federal da Bahiapt_BR
dc.publisher.departamentInstituto de Matemática e Estatísticapt_BR
dc.publisher.departamentDepartamento de Ciências da Computaçãopt_BR
dc.publisher.programem Ciência da Computaçãopt_BR
dc.publisher.initialsUFBApt_BR
dc.publisher.countryBrasilpt_BR
dc.subject.cnpqCiências Exatas e da Terrapt_BR
dc.subject.cnpqCiência da Computaçãopt_BR
dc.subject.cnpqMetodologia e Técnicas da Computaçãopt_BR
dc.subject.cnpqEngenharia de Softwarept_BR
Aparece nas coleções:Dissertação (PGCOMP)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertação-Rosana Guimarães_versao final.pdf3,08 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.