Use este identificador para citar ou linkar para este item:
https://repositorio.ufba.br/handle/ri/33633
Registro completo de metadados
Campo DC | Valor | Idioma |
---|---|---|
dc.contributor.advisor | Rios, Ricardo Araújo | - |
dc.contributor.author | Ribeiro, Rosana Guimarães | - |
dc.creator | Ribeiro, Rosana Guimarães | - |
dc.date.accessioned | 2021-06-25T19:26:53Z | - |
dc.date.available | 2021-06-25T19:26:53Z | - |
dc.date.issued | 2021-06-25 | - |
dc.date.submitted | 2020-07-29 | - |
dc.identifier.uri | http://repositorio.ufba.br/ri/handle/ri/33633 | - |
dc.description.abstract | Técnicas de Aprendizado de Máquina Não-Supervisionado foram desenvolvidas visando encontrar estruturas e padrões em conjuntos de dados sem considerar qualquer informação prévia fornecida, por exemplo, por um especialista. Essa ausência de informação impacta diretamente no processo de validação devido à dificuldade em mensurar o conhecimento obtido por meio destas técnicas. Visando solucionar este problema, diversas pesquisas têm sido publicadas na literatura propondo critérios que integram diferentes áreas do conhecimento como Ciência da Computação e Estatı́stica. Esses critérios são comumente divididos em 3 categorias: relativo, externo e interno. Em geral, tais critérios são desenvolvidos com base em ı́ndices com diferentes objetivos e vieses de análise. Entretanto, grande parte desses ı́ndices são aplicados sobre dados caracterizados por serem independentes e identicamente distribuı́dos. A realização de uma Revisão Sistemática da Literatura demonstrou que há um número reduzido de pesquisas que investigam ı́ndices de validação de agrupamento para dados com dependência temporal entre suas observações. Este número é ainda mais reduzido quando se trata de ı́ndices que utilizam critério interno de validação. Para superar essa limitação, este trabalho de mestrado apresenta um novo ı́ndice interno de validação baseado na estatı́stica GAP (Gap Statistic). Este novo ı́ndice foi desenvolvido com o objetivo de mensurar e validar informações extraı́das de dados temporais com comportamento caótico a partir da aplicação de técnicas de Sistemas Dinâmicos e de Aprendizado de Máquina não-supervisionado. Resultados experimentais demonstraram a eficiência do novo ı́ndice interno de validação para dados com dependência temporal e confirmaram a importância do mesmo para o estado da arte. | pt_BR |
dc.description.abstract | Unsupervised Machine Learning techniques have been developed to find out structures in datasets with-out considering any prior information. In such a context, the main challenge is to confirm whether the obtained structure indeed contains relevant data patterns. Aiming at solving this issue, there are several validation indexes proposed under different categories (e.g. internal, external, and relative) that allow to, for example, compare clustering algorithms or define the best parameter configurations. However, most of those indices are applied to data characterized for being collected in an independent and identically distributed manner. Thus, after performing a Systematic Literature Review, we noticed there are few researches investigating validation indexes specifically designed to deal with time-dependent data. The absence of researches for such context has motivated this work that was devoted to developing a new internal index based on Gap Statistic. Our index supports the estimation of the optimal number of clusters in a dataset only composed of time series. To reach this goal, we performed three important modifications in Gap Statistic: i) the use of a measure to calculate the distance between time series; ii) the adoption of a clustering method based on medoid; and iii) the modeling of time series in phase space using Dynamical System tools. Our results emphasize the importance of the proposed index, by accurately clustering sets of chaotic time series. | pt_BR |
dc.language.iso | pt_BR | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Séries Temporais -- Análise | pt_BR |
dc.subject | Índice Interno | pt_BR |
dc.subject | Validação de Agrupamento | pt_BR |
dc.subject | Estatística GAP | pt_BR |
dc.title | Estatística GAP temporal: um novo índice interno de validação de agrupamento de dados temporais | pt_BR |
dc.type | Dissertação | pt_BR |
dc.contributor.referees | Albertini, Marcelo Keese | - |
dc.contributor.referees | Barreto, Marcos Ennes | - |
dc.publisher.departament | Universidade Federal da Bahia | pt_BR |
dc.publisher.departament | Instituto de Matemática e Estatística | pt_BR |
dc.publisher.departament | Departamento de Ciências da Computação | pt_BR |
dc.publisher.program | em Ciência da Computação | pt_BR |
dc.publisher.initials | UFBA | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.subject.cnpq | Ciências Exatas e da Terra | pt_BR |
dc.subject.cnpq | Ciência da Computação | pt_BR |
dc.subject.cnpq | Metodologia e Técnicas da Computação | pt_BR |
dc.subject.cnpq | Engenharia de Software | pt_BR |
Aparece nas coleções: | Dissertação (PGCOMP) |
Arquivos associados a este item:
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Dissertação-Rosana Guimarães_versao final.pdf | 3,08 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.