https://repositorio.ufba.br/handle/ri/42054| Tipo: | Dissertação |
| Título: | Desenvolvimento e validação de modelos preditivos para malária. |
| Título(s) alternativo(s): | Development and validation of predictive models for malaria. |
| Autor(es): | Santos Junior, Juracy Bertoldo |
| Primeiro Orientador: | Barreto, Marcos Ennes |
| metadata.dc.contributor.referee1: | Barreto, Marcos Ennes |
| metadata.dc.contributor.referee2: | Rios, Tatiane Nogueira |
| metadata.dc.contributor.referee3: | Sampaio, Vanderson de Souza |
| Resumo: | As técnicas de mineração de dados permitem extrair relações e características presentes nos dados que não são facilmente perceptíveis, especialmente em cenários envolvendo grandes volumes de dados. Estas técnicas permitem agrupar e classificar os dados, identificar padrões e exceções, bem como estabelecer relações de associação entre dados distintos. A análise preditiva é uma sub-área da mineração de dados que utiliza técnicas de aprendizado de máquina para a implementação de modelos analíticos de predição. Tais modelos baseiam-se no conhecimento prévio dos dados (análise descritiva) para pro- jetar possíveis futuros acontecimentos acerca do contexto sendo analisado. Este trabalho é parte integrante de um projeto de pesquisa que objetiva integrar dados de notifica- ção de malária presentes em diferentes fontes de informação e desenvolver modelos de análise preditiva sobre estes dados. Especificamente, este trabalho envolve o estudo de diferentes técnicas de predição e, a partir deste estudo, o desenvolvimento de modelos preditivos para o cenário epidemiológico da malária no Brasil. Quatro estudos de casos envolvendo dados epidemiológicos e climáticos são discutidos como prova de conceito dos modelos executados. Para a avaliação dos modelos foi utilizada a metodologia de validação (evaluation on a rolling forecasting origin, a métrica utilizada foi o Raiz do Erro Médio Quadrático (RMSE). Quatro algoritmos de aprendizado de máquina foram utilizados, suporte vector regression e random Forest obtiveram os melhores resultados. Dentre os quatro estudos de caso, dois obtiveram maior precisão utilizando dados de clima em alguns cenários |
| Abstract: | Data mining techniques allow the extraction of relationships and characteristics from data which are not easily identifiable, specially in big data scenarios. These techniques provide routines to group and classify data, identify patterns and outliers, as well as derive associations among distinct data. Predictive analytics is a part of the data mining workflow that relies on machine learning to implement different prediction models. These models are based on previous knowledge about the data to forecast possible outcomes related to the domain being considered. This work belongs to a project focusing on the integration of different data sources from the Brazilian malaria ecosystem and on the design of different predictive analytics models to be used over these data sources. More specificallly to design a predictive analytics model applied to malaria surveillance in Brazil. Four case studies comprising epidemiologic and climate data are discussed as proof of concepts. For the evaluation of the models the methodology of cross-validation for time series evaluation on rolling forecasting origin was used, the metric used was ac RMSE. Four machine learning algorithms were used, support vector regression and random Forest obtained the best results. Within the four case studies, two achieved greater accuracy using weather data in some scenarios. |
| Palavras-chave: | Mineração de dados Análise preditiva Predição baseada em dados Malária Computação |
| CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| Idioma: | por |
| País: | Brasil |
| Editora / Evento / Instituição: | Universidade Federal da Bahia |
| Sigla da Instituição: | UFBA |
| metadata.dc.publisher.department: | Instituto de Matemática |
| metadata.dc.publisher.program: | Programa de Pós-Graduação em Ciência da Computação (PGCOMP) |
| Citação: | SANTOS JUNIOR, Juracy Bertoldo. Desenvolvimento e validação de modelos preditivos para malária. 2019. 82 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Matemática e Estatística - IME, Universidade Federal da Bahia, Salvador (Bahia), 2019. |
| Tipo de Acesso: | Acesso Aberto |
| URI: | https://repositorio.ufba.br/handle/ri/42054 |
| Data do documento: | 20-Dez-2019 |
| Aparece nas coleções: | Dissertação (PGCOMP) |
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| PGCOMP-2019-Dissertação_Mestrado-JURACY_BERTOLDO_SANTOS_JUNIOR.pdf | dissertação mestrado juracy bertoldo | 3,67 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.