| Campo DC | Valor | Idioma |
| dc.creator | Santos Junior, Juracy Bertoldo | - |
| dc.date.accessioned | 2025-05-19T11:21:10Z | - |
| dc.date.available | 2025-05-19T11:21:10Z | - |
| dc.date.issued | 2019-12-20 | - |
| dc.identifier.citation | SANTOS JUNIOR, Juracy Bertoldo. Desenvolvimento e validação de modelos preditivos para malária. 2019. 82 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Matemática e Estatística - IME, Universidade Federal da Bahia, Salvador (Bahia), 2019. | pt_BR |
| dc.identifier.uri | https://repositorio.ufba.br/handle/ri/42054 | - |
| dc.description.abstract | Data mining techniques allow the extraction of relationships and characteristics from
data which are not easily identifiable, specially in big data scenarios. These techniques
provide routines to group and classify data, identify patterns and outliers, as well as
derive associations among distinct data. Predictive analytics is a part of the data mining
workflow that relies on machine learning to implement different prediction models. These
models are based on previous knowledge about the data to forecast possible outcomes
related to the domain being considered. This work belongs to a project focusing on
the integration of different data sources from the Brazilian malaria ecosystem and on
the design of different predictive analytics models to be used over these data sources.
More specificallly to design a predictive analytics model applied to malaria surveillance
in Brazil. Four case studies comprising epidemiologic and climate data are discussed as
proof of concepts. For the evaluation of the models the methodology of cross-validation
for time series evaluation on rolling forecasting origin was used, the metric used was
ac RMSE. Four machine learning algorithms were used, support vector regression and
random Forest obtained the best results. Within the four case studies, two achieved
greater accuracy using weather data in some scenarios. | pt_BR |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Federal da Bahia | pt_BR |
| dc.rights | Acesso Aberto | pt_BR |
| dc.subject | Mineração de dados | pt_BR |
| dc.subject | Análise preditiva | pt_BR |
| dc.subject | Predição baseada em dados | pt_BR |
| dc.subject | Malária | pt_BR |
| dc.subject | Computação | pt_BR |
| dc.subject.other | Data mining | pt_BR |
| dc.subject.other | Predictive analytics | pt_BR |
| dc.subject.other | Data-driven prediction | pt_BR |
| dc.subject.other | Malária | pt_BR |
| dc.subject.other | Computing | pt_BR |
| dc.title | Desenvolvimento e validação de modelos preditivos para malária. | pt_BR |
| dc.title.alternative | Development and validation of predictive models for malaria. | pt_BR |
| dc.type | Dissertação | pt_BR |
| dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação (PGCOMP) | pt_BR |
| dc.publisher.initials | UFBA | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
| dc.contributor.advisor1 | Barreto, Marcos Ennes | - |
| dc.contributor.advisor1ID | https://orcid.org/0000-0002-7818-1855 | pt_BR |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/2919125967043242 | pt_BR |
| dc.contributor.referee1 | Barreto, Marcos Ennes | - |
| dc.contributor.referee1ID | https://orcid.org/0000-0002-7818-1855 | pt_BR |
| dc.contributor.referee1Lattes | http://lattes.cnpq.br/2919125967043242 | pt_BR |
| dc.contributor.referee2 | Rios, Tatiane Nogueira | - |
| dc.contributor.referee2Lattes | http://lattes.cnpq.br/0851148137941240 | pt_BR |
| dc.contributor.referee3 | Sampaio, Vanderson de Souza | - |
| dc.contributor.referee3ID | https://orcid.org/0000-0001-7307-8851 | pt_BR |
| dc.contributor.referee3Lattes | http://lattes.cnpq.br/0039836167659650 | pt_BR |
| dc.creator.ID | https://orcid.org/0000-0003-3589-2494 | pt_BR |
| dc.creator.Lattes | http://lattes.cnpq.br/8528212290254156 | pt_BR |
| dc.description.resumo | As técnicas de mineração de dados permitem extrair relações e características presentes
nos dados que não são facilmente perceptíveis, especialmente em cenários envolvendo
grandes volumes de dados. Estas técnicas permitem agrupar e classificar os dados,
identificar padrões e exceções, bem como estabelecer relações de associação entre dados
distintos. A análise preditiva é uma sub-área da mineração de dados que utiliza técnicas
de aprendizado de máquina para a implementação de modelos analíticos de predição.
Tais modelos baseiam-se no conhecimento prévio dos dados (análise descritiva) para pro-
jetar possíveis futuros acontecimentos acerca do contexto sendo analisado. Este trabalho
é parte integrante de um projeto de pesquisa que objetiva integrar dados de notifica-
ção de malária presentes em diferentes fontes de informação e desenvolver modelos de
análise preditiva sobre estes dados. Especificamente, este trabalho envolve o estudo de
diferentes técnicas de predição e, a partir deste estudo, o desenvolvimento de modelos
preditivos para o cenário epidemiológico da malária no Brasil. Quatro estudos de casos
envolvendo dados epidemiológicos e climáticos são discutidos como prova de conceito
dos modelos executados. Para a avaliação dos modelos foi utilizada a metodologia de
validação (evaluation on a rolling forecasting origin, a métrica utilizada foi o Raiz do
Erro Médio Quadrático (RMSE). Quatro algoritmos de aprendizado de máquina foram
utilizados, suporte vector regression e random Forest obtiveram os melhores resultados.
Dentre os quatro estudos de caso, dois obtiveram maior precisão utilizando dados de
clima em alguns cenários | pt_BR |
| dc.publisher.department | Instituto de Matemática | pt_BR |
| dc.type.degree | Mestrado Acadêmico | pt_BR |
| Aparece nas coleções: | Dissertação (PGCOMP)
|