RI UFBA >
Instituto de Matemática >
Mestrado Multiinstitucional de Pós-Graduação em Ciência da Computação (MMCC) >
Dissertações de Mestrado (MMCC) >
Please use this identifier to cite or link to this item:
http://repositorio.ufba.br/ri/handle/ri/19308
|
Title: | Correlação probabilística implementada em spark para big data em saúde |
Authors: | Pita, Robespierre Dantas da Rocha |
???metadata.dc.contributor.advisor???: | Barreto, Marcos Ennes |
Keywords: | Correlação probabilística;Computação intensiva de dados;Sistemas de saúde pública;Apache Spark |
Issue Date: | 30-May-2016 |
Abstract: | A aplicação de técnicas de correlação probabilística em registros de saúde ou socioeconômicos de uma população tem sido uma prática comum entre epidemiologistas como
base para suas pesquisa não-experimentais. Entretanto, o crescimento do volume dos dados comum ao cenário imposto pelo Big Data provocou uma carˆencia por ferramentas computacionais capazes de lidar com esses imensos reposit´orios. Neste trabalho é descrita uma solução implementada no framework de processamento em cluster Spark para a correlação probabilística de registros de grandes bases de dados do Sistema Público de Saúde
brasileiro. Este trabalho está vinculado a um projeto que visa analisar a relação entre o Programam Bolsa Família e a incidência de doen¸cas associadas á pobreza, tais como hanseníase e tuberculose. Os resultados obtidos demonstram que esta implementação
provê qualidade competitiva em relação a outras ferramentas e abordagens existentes, comprovada pela superioridade das métricas de tempo de execução. |
URI: | http://repositorio.ufba.br/ri/handle/ri/19308 |
Appears in Collections: | Dissertações de Mestrado (MMCC)
|
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.
|