Please use this identifier to cite or link to this item: https://repositorio.ufba.br/handle/ri/19308
metadata.dc.type: Dissertação
Title: Correlação probabilística implementada em spark para big data em saúde
Authors: Pita, Robespierre Dantas da Rocha
metadata.dc.creator: Pita, Robespierre Dantas da Rocha
Abstract: A aplicação de técnicas de correlação probabilística em registros de saúde ou socioeconômicos de uma população tem sido uma prática comum entre epidemiologistas como base para suas pesquisa não-experimentais. Entretanto, o crescimento do volume dos dados comum ao cenário imposto pelo Big Data provocou uma carˆencia por ferramentas computacionais capazes de lidar com esses imensos reposit´orios. Neste trabalho é descrita uma solução implementada no framework de processamento em cluster Spark para a correlação probabilística de registros de grandes bases de dados do Sistema Público de Saúde brasileiro. Este trabalho está vinculado a um projeto que visa analisar a relação entre o Programam Bolsa Família e a incidência de doen¸cas associadas á pobreza, tais como hanseníase e tuberculose. Os resultados obtidos demonstram que esta implementação provê qualidade competitiva em relação a outras ferramentas e abordagens existentes, comprovada pela superioridade das métricas de tempo de execução.
Keywords: Correlação probabilística
Computação intensiva de dados
Sistemas de saúde pública
Apache Spark
metadata.dc.subject.cnpq: Ciência da Computação
metadata.dc.publisher.country: brasil
metadata.dc.publisher.initials: UFBA
metadata.dc.publisher.program: Mestrado Multiinstitucional em Ciência da Computação
metadata.dc.rights: Acesso Aberto
URI: http://repositorio.ufba.br/ri/handle/ri/19308
Issue Date: 30-May-2016
Appears in Collections:Dissertação (PGCOMP)

Files in This Item:
File Description SizeFormat 
Dissertação final - Robespierre.pdf1,98 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.