https://repositorio.ufba.br/handle/ri/19308
Tipo: | Dissertação |
Título: | Correlação probabilística implementada em spark para big data em saúde |
Autor(es): | Pita, Robespierre Dantas da Rocha |
Autor(es): | Pita, Robespierre Dantas da Rocha |
Abstract: | A aplicação de técnicas de correlação probabilística em registros de saúde ou socioeconômicos de uma população tem sido uma prática comum entre epidemiologistas como base para suas pesquisa não-experimentais. Entretanto, o crescimento do volume dos dados comum ao cenário imposto pelo Big Data provocou uma carˆencia por ferramentas computacionais capazes de lidar com esses imensos reposit´orios. Neste trabalho é descrita uma solução implementada no framework de processamento em cluster Spark para a correlação probabilística de registros de grandes bases de dados do Sistema Público de Saúde brasileiro. Este trabalho está vinculado a um projeto que visa analisar a relação entre o Programam Bolsa Família e a incidência de doen¸cas associadas á pobreza, tais como hanseníase e tuberculose. Os resultados obtidos demonstram que esta implementação provê qualidade competitiva em relação a outras ferramentas e abordagens existentes, comprovada pela superioridade das métricas de tempo de execução. |
Palavras-chave: | Correlação probabilística Computação intensiva de dados Sistemas de saúde pública Apache Spark |
CNPq: | Ciência da Computação |
País: | brasil |
Sigla da Instituição: | UFBA |
metadata.dc.publisher.program: | Mestrado Multiinstitucional em Ciência da Computação |
Tipo de Acesso: | Acesso Aberto |
URI: | http://repositorio.ufba.br/ri/handle/ri/19308 |
Data do documento: | 30-Mai-2016 |
Aparece nas coleções: | Dissertação (PGCOMP) |
Arquivo | Descrição | Tamanho | Formato | |
---|---|---|---|---|
Dissertação final - Robespierre.pdf | 1,98 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.