Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/19307
Tipo: Dissertação
Título: Aplicação de ETL para a integração de dados com ênfase em big data na área de saúde pública
Autor(es): Pinto, Clícia dos Santos
Autor(es): Pinto, Clícia dos Santos
Abstract: Transformar os dados armazenados em informações úteis tem sido um desafio cada vez maior e mais complexo a medida em que o volume de dados produzidos todos os dias aumenta. Nos últimos anos, conceitos e tecnologias de Big Data têm sido amplamente utilizados como solução para o gerenciamento de grandes quantidades de dados em diferentes domínios. A proposta deste trabalho diz respeito `a utiliza¸c˜ao de técnicas de ETL (extração,transformação e carga) no desenvolvimento de um módulo de pré-processamento para o pareamento probabilístico de registros em bases de dados na área de Saúde Pública. A utiliza¸c˜ao da ferramenta de processamento distribuído do Spark garante o tratamento adequado para o contexto de Big Data em que esta pesquisa está inserida, gerando respostas em tempo hábil.
Palavras-chave: Big Data
ETL
pré-processamento
correlação de registros
Spark
CNPq: Ciência da Computação
País: Brasil
Sigla da Instituição: UFBA
metadata.dc.publisher.program: Mestrado Multiinstitucional em Ciência da Computação
Tipo de Acesso: Acesso Aberto
URI: http://repositorio.ufba.br/ri/handle/ri/19307
Data do documento: 30-Mai-2016
Aparece nas coleções:Dissertação (PGCOMP)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertação_Mestrado_Clicia(1).pdf2,18 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.