DSpace

RI UFBA >
Instituto de Matemática >
Mestrado Multiinstitucional de Pós-Graduação em Ciência da Computação (MMCC) >
Dissertações de Mestrado (MMCC) >

Please use this identifier to cite or link to this item: http://repositorio.ufba.br/ri/handle/ri/19307

Title: Aplicação de ETL para a integração de dados com ênfase em big data na área de saúde pública
Authors: Pinto, Clícia dos Santos
Keywords: Big Data;ETL;pré-processamento;correlação de registros;Spark
Issue Date: 30-May-2016
Abstract: Transformar os dados armazenados em informações úteis tem sido um desafio cada vez maior e mais complexo a medida em que o volume de dados produzidos todos os dias aumenta. Nos últimos anos, conceitos e tecnologias de Big Data têm sido amplamente utilizados como solução para o gerenciamento de grandes quantidades de dados em diferentes domínios. A proposta deste trabalho diz respeito `a utiliza¸c˜ao de técnicas de ETL (extração,transformação e carga) no desenvolvimento de um módulo de pré-processamento para o pareamento probabilístico de registros em bases de dados na área de Saúde Pública. A utiliza¸c˜ao da ferramenta de processamento distribuído do Spark garante o tratamento adequado para o contexto de Big Data em que esta pesquisa está inserida, gerando respostas em tempo hábil.
URI: http://repositorio.ufba.br/ri/handle/ri/19307
Appears in Collections:Dissertações de Mestrado (MMCC)

Files in This Item:

File Description SizeFormat
Dissertação_Mestrado_Clicia(1).pdf2.18 MBAdobe PDFView/Open
View Statistics

Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.

 

    Universidade Federal da Bahia

Contate-nos. Saiba mais sobre o RI/UFBA