https://repositorio.ufba.br/handle/ri/19307| Tipo: | Dissertação |
| Título: | Aplicação de ETL para a integração de dados com ênfase em big data na área de saúde pública |
| Autor(es): | Pinto, Clícia dos Santos |
| Autor(es): | Pinto, Clícia dos Santos |
| Abstract: | Transformar os dados armazenados em informações úteis tem sido um desafio cada vez maior e mais complexo a medida em que o volume de dados produzidos todos os dias aumenta. Nos últimos anos, conceitos e tecnologias de Big Data têm sido amplamente utilizados como solução para o gerenciamento de grandes quantidades de dados em diferentes domínios. A proposta deste trabalho diz respeito `a utiliza¸c˜ao de técnicas de ETL (extração,transformação e carga) no desenvolvimento de um módulo de pré-processamento para o pareamento probabilístico de registros em bases de dados na área de Saúde Pública. A utiliza¸c˜ao da ferramenta de processamento distribuído do Spark garante o tratamento adequado para o contexto de Big Data em que esta pesquisa está inserida, gerando respostas em tempo hábil. |
| Palavras-chave: | Big Data ETL pré-processamento correlação de registros Spark |
| CNPq: | Ciência da Computação |
| País: | Brasil |
| Sigla da Instituição: | UFBA |
| metadata.dc.publisher.program: | Mestrado Multiinstitucional em Ciência da Computação |
| Tipo de Acesso: | Acesso Aberto |
| URI: | http://repositorio.ufba.br/ri/handle/ri/19307 |
| Data do documento: | 30-Mai-2016 |
| Aparece nas coleções: | Dissertação (PGCOMP) |
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| Dissertação_Mestrado_Clicia(1).pdf | 2,18 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.