Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/33461
Tipo: Dissertação
Título: Similaridade semântica de atributos para dados em nuvem: um estudo de caso no MIDAS
Autor(es): Rocha, Witã dos Santos
Autor(es): Rocha, Witã dos Santos
Abstract: Grande quantidade de dados heterogêneos produzidos pelas redes sociais, dispositivos conectados na Internet e aplicações web vem sendo gerados, armazenados e gerenciados em formatos diferentes nos níveis de serviços Data-as-a-Service (DaaS ou Dado como um Serviço) e Database-as-a-Service (DBaaS ou Bancos de Dados como um Serviço) distintos. Tais soluções fornecem os dados como serviços sob demanda via Application Programming Interface (API). Para acessar esses serviços distribuídos entre as nuvens, os usuários enfrentam, na maioria dos casos, problemas de ambiguidade de dados. Nesse sentido é necessário prover uma solução automática que sirva como camada intermediária para estabelecer a comunicação entre os níveis de serviços SaaS e DaaS/DBaaS, de modo que resolva esses problemas evitando a execução de tarefas complexas e trabalhosas para acessar esses dados. Esta solução permite que os consumidores no nível de serviço SaaS acessem seus dados armazenados em diferentes níveis de serviços DaaS por meio de uma única consulta. A camada intermediária denominada Middleware for Interoperability Between SaaS and DaaS (MIDAS) fornece essa solução aos usuários de uma forma transparente. Com o tempo, as atualizações dos parâmetros dos níveis de serviços DaaS podem afetar semanticamente os termos das consultas configurados (automaticamente ou não) nos aplicativos nos níveis de serviços SaaS. Para garantir que os consumidores da nuvem continuem acessando os dados do DaaS, recomenda-se uma abordagem que garanta semelhança semântica entre os parâmetros do DaaS para manter a confiabilidade da solicitação original. Este trabalho propõe um método com duas avaliações de similaridade: (i) a contagem de arestas (Cosseno e Jaccard) para medir a semelhança entre dois parâmetros e a Information Content (IC) para medir a semelhança com base no conhecimento dos parâmetros no corpus da WordNet. O método IC é utilizado no modelo com o objetivo de completar as limitações do método de contagem de arestas. Para escolher os métodos de contagem de arestas (Cosseno e Jaccard), um ambiente com oito algoritmos de medida de distância, vinte e dois parâmetros autênticos de onze provedores de DaaS e cinco situações possíveis de alteração de parâmetros foram simulados. Como prova de conceito, este modelo é implementado no MIDAS para avaliar três critérios: sobrecarga, desempenho e corretude. Os resultados dos experimentos mostraram que há uma primeira direção para fornecer interoperabilidade semântica entre SaaS e DaaS no MIDAS.
Large amounts of heterogeneous data produced by social networks, Internet-connected devices, and web applications has been stored and managed in different formats at distinct service levels Data-as-a-Service (DaaS) and Database-as-a-Service (DBaaS). This solutions provides on demand services via Application Programming Interface (API). To access these distributed cloud services, users in most cases face data ambiguity issues. To solve these problems and to avoid performing complex and laborious tasks to access this data, an automated solution that serves as an intermediate layer for establishing communication between SaaS and DaaS / DBaaS service levels is required. This solution allows SaaS service level consumers to access their data stored at different DaaS service levels through a single query. The middleware layer called Middleware for Interoperability Between SaaS and DaaS (MIDAS) provides this solution to users in a transparent way. Over time, DaaS service level parameter updates can semantically affect query terms (that are automatically or not automatically) configured for applications at SaaS service levels. To ensure that cloud consumers continue to access DaaS data, an approach that ensures semantic similarity between DaaS parameters to maintain the reliability of the original request is recommended. Our work proposes a method (SM) with two similarity ways: (i) edge counting (Cosine and Jaccard) to measure the similarity between two attributes and the Information Content(IC) to measure similarity based on knowledge through a WordNet corpus. The IC method is used in the model to fill the limitations of the edge counting method. To choose the edge count methods (Cosine and Jaccard), an environment with eight distance measurement algorithms, twenty-two authentic parameters from eleven DaaS providers, and five possible parameter change situations was simulated. As a proof of concept, our model is implemented in MIDAS to evaluate three criteria: overload, performance and correctness. The results of our experiments showed that we are in the first direction to provide semantic interoperability between SaaS and DaaS in MIDAS.
Palavras-chave: Interoperabilidade
Similaridade Semântica -- Computação
Computação em nuvem
Dados como um serviço
Middleware
Data as a Service (DaaS)
CNPq: Ciências Exatas e da Terra
Ciência da Computação
País: Brasil
Sigla da Instituição: UFBA
metadata.dc.publisher.program: em Ciência da Computação
Tipo de Acesso: Acesso Aberto
URI: http://repositorio.ufba.br/ri/handle/ri/33461
Data do documento: 20-Mai-2021
Aparece nas coleções:Dissertação (PGCOMP)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertação_mestrado_Witã_dos_S_Rocha.pdf12,25 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.