Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/33699
Tipo: Tese
Título: A framework for exploiting open data to improve spatial keyword query applications
Autor(es): Almeida, João Paulo Dias de
Autor(es): Almeida, João Paulo Dias de
Abstract: Estima-se que 80% de todos os aplicativos baseados em dados possuem dados georreferenciados. Consultas espaciais são amplamente empregadas para recuperar este tipo de dado eficientemente. Entretanto, o usuário tem um papel importante no processo de recuperação dos dados georreferenciados. Um problema frequente neste cenário é quando o usuário não consegue descrever aquilo que ele deseja encontrar, dificultando a busca pelo ponto de interesse (POI) que o melhor satisfaça. Por décadas, pesquisadores propuseram técnicas para auxiliar usuários a expressar as suas necessidades. Dentre estas técnicas, pode-se citar os modelos booleanos, correspondência de padrões e expansão de consulta. Apesar da existência de alternativas importantes, faltam soluções que auxiliem o/a usuário/a a utilizar consultas do tipo preferencial que utilizem palavras-chave. O top-k Spatial Keyword Preference Query (SKPQ) é uma consulta deste tipo que surge como uma solução potencial para auxiliar usuários a encontrar POIs. O SKPQ seleciona POIs considerando a descrição de locais na vizinhança. Em essência, o usuário define uma restrição espacial (i.e. raio) e textual (i.e. palavras-chave) a ser satisfeita. Nesse contexto, esta tese propõe estratégias para melhorar a recuperação de informação proporcionada pela SKPQ e consultas similares. A contribuição desta tese pode ser dividida em três etapas. Na primeira, dois repositórios Linked Open Data (LOD) são explorados para melhorar a descrição dos POIs e suas vizinhanças. A descrição do POI no LOD contém mais informação do que nos bancos de dados espaciais tradicionais, o que resulta em uma descrição mais detalhada. Na segunda etapa, os resultados da consulta são personalizados para apresentar os melhores POIs para o usuário nas primeiras posições do rank. Ao explorar comentários relacionados aos POIs, o sistema identifica o objeto que melhor satisfaz a usuária da consulta e reordena o rank de acordo com a preferência dela. Na terceira etapa, utilizamos uma função probabilística para descrever a preferência por POIs próximos um do outro. Esta função probabilística é incorporada à função de ranqueamento para que a busca também considere esta preferência. Por fim, avaliou-se separadamente cada estratégia proposta nesta tese. A primeira estratégia alcançou melhora de 20% no Normalized Discounted Cumulative Gain (NDCG) ao utilizar palavras-chave aleatórias. Assim como encontrou POIs onde não era possível encontrar com a SKPQ. A segunda estratégia adiciona melhora de 92% no NDCG. Enquanto, a terceira estratégia melhora a consistência do rank, alcançando aumento no coeficiente Tau de 52%. Os resultados alcançados foram obtidos através de experimentos offline, utilizando dados de usuários reais em bases de dados públicas.
It’s been asserted that 80% of all data business has some locational reference. Spatial queries are widely employed to manipulate spatial data more efficiently. However, the user has a crucial role in the spatial information retrieval process when querying the needed information. A frequent problem in this context occurs when a user is unable to describe the object he/she desires to find. This problem hinders the search for the best point of interest (POI) to satisfies the user. For decades, researchers have proposed techniques to aid users in express their information need, such as Boolean models, pattern matching operators, and query expansion. Despite the existence of relevant alternatives in the field, there is still a lack of solutions to aid users of keyword preference queries to express their needs. The Spatial Keyword Preference Query (SKPQ) arises as a potential solution to assist users in finding POIs. SKPQ selects POI based on the description of features in their neighborhood. In essence, the user defines a spatial (i.e. radius) and textual (i.e. query keywords) constraint to be satisfied. In this context, this thesis aims at proposing strategies to improve SKPQ results. The contribution is threefold. First, two Linked Open Data (LOD) repositories (i.e. DBpedia and LinkedGeoData) are exploited to improve the features description. The feature description in LOD contains more information than traditional spatial databases, leading to a more detailed description. Second, the query results are personalized to present the best POIs for the underlying user. By exploiting reviews on POIs, the system identifies the object that best satisfies the user and re-order the rank with respect to the user preference. Third, we model the user preference in visiting locations near to each other using a probabilistic function. This function is incorporated into the ranking function to retrieve POIs considering this user preference. We evaluate each technique employed in this proposal separately. The first technique achieves a relative Normalized Discounted Cumulative Gain (NDCG) improvement of 20% when using random query keywords. Also, it finds POIs where SKPQ is unable to find. The second technique further improves the relative NDCG by 92%. Finally, the third technique improves the rank consistency achieving a Tau performance of 52%. The results achieved were obtained through offline experiments, using data from real users in public databases.
Palavras-chave: SKPQ
Spatial query
Linked open data
Query evaluation
Query processing
Query personalization
Algorithms
Information retrieval
Data Mining (Computing)
Semantic Web
Ontology
CNPq: Ciências Exatas e da Terra
Ciência da Computação
Metodologia e Técnicas da Computação
País: Brasil
Sigla da Instituição: UFBA
metadata.dc.publisher.program: em Ciência da Computação
Tipo de Acesso: Acesso Aberto
URI: http://repositorio.ufba.br/ri/handle/ri/33699
Data do documento: 5-Jul-2021
Aparece nas coleções:Tese (PGCOMP)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
A Framework for Exploiting Open Data to Improve Spatial Keyword Query Applications.pdf5,32 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.