https://repositorio.ufba.br/handle/ri/44141| Tipo: | Dissertação |
| Título: | Integrating confidence into embedding-based models for learn-to-rank in recommender systems. |
| Título(s) alternativo(s): | Integrando a confiança em modelos baseados em embedding para aprendizado de ranque em sistemas de recomendação. |
| Autor(es): | Joel, Machado Pires |
| Primeiro Orientador: | Durão, Frederico Araújo |
| metadata.dc.contributor.referee1: | Durão, Frederico Araújo |
| metadata.dc.contributor.referee2: | Zanon, André Levi |
| metadata.dc.contributor.referee3: | Barbosa, Yuri de Almeida Malheiros |
| Resumo: | Os sistemas de recomendação aumentam a eficiência da recuperação de informações em diversos domínios e oferecem conteúdo personalizado alinhado às preferências do usuário. Eles extraem relações usuário-item por meio de métodos como fatoração de matrizes e redes de atenção em grafos (GAT). A literatura apresenta avanços em precisão para tarefas de regressão e ordenação, mas ainda se concentra principalmente no desempenho preditivo, com pouca atenção à utilidade mais ampla da estimativa de confiança. A estimativa de confiança é essencial para quantificar a certeza das recomendações, especialmente quando é necessário equilibrar risco e recompensa. Ela permite mitigar incertezas decorrentes de ruído nos dados e limitações do modelo. No entanto, abordagens existentes enfrentam limitações importantes. Técnicas não paramétricas, como calibração probabilística com redes neurais, permanecem restritas a tarefas de classificação e não contemplam cenários de regressão, como previsão de notas ou aprendizado para ranqueamento. Além disso, muitos modelos de confiança operam de forma independente do modelo principal de recomendação, o que prejudica a capacidade de refletir adequadamente o nível real de certeza. A literatura também negligencia a integração de confiança em modelos baseados em GAT e carece de avaliações experimentais comparativas de métodos baseados em distribuição. Diante dessas lacunas, este estudo propõe uma avaliação experimental de métodos anteriores baseados em distribuição e investiga uma integração adequada de confiança em modelos baseados em GAT. Avaliamos quatro soluções existentes em termos de precisão na previsão de notas, precisão de ordenação e correlação entre confiança e erro, utilizando conjuntos de dados públicos com diferentes características. Os resultados mostram que a integração de confiança baseada em distribuição frequentemente reduz a precisão e ainda oferece espaço para melhorias na correlação confiança-erro. Embora essas conclusões também se apliquem ao nosso método, ele apresenta desempenho superior ao de todas as soluções anteriores e obtém resultados promissores de correlação negativa entre confiança e erro. Na segunda parte do estudo, propomos e avaliamos a integração de confiança em métodos de aprendizado de ranqueamento. Essa proposta, bem como os modelos de referência, é avaliada em múltiplos conjuntos de dados e métricas de ordenação. Especificamente, a integração de confiança proposta para modelos de previsão de classificação alcançou melhorias de pelo menos 58,1636% nas métricas de classificação no conjunto de dados Amazon Movies and TVs, 34,94% no conjunto de dados Jester Joke e 42,9882% no conjunto de dados MovieLens. O método proposto para aprendizado de classificação não prejudica significativamente o desempenho do modelo, apresentando resultados competitivos ou melhores em todos os conjuntos de dados. Além disso, observamos uma relação polinomial cúbica entre confiança e erro nesta última solução. |
| Abstract: | Recommender systems (RecSys) enhance information retrieval efficiency across different domains by delivering personalized content that aligns with user preferences. These systems address user-item relationships through methods like matrix factorization and graph attention networks (GAT). Despite advancements in accuracy, existing approaches often narrowly focus on predictive performance while neglecting the broader utility of confidence estimation. This estimation is crucial for quantifying the certainty behind recommendations, particularly in situations where a balance between risk and reward is required. RecSys can mitigate uncertainties stemming from data noise and model limitations by utilizing confidence. Existing approaches to confidence integration face critical limitations. Non-parametric techniques, such as neural network-based probabilistic calibration, remain confined to classification tasks, failing to address regression scenarios, including rating prediction and listwise learn-to-rank. Many confidence models operate independently of core recommendation processes, limiting their adaptability and calibration impact. Notably, the literature neglects the integration of confidence into GAT-based models. Additionally, the literature lacks experimental evaluation of different distribution-based methods. Therefore, this study proposes an experimental evaluation of previous distribution-based methods and explores a suitable confidence integration in GAT-based models. We evaluate four prior solutions in terms of rating prediction accuracy, ranking accuracy, and confidence correlation with error. These solutions and our proposal are evaluated in public datasets from varying contexts and characteristics. Results reveal that distribution-based confidence integration often harms models' accuracy and leaves room for improvement regarding the correlation between confidence and error. Although these findings also hold for our method, it still achieves superior performance compared to all prior solutions and shows promising results in terms of negative confidence–error correlation. Furthermore, as a second part of this study, we propose and evaluate the integration of confidence into embedding models for learn-to-rank methods. This proposal and its baselines are also evaluated across various public datasets, using different ranking metrics, and the correlation with confidence and error. The results reveal that both proposed methods consistently demonstrate competitive rank performances and even outperform the baselines in some datasets. Specifically, the proposed confidence integration for rating prediction achieved improvements of at least 58.16% in ranking metrics on the Amazon Movies and TVs, 34.94% on the Jester Joke, and 42.98% on the MovieLens dataset. Additionally, we observed a cubic polynomial relationship between confidence and error in this latter solution. |
| Palavras-chave: | Sistemas de Recomendação Confiança Incerteza Computação |
| CNPq: | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA |
| Idioma: | eng |
| País: | Brasil |
| Editora / Evento / Instituição: | Universidade Federal da Bahia |
| Sigla da Instituição: | UFBA |
| metadata.dc.publisher.department: | Instituto de Computação - IC |
| metadata.dc.publisher.program: | Programa de Pós-Graduação em Ciência da Computação (PGCOMP) |
| Citação: | PIRES, Joel Machado. Integrating confidence into embedding-based models for learn-torank in recommender systems. 2026. 106 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador (Bahia), 2026. |
| Tipo de Acesso: | Acesso Aberto |
| URI: | https://repositorio.ufba.br/handle/ri/44141 |
| Data do documento: | 20-Jan-2026 |
| Aparece nas coleções: | Dissertação (PGCOMP) |
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| dissertacao-joel-machado-pires.pdf | Dissertação | 5,03 MB | Adobe PDF | Visualizar/Abrir |
Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.