Integrating confidence into embedding-based models for learn-to-rank in recommender systems.

Joel, Machado Pires

Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/44141

Tipo:	Dissertação
Título:	Integrating confidence into embedding-based models for learn-to-rank in recommender systems.
Título(s) alternativo(s):	Integrando a confiança em modelos baseados em embedding para aprendizado de ranque em sistemas de recomendação.
Autor(es):	Joel, Machado Pires
Primeiro Orientador:	Durão, Frederico Araújo
metadata.dc.contributor.referee1:	Durão, Frederico Araújo
metadata.dc.contributor.referee2:	Zanon, André Levi
metadata.dc.contributor.referee3:	Barbosa, Yuri de Almeida Malheiros
Resumo:	Os sistemas de recomendação aumentam a eficiência da recuperação de informações em diversos domínios e oferecem conteúdo personalizado alinhado às preferências do usuário. Eles extraem relações usuário-item por meio de métodos como fatoração de matrizes e redes de atenção em grafos (GAT). A literatura apresenta avanços em precisão para tarefas de regressão e ordenação, mas ainda se concentra principalmente no desempenho preditivo, com pouca atenção à utilidade mais ampla da estimativa de confiança. A estimativa de confiança é essencial para quantificar a certeza das recomendações, especialmente quando é necessário equilibrar risco e recompensa. Ela permite mitigar incertezas decorrentes de ruído nos dados e limitações do modelo. No entanto, abordagens existentes enfrentam limitações importantes. Técnicas não paramétricas, como calibração probabilística com redes neurais, permanecem restritas a tarefas de classificação e não contemplam cenários de regressão, como previsão de notas ou aprendizado para ranqueamento. Além disso, muitos modelos de confiança operam de forma independente do modelo principal de recomendação, o que prejudica a capacidade de refletir adequadamente o nível real de certeza. A literatura também negligencia a integração de confiança em modelos baseados em GAT e carece de avaliações experimentais comparativas de métodos baseados em distribuição. Diante dessas lacunas, este estudo propõe uma avaliação experimental de métodos anteriores baseados em distribuição e investiga uma integração adequada de confiança em modelos baseados em GAT. Avaliamos quatro soluções existentes em termos de precisão na previsão de notas, precisão de ordenação e correlação entre confiança e erro, utilizando conjuntos de dados públicos com diferentes características. Os resultados mostram que a integração de confiança baseada em distribuição frequentemente reduz a precisão e ainda oferece espaço para melhorias na correlação confiança-erro. Embora essas conclusões também se apliquem ao nosso método, ele apresenta desempenho superior ao de todas as soluções anteriores e obtém resultados promissores de correlação negativa entre confiança e erro. Na segunda parte do estudo, propomos e avaliamos a integração de confiança em métodos de aprendizado de ranqueamento. Essa proposta, bem como os modelos de referência, é avaliada em múltiplos conjuntos de dados e métricas de ordenação. Especificamente, a integração de confiança proposta para modelos de previsão de classificação alcançou melhorias de pelo menos 58,1636% nas métricas de classificação no conjunto de dados Amazon Movies and TVs, 34,94% no conjunto de dados Jester Joke e 42,9882% no conjunto de dados MovieLens. O método proposto para aprendizado de classificação não prejudica significativamente o desempenho do modelo, apresentando resultados competitivos ou melhores em todos os conjuntos de dados. Além disso, observamos uma relação polinomial cúbica entre confiança e erro nesta última solução.
Abstract:	Recommender systems (RecSys) enhance information retrieval efficiency across different domains by delivering personalized content that aligns with user preferences. These systems address user-item relationships through methods like matrix factorization and graph attention networks (GAT). Despite advancements in accuracy, existing approaches often narrowly focus on predictive performance while neglecting the broader utility of confidence estimation. This estimation is crucial for quantifying the certainty behind recommendations, particularly in situations where a balance between risk and reward is required. RecSys can mitigate uncertainties stemming from data noise and model limitations by utilizing confidence. Existing approaches to confidence integration face critical limitations. Non-parametric techniques, such as neural network-based probabilistic calibration, remain confined to classification tasks, failing to address regression scenarios, including rating prediction and listwise learn-to-rank. Many confidence models operate independently of core recommendation processes, limiting their adaptability and calibration impact. Notably, the literature neglects the integration of confidence into GAT-based models. Additionally, the literature lacks experimental evaluation of different distribution-based methods. Therefore, this study proposes an experimental evaluation of previous distribution-based methods and explores a suitable confidence integration in GAT-based models. We evaluate four prior solutions in terms of rating prediction accuracy, ranking accuracy, and confidence correlation with error. These solutions and our proposal are evaluated in public datasets from varying contexts and characteristics. Results reveal that distribution-based confidence integration often harms models' accuracy and leaves room for improvement regarding the correlation between confidence and error. Although these findings also hold for our method, it still achieves superior performance compared to all prior solutions and shows promising results in terms of negative confidence–error correlation. Furthermore, as a second part of this study, we propose and evaluate the integration of confidence into embedding models for learn-to-rank methods. This proposal and its baselines are also evaluated across various public datasets, using different ranking metrics, and the correlation with confidence and error. The results reveal that both proposed methods consistently demonstrate competitive rank performances and even outperform the baselines in some datasets. Specifically, the proposed confidence integration for rating prediction achieved improvements of at least 58.16% in ranking metrics on the Amazon Movies and TVs, 34.94% on the Jester Joke, and 42.98% on the MovieLens dataset. Additionally, we observed a cubic polynomial relationship between confidence and error in this latter solution.
Palavras-chave:	Sistemas de Recomendação Confiança Incerteza Computação
CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA
Idioma:	eng
País:	Brasil
Editora / Evento / Instituição:	Universidade Federal da Bahia
Sigla da Instituição:	UFBA
metadata.dc.publisher.department:	Instituto de Computação - IC
metadata.dc.publisher.program:	Programa de Pós-Graduação em Ciência da Computação (PGCOMP)
Citação:	PIRES, Joel Machado. Integrating confidence into embedding-based models for learn-torank in recommender systems. 2026. 106 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador (Bahia), 2026.
Tipo de Acesso:	Acesso Aberto
URI:	https://repositorio.ufba.br/handle/ri/44141
Data do documento:	20-Jan-2026
Aparece nas coleções:	Dissertação (PGCOMP)

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
dissertacao-joel-machado-pires.pdf	Dissertação	5,03 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas