Detecção de empresas potencialmente não confiáveis por meio de extratos de compras governamentais: uma aplicação com modelos de linguagem natural.

Rocha, Cleiton Otavio da Exaltação

Página inicial
→
Instituto de Computação (IC)
→
Programa de Pós-Graduação em Ciência da Computação (PGCOMP)
→
Dissertação (PGCOMP)
→
Ver item

dc.creator	Rocha, Cleiton Otavio da Exaltação
dc.date.accessioned	2025-07-28T11:01:38Z
dc.date.available	2025-07-28T11:01:38Z
dc.date.issued	2025-06-05
dc.identifier.citation	ROCHA, Cleiton Otavio da Exaltação. Detecção de empresas potencialmente não confiáveis por meio de extratos de compras governamentais: uma aplicação com modelos de linguagem natural. 2025. 81 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador (Bahia), 2025.	pt_BR
dc.identifier.uri	https://repositorio.ufba.br/handle/ri/42618
dc.description.abstract	In the context of government procurement in Brazil, efficiency and continuous monitoring of expenditure represent significant challenges for public management. In 2023, the Brazilian Federal Government issued a total of 1,761,910 invoices for various types of acquisitions, resulting in an amount of R$ 76.62 billion in negotiations with private entities (TRANSPARÊNCIA, 2024). These government procurements cover a broad spectrum of the public sector, including procurement for the purchase of materials used in the construction of highways, maintenance of schools and hospitals, use of goods by public servants, among other purposes. The acquisition of these inputs is distributed in various locations throughout the country, generating a growing and diverse volume of information, present in contracts and invoices for products and services. However, these government procurements are often a fertile ground for the occurrence of collusion and fraud (OECD, 2007), such as overpricing of products, supplier monopolies, bribes to public officials, etc. The objective of this work is to compare the performance of Natural Language Processing (NLP) models in the task of detecting, based on extracts of government purchases, companies that have already been punished by government agencies, such as General Comptroller of the Union. The data used are public and periodically updated through the Federal Government's Open Data portal. The results of this work show that it is possible to use natural language models as a pre-stage of investigation of suspicious purchases, providing a classification of potentially problematic purchases that can later be evaluated by an expert, thus reducing the human workload by reducing the purchase list to a smaller and more focused amount.	pt_BR
dc.language	por	pt_BR
dc.publisher	Universidade Federal da Bahia	pt_BR
dc.rights	Acesso Aberto	pt_BR
dc.subject	Grandes Modelos de Linguagem	pt_BR
dc.subject	Análise de contratos públicos	pt_BR
dc.subject	Transparência pública	pt_BR
dc.subject	Detecção de fraude	pt_BR
dc.subject.other	Large Language Models	pt_BR
dc.subject.other	Public procurement analysis	pt_BR
dc.subject.other	Public transparency	pt_BR
dc.subject.other	Fraud detection	pt_BR
dc.title	Detecção de empresas potencialmente não confiáveis por meio de extratos de compras governamentais: uma aplicação com modelos de linguagem natural.	pt_BR
dc.title.alternative	Detection of potentially untrustworthy companies through government procurement extracts: an application with natural language models.	pt_BR
dc.type	Dissertação	pt_BR
dc.publisher.program	Programa de Pós-Graduação em Ciência da Computação (PGCOMP)	pt_BR
dc.publisher.initials	UFBA	pt_BR
dc.publisher.country	Brasil	pt_BR
dc.subject.cnpq	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO	pt_BR
dc.contributor.advisor1	Gomes, Gecynalda Soares da Silva
dc.contributor.advisor1ID	0000-0002-8895-5834	pt_BR
dc.contributor.advisor1Lattes	http://lattes.cnpq.br/3389510216870588	pt_BR
dc.contributor.referee1	Gomes, Gecynalda Soares da Silva
dc.contributor.referee1ID	0000-0002-8895-5834	pt_BR
dc.contributor.referee1Lattes	http://lattes.cnpq.br/3389510216870588	pt_BR
dc.contributor.referee2	Souza, Marlo Vieira dos Santos e
dc.contributor.referee2ID	0000-0002-5373-7271	pt_BR
dc.contributor.referee2Lattes	http://lattes.cnpq.br/8734792579019380	pt_BR
dc.contributor.referee3	Rocha, Ricardo Ferreira da
dc.contributor.referee3Lattes	http://lattes.cnpq.br/0676420269735630	pt_BR
dc.creator.ID	0000-0002-5401-6636	pt_BR
dc.creator.Lattes	https://lattes.cnpq.br/3086523246113941	pt_BR
dc.description.resumo	No contexto das compras governamentais no Brasil, a eficiência e o monitoramento contínuo dos gastos representam desafios significativos para a gestão pública. O Governo Federal do Brasil, em 2023, emitiu um total de 1.761.910 de notas fiscais para diversos tipos de aquisições, resultando em um montante de R$ 76,62 bilhões em negociações com entidades privadas (TRANSPARÊNCIA, 2024). Essas aquisições governamentais abrangem um amplo espectro da máquina pública, incluindo aquisições para compras de materiais utilizados em construção de rodovias, manutenção de escolas e hospitais, utilização de bens pelo funcionalismo público, dentre outros fins. As aquisições desses insumos são distribuídas em diversos locais do território nacional, gerando um volume crescente e diversificado de informações, presentes em contratos e notas fiscais de produtos e serviços. No entanto, essas compras governamentais são frequentemente um campo fértil para a ocorrência de conluios e fraudes (OECD, 2007), como superfaturamento nos preços dos produtos, monopólios dos fornecedores, propina para agentes públicos, etc. O objetivo deste trabalho é comparar o desempenho de modelos de Processamento de Linguagem Natural (PLN) na tarefa de detecção, com base no extrato das compras governamentais, de empresas que já foram punidas por órgãos governamentais, como a Controladoria Geral da União (CGU). Os dados utilizados são públicos e periodicamente atualizados através do portal de Dados Abertos do Governo Federal. Os resultados deste trabalho mostram que é possível utilizar modelos de linguagem natural como uma pré-etapa de investigação de compras suspeitas, fornecendo uma classificação de compras potencialmente problemáticas e que posteriormente podem ser avaliadas por um especialista, dessa forma, reduzindo a carga de trabalho humana ao reduzir a lista de compras para uma quantidade menor e mais focalizada.	pt_BR
dc.publisher.department	Instituto de Computação - IC	pt_BR
dc.type.degree	Mestrado Acadêmico	pt_BR