DSpace/Manakin Repository

Detecção de empresas potencialmente não confiáveis por meio de extratos de compras governamentais: uma aplicação com modelos de linguagem natural.

Mostrar registro simples

dc.creator Rocha, Cleiton Otavio da Exaltação
dc.date.accessioned 2025-07-28T11:01:38Z
dc.date.available 2025-07-28T11:01:38Z
dc.date.issued 2025-06-05
dc.identifier.citation ROCHA, Cleiton Otavio da Exaltação. Detecção de empresas potencialmente não confiáveis por meio de extratos de compras governamentais: uma aplicação com modelos de linguagem natural. 2025. 81 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador (Bahia), 2025. pt_BR
dc.identifier.uri https://repositorio.ufba.br/handle/ri/42618
dc.description.abstract In the context of government procurement in Brazil, efficiency and continuous monitoring of expenditure represent significant challenges for public management. In 2023, the Brazilian Federal Government issued a total of 1,761,910 invoices for various types of acquisitions, resulting in an amount of R$ 76.62 billion in negotiations with private entities (TRANSPARÊNCIA, 2024). These government procurements cover a broad spectrum of the public sector, including procurement for the purchase of materials used in the construction of highways, maintenance of schools and hospitals, use of goods by public servants, among other purposes. The acquisition of these inputs is distributed in various locations throughout the country, generating a growing and diverse volume of information, present in contracts and invoices for products and services. However, these government procurements are often a fertile ground for the occurrence of collusion and fraud (OECD, 2007), such as overpricing of products, supplier monopolies, bribes to public officials, etc. The objective of this work is to compare the performance of Natural Language Processing (NLP) models in the task of detecting, based on extracts of government purchases, companies that have already been punished by government agencies, such as General Comptroller of the Union. The data used are public and periodically updated through the Federal Government's Open Data portal. The results of this work show that it is possible to use natural language models as a pre-stage of investigation of suspicious purchases, providing a classification of potentially problematic purchases that can later be evaluated by an expert, thus reducing the human workload by reducing the purchase list to a smaller and more focused amount. pt_BR
dc.language por pt_BR
dc.publisher Universidade Federal da Bahia pt_BR
dc.rights Acesso Aberto pt_BR
dc.subject Grandes Modelos de Linguagem pt_BR
dc.subject Análise de contratos públicos pt_BR
dc.subject Transparência pública pt_BR
dc.subject Detecção de fraude pt_BR
dc.subject.other Large Language Models pt_BR
dc.subject.other Public procurement analysis pt_BR
dc.subject.other Public transparency pt_BR
dc.subject.other Fraud detection pt_BR
dc.title Detecção de empresas potencialmente não confiáveis por meio de extratos de compras governamentais: uma aplicação com modelos de linguagem natural. pt_BR
dc.title.alternative Detection of potentially untrustworthy companies through government procurement extracts: an application with natural language models. pt_BR
dc.type Dissertação pt_BR
dc.publisher.program Programa de Pós-Graduação em Ciência da Computação (PGCOMP)  pt_BR
dc.publisher.initials UFBA pt_BR
dc.publisher.country Brasil pt_BR
dc.subject.cnpq CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO pt_BR
dc.contributor.advisor1 Gomes, Gecynalda Soares da Silva
dc.contributor.advisor1ID 0000-0002-8895-5834 pt_BR
dc.contributor.advisor1Lattes http://lattes.cnpq.br/3389510216870588 pt_BR
dc.contributor.referee1 Gomes, Gecynalda Soares da Silva
dc.contributor.referee1ID 0000-0002-8895-5834 pt_BR
dc.contributor.referee1Lattes http://lattes.cnpq.br/3389510216870588 pt_BR
dc.contributor.referee2 Souza, Marlo Vieira dos Santos e
dc.contributor.referee2ID 0000-0002-5373-7271 pt_BR
dc.contributor.referee2Lattes http://lattes.cnpq.br/8734792579019380 pt_BR
dc.contributor.referee3 Rocha, Ricardo Ferreira da
dc.contributor.referee3Lattes http://lattes.cnpq.br/0676420269735630 pt_BR
dc.creator.ID 0000-0002-5401-6636 pt_BR
dc.creator.Lattes https://lattes.cnpq.br/3086523246113941 pt_BR
dc.description.resumo No contexto das compras governamentais no Brasil, a eficiência e o monitoramento contínuo dos gastos representam desafios significativos para a gestão pública. O Governo Federal do Brasil, em 2023, emitiu um total de 1.761.910 de notas fiscais para diversos tipos de aquisições, resultando em um montante de R$ 76,62 bilhões em negociações com entidades privadas (TRANSPARÊNCIA, 2024). Essas aquisições governamentais abrangem um amplo espectro da máquina pública, incluindo aquisições para compras de materiais utilizados em construção de rodovias, manutenção de escolas e hospitais, utilização de bens pelo funcionalismo público, dentre outros fins. As aquisições desses insumos são distribuídas em diversos locais do território nacional, gerando um volume crescente e diversificado de informações, presentes em contratos e notas fiscais de produtos e serviços. No entanto, essas compras governamentais são frequentemente um campo fértil para a ocorrência de conluios e fraudes (OECD, 2007), como superfaturamento nos preços dos produtos, monopólios dos fornecedores, propina para agentes públicos, etc. O objetivo deste trabalho é comparar o desempenho de modelos de Processamento de Linguagem Natural (PLN) na tarefa de detecção, com base no extrato das compras governamentais, de empresas que já foram punidas por órgãos governamentais, como a Controladoria Geral da União (CGU). Os dados utilizados são públicos e periodicamente atualizados através do portal de Dados Abertos do Governo Federal. Os resultados deste trabalho mostram que é possível utilizar modelos de linguagem natural como uma pré-etapa de investigação de compras suspeitas, fornecendo uma classificação de compras potencialmente problemáticas e que posteriormente podem ser avaliadas por um especialista, dessa forma, reduzindo a carga de trabalho humana ao reduzir a lista de compras para uma quantidade menor e mais focalizada. pt_BR
dc.publisher.department Instituto de Computação - IC pt_BR
dc.type.degree Mestrado Acadêmico pt_BR


Arquivos deste item

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples