| dc.creator | Rocha, Cleiton Otavio da Exaltação | |
| dc.date.accessioned | 2025-07-28T11:01:38Z | |
| dc.date.available | 2025-07-28T11:01:38Z | |
| dc.date.issued | 2025-06-05 | |
| dc.identifier.citation | ROCHA, Cleiton Otavio da Exaltação. Detecção de empresas potencialmente não confiáveis por meio de extratos de compras governamentais: uma aplicação com modelos de linguagem natural. 2025. 81 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador (Bahia), 2025. | pt_BR |
| dc.identifier.uri | https://repositorio.ufba.br/handle/ri/42618 | |
| dc.description.abstract | In the context of government procurement in Brazil, efficiency and continuous monitoring of expenditure represent significant challenges for public management. In 2023, the Brazilian Federal Government issued a total of 1,761,910 invoices for various types of acquisitions, resulting in an amount of R$ 76.62 billion in negotiations with private entities (TRANSPARÊNCIA, 2024). These government procurements cover a broad spectrum of the public sector, including procurement for the purchase of materials used in the construction of highways, maintenance of schools and hospitals, use of goods by public servants, among other purposes. The acquisition of these inputs is distributed in various locations throughout the country, generating a growing and diverse volume of information, present in contracts and invoices for products and services. However, these government procurements are often a fertile ground for the occurrence of collusion and fraud (OECD, 2007), such as overpricing of products, supplier monopolies, bribes to public officials, etc. The objective of this work is to compare the performance of Natural Language Processing (NLP) models in the task of detecting, based on extracts of government purchases, companies that have already been punished by government agencies, such as General Comptroller of the Union. The data used are public and periodically updated through the Federal Government's Open Data portal. The results of this work show that it is possible to use natural language models as a pre-stage of investigation of suspicious purchases, providing a classification of potentially problematic purchases that can later be evaluated by an expert, thus reducing the human workload by reducing the purchase list to a smaller and more focused amount. | pt_BR |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Federal da Bahia | pt_BR |
| dc.rights | Acesso Aberto | pt_BR |
| dc.subject | Grandes Modelos de Linguagem | pt_BR |
| dc.subject | Análise de contratos públicos | pt_BR |
| dc.subject | Transparência pública | pt_BR |
| dc.subject | Detecção de fraude | pt_BR |
| dc.subject.other | Large Language Models | pt_BR |
| dc.subject.other | Public procurement analysis | pt_BR |
| dc.subject.other | Public transparency | pt_BR |
| dc.subject.other | Fraud detection | pt_BR |
| dc.title | Detecção de empresas potencialmente não confiáveis por meio de extratos de compras governamentais: uma aplicação com modelos de linguagem natural. | pt_BR |
| dc.title.alternative | Detection of potentially untrustworthy companies through government procurement extracts: an application with natural language models. | pt_BR |
| dc.type | Dissertação | pt_BR |
| dc.publisher.program | Programa de Pós-Graduação em Ciência da Computação (PGCOMP) | pt_BR |
| dc.publisher.initials | UFBA | pt_BR |
| dc.publisher.country | Brasil | pt_BR |
| dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAO | pt_BR |
| dc.contributor.advisor1 | Gomes, Gecynalda Soares da Silva | |
| dc.contributor.advisor1ID | 0000-0002-8895-5834 | pt_BR |
| dc.contributor.advisor1Lattes | http://lattes.cnpq.br/3389510216870588 | pt_BR |
| dc.contributor.referee1 | Gomes, Gecynalda Soares da Silva | |
| dc.contributor.referee1ID | 0000-0002-8895-5834 | pt_BR |
| dc.contributor.referee1Lattes | http://lattes.cnpq.br/3389510216870588 | pt_BR |
| dc.contributor.referee2 | Souza, Marlo Vieira dos Santos e | |
| dc.contributor.referee2ID | 0000-0002-5373-7271 | pt_BR |
| dc.contributor.referee2Lattes | http://lattes.cnpq.br/8734792579019380 | pt_BR |
| dc.contributor.referee3 | Rocha, Ricardo Ferreira da | |
| dc.contributor.referee3Lattes | http://lattes.cnpq.br/0676420269735630 | pt_BR |
| dc.creator.ID | 0000-0002-5401-6636 | pt_BR |
| dc.creator.Lattes | https://lattes.cnpq.br/3086523246113941 | pt_BR |
| dc.description.resumo | No contexto das compras governamentais no Brasil, a eficiência e o monitoramento contínuo dos gastos representam desafios significativos para a gestão pública. O Governo Federal do Brasil, em 2023, emitiu um total de 1.761.910 de notas fiscais para diversos tipos de aquisições, resultando em um montante de R$ 76,62 bilhões em negociações com entidades privadas (TRANSPARÊNCIA, 2024). Essas aquisições governamentais abrangem um amplo espectro da máquina pública, incluindo aquisições para compras de materiais utilizados em construção de rodovias, manutenção de escolas e hospitais, utilização de bens pelo funcionalismo público, dentre outros fins. As aquisições desses insumos são distribuídas em diversos locais do território nacional, gerando um volume crescente e diversificado de informações, presentes em contratos e notas fiscais de produtos e serviços. No entanto, essas compras governamentais são frequentemente um campo fértil para a ocorrência de conluios e fraudes (OECD, 2007), como superfaturamento nos preços dos produtos, monopólios dos fornecedores, propina para agentes públicos, etc. O objetivo deste trabalho é comparar o desempenho de modelos de Processamento de Linguagem Natural (PLN) na tarefa de detecção, com base no extrato das compras governamentais, de empresas que já foram punidas por órgãos governamentais, como a Controladoria Geral da União (CGU). Os dados utilizados são públicos e periodicamente atualizados através do portal de Dados Abertos do Governo Federal. Os resultados deste trabalho mostram que é possível utilizar modelos de linguagem natural como uma pré-etapa de investigação de compras suspeitas, fornecendo uma classificação de compras potencialmente problemáticas e que posteriormente podem ser avaliadas por um especialista, dessa forma, reduzindo a carga de trabalho humana ao reduzir a lista de compras para uma quantidade menor e mais focalizada. | pt_BR |
| dc.publisher.department | Instituto de Computação - IC | pt_BR |
| dc.type.degree | Mestrado Acadêmico | pt_BR |