Skip navigation
Universidade Federal da Bahia |
Repositório Institucional da UFBA
Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/42618
Registro completo de metadados
Campo DCValorIdioma
dc.creatorRocha, Cleiton Otavio da Exaltação-
dc.date.accessioned2025-07-28T11:01:38Z-
dc.date.available2025-07-28T11:01:38Z-
dc.date.issued2025-06-05-
dc.identifier.citationROCHA, Cleiton Otavio da Exaltação. Detecção de empresas potencialmente não confiáveis por meio de extratos de compras governamentais: uma aplicação com modelos de linguagem natural. 2025. 81 f. Dissertação (Mestrado em Ciência da Computação) - Instituto de Computação, Universidade Federal da Bahia, Salvador (Bahia), 2025.pt_BR
dc.identifier.urihttps://repositorio.ufba.br/handle/ri/42618-
dc.description.abstractIn the context of government procurement in Brazil, efficiency and continuous monitoring of expenditure represent significant challenges for public management. In 2023, the Brazilian Federal Government issued a total of 1,761,910 invoices for various types of acquisitions, resulting in an amount of R$ 76.62 billion in negotiations with private entities (TRANSPARÊNCIA, 2024). These government procurements cover a broad spectrum of the public sector, including procurement for the purchase of materials used in the construction of highways, maintenance of schools and hospitals, use of goods by public servants, among other purposes. The acquisition of these inputs is distributed in various locations throughout the country, generating a growing and diverse volume of information, present in contracts and invoices for products and services. However, these government procurements are often a fertile ground for the occurrence of collusion and fraud (OECD, 2007), such as overpricing of products, supplier monopolies, bribes to public officials, etc. The objective of this work is to compare the performance of Natural Language Processing (NLP) models in the task of detecting, based on extracts of government purchases, companies that have already been punished by government agencies, such as General Comptroller of the Union. The data used are public and periodically updated through the Federal Government's Open Data portal. The results of this work show that it is possible to use natural language models as a pre-stage of investigation of suspicious purchases, providing a classification of potentially problematic purchases that can later be evaluated by an expert, thus reducing the human workload by reducing the purchase list to a smaller and more focused amount.pt_BR
dc.languageporpt_BR
dc.publisherUniversidade Federal da Bahiapt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectGrandes Modelos de Linguagempt_BR
dc.subjectAnálise de contratos públicospt_BR
dc.subjectTransparência públicapt_BR
dc.subjectDetecção de fraudept_BR
dc.subject.otherLarge Language Modelspt_BR
dc.subject.otherPublic procurement analysispt_BR
dc.subject.otherPublic transparencypt_BR
dc.subject.otherFraud detectionpt_BR
dc.titleDetecção de empresas potencialmente não confiáveis por meio de extratos de compras governamentais: uma aplicação com modelos de linguagem natural.pt_BR
dc.title.alternativeDetection of potentially untrustworthy companies through government procurement extracts: an application with natural language models.pt_BR
dc.typeDissertaçãopt_BR
dc.publisher.programPrograma de Pós-Graduação em Ciência da Computação (PGCOMP) pt_BR
dc.publisher.initialsUFBApt_BR
dc.publisher.countryBrasilpt_BR
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::LINGUAGENS DE PROGRAMACAOpt_BR
dc.contributor.advisor1Gomes, Gecynalda Soares da Silva-
dc.contributor.advisor1ID0000-0002-8895-5834pt_BR
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/3389510216870588pt_BR
dc.contributor.referee1Gomes, Gecynalda Soares da Silva-
dc.contributor.referee1ID0000-0002-8895-5834pt_BR
dc.contributor.referee1Latteshttp://lattes.cnpq.br/3389510216870588pt_BR
dc.contributor.referee2Souza, Marlo Vieira dos Santos e-
dc.contributor.referee2ID0000-0002-5373-7271pt_BR
dc.contributor.referee2Latteshttp://lattes.cnpq.br/8734792579019380pt_BR
dc.contributor.referee3Rocha, Ricardo Ferreira da-
dc.contributor.referee3Latteshttp://lattes.cnpq.br/0676420269735630pt_BR
dc.creator.ID0000-0002-5401-6636pt_BR
dc.creator.Latteshttps://lattes.cnpq.br/3086523246113941pt_BR
dc.description.resumoNo contexto das compras governamentais no Brasil, a eficiência e o monitoramento contínuo dos gastos representam desafios significativos para a gestão pública. O Governo Federal do Brasil, em 2023, emitiu um total de 1.761.910 de notas fiscais para diversos tipos de aquisições, resultando em um montante de R$ 76,62 bilhões em negociações com entidades privadas (TRANSPARÊNCIA, 2024). Essas aquisições governamentais abrangem um amplo espectro da máquina pública, incluindo aquisições para compras de materiais utilizados em construção de rodovias, manutenção de escolas e hospitais, utilização de bens pelo funcionalismo público, dentre outros fins. As aquisições desses insumos são distribuídas em diversos locais do território nacional, gerando um volume crescente e diversificado de informações, presentes em contratos e notas fiscais de produtos e serviços. No entanto, essas compras governamentais são frequentemente um campo fértil para a ocorrência de conluios e fraudes (OECD, 2007), como superfaturamento nos preços dos produtos, monopólios dos fornecedores, propina para agentes públicos, etc. O objetivo deste trabalho é comparar o desempenho de modelos de Processamento de Linguagem Natural (PLN) na tarefa de detecção, com base no extrato das compras governamentais, de empresas que já foram punidas por órgãos governamentais, como a Controladoria Geral da União (CGU). Os dados utilizados são públicos e periodicamente atualizados através do portal de Dados Abertos do Governo Federal. Os resultados deste trabalho mostram que é possível utilizar modelos de linguagem natural como uma pré-etapa de investigação de compras suspeitas, fornecendo uma classificação de compras potencialmente problemáticas e que posteriormente podem ser avaliadas por um especialista, dessa forma, reduzindo a carga de trabalho humana ao reduzir a lista de compras para uma quantidade menor e mais focalizada.pt_BR
dc.publisher.departmentInstituto de Computação - ICpt_BR
dc.type.degreeMestrado Acadêmicopt_BR
Aparece nas coleções:Dissertação (PGCOMP)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Dissertacao_PGCOMP_Cleiton_Final.pdf5,89 MBAdobe PDFVisualizar/Abrir
Mostrar registro simples do item Visualizar estatísticas


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.