Skip navigation
Universidade Federal da Bahia |
Repositório Institucional da UFBA
Use este identificador para citar ou linkar para este item: https://repositorio.ufba.br/handle/ri/43667
Tipo: Dissertação
Título: Modelo de regressão logística geograficamente ponderada semi-paramétrico aplicado na concessão de crédito
Título(s) alternativo(s): Semi-parametric geographically weighted logistic regression model applied to credit granting
Autor(es): Boaventura, Brenda Lima
Primeiro Orientador: Fiaccone, Rosemeire Leovigildo
Segundo Orientador: Silva, Paulo Henrique Ferreira da
metadata.dc.contributor.referee1: Fiaccone, Rosemeire Leovigildo
metadata.dc.contributor.referee2: Nascimento, Diego Carvalho do
metadata.dc.contributor.referee3: Samejima, Kim Nakamura
Resumo: A Regressão Logística (RL) é amplamente utilizada na mensuração do risco de crédito por modelar a relação entre uma variável resposta binária e um conjunto de preditores. Entretanto, a aplicação tradicional dessa técnica ignora aspectos fundamentais presentes em contextos geográficos heterogêneos, como a variação espacial dos determinantes do risco e a autocorrelação entre observações próximas, fenômenos recorrentes em dados socioeconômicos de países desiguais como o Brasil. Este estudo busca superar essa limitação por meio da utilização da Regressão Logística Geograficamente Ponderada (RLGP), que permite incorporar efeitos locais na análise da concessão de crédito, ponderando as observações segundo a proximidade geográfica. Além disso, propõe-se uma versão semiparamétrica (S-RLGP), que trata algumas variáveis como de efeito global e outras como de efeito local, proporcionando maior flexibilidade e interpretabilidade ao modelo. A estimação foi realizada com base em 3.200 registros de clientes de um correspondente bancário distribuídos por 13 municípios da região metropolitana de Salvador-BA, abrangendo apenas credores com créditos ativos — isto é, clientes adimplentes ou inadimplentes (atraso superior a 90 dias) — no período de 2019. O objetivo principal da pesquisa é avaliar o impacto da heterogeneidade e da autocorrelação espacial na modelagem do risco de crédito, investigando de que forma esses aspectos influenciam a probabilidade de inadimplência e podem evitar decisões inadequadas que subestimem ou superestimem riscos em determinadas localidades. Para tanto, comparam-se três modelos: RL, RLGP e S-RLGP. As variáveis independentes contemplam indicadores macroeconômicos (taxa Selic e taxa de desemprego), dados demográficos (idade e grau de instrução) e características dos contratos de crédito (prazo de empréstimo). Os resultados indicam que os modelos espaciais (RLGP e S-RLGP) apresentam ajuste superior ao modelo global, com menores valores de AIC e BIC e maior acurácia na classificação da inadimplência. Observa-se aumento da sensibilidade para detecção de inadimplentes de 65\% no modelo global para 70\% no S-RLGP. A análise dos coeficientes locais revela que variáveis macroeconômicas, como taxa Selic e taxa de desemprego, possuem efeitos que variam significativamente entre municípios, enquanto as variáveis demográficas mostram maior homogeneidade espacial. A abordagem semiparamétrica aprimora a modelagem ao identificar que apenas a idade deve ser tratada como efeito global, contribuindo para maior flexibilidade e interpretabilidade sem comprometer o desempenho. Conclui-se que considerar efeitos espaciais e heterogeneidade local é essencial para modelar com maior precisão o risco de crédito em regiões diversas. O modelo S-RLGP oferece suporte para decisões de crédito mais justas e eficazes, ajustadas às especificidades socioeconômicas regionais, contribuindo para a redução dos riscos de inadimplência.
Abstract: Logistic Regression (LR) is widely used in credit risk assessment as it models the relationship between a binary response variable and a set of predictors. However, the traditional application of this technique overlooks fundamental aspects present in geographically heterogeneous contexts, such as spatial variation of risk determinants and autocorrelation among nearby observations, which are common in socioeconomic data of unequal countries like Brazil. This study addresses this limitation through the use of Geographically Weighted Logistic Regression (GWLR), which incorporates local effects into credit analysis by weighting observations according to geographic proximity. In addition, a semi-parametric version (S-GWLR) is proposed, treating some variables as global and others as local, providing greater flexibility and interpretability. Estimation was performed using 3,200 records from clients of a banking correspondent distributed across 13 municipalities in the metropolitan region of Salvador, Brazil, including only active credit holders — that is, clients who were either current or delinquent (over 90 days past due) — during 2019. The main objective of this research is to evaluate the impact of spatial heterogeneity and autocorrelation on credit risk modeling, investigating how these aspects influence the probability of default and help avoid decisions that may under- or overestimate risks in specific locations. To this end, three models were compared: LR, GWLR, and S-GWLR. Independent variables included macroeconomic indicators (Selic rate and unemployment rate), demographic data (age and education level), and credit contract characteristics (loan term). Results indicate that spatial models (GWLR and S-GWLR) provide superior fit compared to the global model, with lower AIC and BIC values and higher accuracy in classifying defaults. Sensitivity for detecting defaulters increased from 65\% in the global model to 70\% in the S-GWLR. Analysis of local coefficients revealed that macroeconomic variables, such as Selic and unemployment rates, exhibit significant variation across municipalities, while demographic variables are more spatially homogeneous. The semi-parametric approach improves modeling by identifying that only age should be treated as a global effect, enhancing flexibility and interpretability without compromising performance. In summary, considering spatial effects and local heterogeneity is essential for accurately modeling credit risk in diverse regions. The S-GWLR model supports fairer and more effective credit decisions tailored to regional socioeconomic specificities, contributing to the reduction of default risks.
Palavras-chave: Autocorrelação espacial
Concessão de crédito
Heterogeneidade espacial
Modelo semi-paramétrico
Regressão Logística Geograficamente Ponderada (RLGP)
CNPq: CNPQ::CIENCIAS EXATAS E DA TERRA
CNPQ::CIENCIAS EXATAS E DA TERRA::MATEMATICA
CNPQ::CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::ESTATISTICA
Idioma: por
País: Brasil
Editora / Evento / Instituição: Universidade Federal da Bahia
Sigla da Instituição: UFBA
metadata.dc.publisher.department: Instituto de Matemática
metadata.dc.publisher.program: Pós-Graduação em Matemática (PGMAT) 
Citação: BOAVENTURA, Brenda Lima. Modelo de regressão logística geograficamente ponderada semi-paramétrico aplicado na concessão de crédito. 2025. 92 f. Dissertação (Mestrado em Matemática) Instituto de Matemática e Estatística, Universidade Federal da Bahia, Salvador, 2025.
Tipo de Acesso: Acesso Aberto
URI: https://repositorio.ufba.br/handle/ri/43667
Data do documento: 7-Ago-2025
Aparece nas coleções:Dissertação (PGMAT)

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
Mestrado_Brenda_Boaventura.pdf3,87 MBAdobe PDFVisualizar/Abrir
Mostrar registro completo do item Visualizar estatísticas


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.