Machine Learning Aplicado ao Resultado de Pedido de Concessão de Benefícios do INSS – Análise Ampliada

Authors

  • Ney Barchilon Pontifícia Universidade Católica (PUC-Rio)
  • Tatiana Escovedo Pontifícia Universidade Católica (PUC-Rio)
  • Kalinowski Pontifícia Universidade Católica (PUC-Rio)

DOI:

https://doi.org/10.5753/isys.2022.2224

Keywords:

Algoritmos, Aprendizado de Máquina, Modelos, Predição, Previdência

Abstract

A materialização da proteção social, prevista no capítulo da Seguridade Social da Constituição do Brasil, especificamente no âmbito da Previdência, se dá através da concessão e manutenção de benefícios a todos os brasileiros que necessitem dessa proteção. Esse direito gera uma demanda enorme de milhões de requisições de benefícios anuais ao INSS (Instituto Nacional de Seguridade Social), que é o operador desses serviços. Receber e analisar os pedidos de benefícios, em tempo hábil e com assertividade, é algo complexo e desafiador. O volume de milhões de pedidos de benefícios anuais, a diversidade de benefícios disponíveis, diferentes critérios de concessão e a urgência que a natureza desses pedidos exige para a manutenção da vida dos requerentes, expressam esse ambiente complexo e desafiador. Dentro deste contexto, o presente estudo vem no sentido de desenvolver alguns modelos, utilizando técnicas de aprendizado de máquina, e selecionar o melhor deles, que possa predizer se determinada requisição de benefício será concedida ou indeferida. Essa predição ajudaria na análise de novos pedidos de benefício, abrindo espaço para que a dinâmica do processo de análise possa ser direcionada de forma mais ágil e assertiva. A fonte de dados para a construção dos modelos, neste trabalho, foi obtida no Portal de Dados Abertos do INSS, que constam do Plano de Dados Abertos do INSS. Esse conjunto de dados é composto de arquivos mensais de Benefícios Decididos (Concedidos e Indeferidos) no período de dezembro de 2018 a junho de 2020. Como escopo de análise, foram abordados algoritmos como KNN, SVC, Árvores de Decisão, Regressão Logística etc. Também foram construídos modelos que utilizam as técnicas de Ensemble Bagging e Boosting, chegando a um conjunto de dezessete algoritmos analisados. O algoritmo que obteve o melhor desempenho, utilizando a métrica F1 como determinante, foi o Classificador eXtreme Gradient Boosting (XGB) com 80%. Com este, o modelo realiza a predição com aproximadamente 84% de Precisão, 76% de Sensibilidade e 81% para AUC (Area Under the Curve). Como resultado do estudo, obteve-se um modelo capaz de efetuar a predição se determinado requerimento de benefício seria concedido ou indeferido, com base nos dados de requerimento, com uma performance dentro das expectativas estabelecidas nos objetivos. Portanto, este artigo analisou dezessete algoritmos de aprendizado de máquina com o objetivo de construir um modelo para predizer se determinada requisição de benefício ao INSS será concedida ou indeferida. Destacamos como contribuição desse artigo ao SI, a iniciativa da aplicação de um modelo de aprendizado de máquina em um domínio ainda não explorado por outras pesquisas, utilizando, como fonte de dados, os dados abertos disponibilizados pelo governo federal na nuvem. Espera-se que o resultado desse estudo abra espaço para que novas pesquisas científicas, no campo da aprendizagem de máquina, sejam desenvolvidas nesse domínio com o objetivo de ajudar nos problemas reais dessa parte sensível da vida dos brasileiros e da administração pública.

Downloads

Não há dados estatísticos.

Referências

Bhatt, U., Xiang, A., Sharma, S., Weller, A., Taly, A., Jia, Y., Ghosh, J., Puri, R., Moura, J.M., Eckersley, P. (2020) “Explainable machine learning in deployment”. In: Proceedings of the 2020 Conference on Fairness, Accountability, and Transparency, pp 648–657, Disponível em: [link], Acessado em: 08/08/2021.

Barchilon, N. e Escovedo, T. (2021) “Machine Learning Applied to the INSS Benefit Request”. In: XVII Brazilian Symposium on Information Systems (SBSI).

Casalicchio G., Molnar C., Bischl, B. (2019) “Visualizing the Feature Importance for Black Box Models”. Lect Notes Comput Sci 11051:655–670, Disponível em: [link]. Acessado em: 08/08/2021.

Cunha, J.P.Z. (2019). “Um estudo comparativo das técnicas de validação cruzada aplicadas a modelos mistos”. Dissertação de Mestrado. Instituto de Matemática e Estatística, USP. São Paulo, 2019. Disponível em [link]. Acessado em: 10/09/2020.

CNJ (2020), “A judicialização de benefícios previdenciários e assistenciais / Instituto de Ensino e Pesquisa (INSPER)”, Relatório Final de Pesquisa, Conselho Nacional de Justiça - CNJ, Disponível em [link]. Acessado em 08/05/2020.

Developers (2020) “XGBoost Documentation”, Disponível em: [link]. Acessado em: 08/08/2021.

DOU (2015), “INSTRUÇÃO NORMATIVA Nº 77, DE 21 DE JANEIRO DE 2015”, Diário Oficial da União, 21/01/2015, Disponível em [link]. Acessado em 08/05/2020.

EBC (2020), “INSS realiza força-tarefa para agilizar concessão de benefícios”, EBC – Empresa Brasileira de Notícias - Agência Brasil, 11/01/2020, 2020, Disponível em [link]. Acessado em 08/05/2020.

Escovedo, T. e Koshiyama, A. (2020), “Introdução a Data Science – Algoritmos de Machine Learning e métodos de análise”, Casa do Código.

Estadão, Jornal 2020, “Tribunal manda INSS cumprir prazo na análise de pedidos de benefícios”, Estadão, 12/02/2020, Disponível em: [link]. Acessado em: 08/05/2020.

Geron, A. (2019), “Mãos à Obra: Aprendizado de Máquina com Scikit-Learn &TensorFlow”, Editora Alta Books; Edição: 1.

Grus, J. (2016), “Data Science do Zero”, Editora Alta Books.

INSS (2018), “89,7 mil benefícios foram concedidos de forma automática pelo INSS”, Ministério da Economia - INSS, Disponível em [link]. Acessado em 08/05/2020.

INSS Dados (2020), “Conjunto de Dados Abertos”, Ministério da Economia - INSS, Disponível em [link]. Acessado em 20/05/2020.

INSS Atendimento (2020), “INSS suspende atendimento presencial nas suas agências em todo o país”, Ministério da Economia - INSS, Disponível em [link]. Acessado em 08/05/2020.

INSS (2017), “Institucional”, Ministério da Economia - INSS, Disponível em: [link]. Acessado em: 10/05/2020.

INSS 2019, “Resultado do Regime Geral de Previdência Social – RGPS”, Ministério da Economia - INSS - Secretaria de Previdência - Subsecretaria do Regime Geral de Previdência Social, Disponível em: [link]. Acessado em: 08/05/2020.

INSS Notificação (2020), “INSS inicia notificação de beneficiários após revisão administrativa”, Ministério da Economia - INSS, 2020, Disponível em [link]. Acessado em 05/09/2020.

INSS Plano (2020), “Plano de Dados Abertos - Julho/2016-Julho/2018”, Ministério da Economia -INSS, Disponível em [link]. Acessado em 08/05/2020.

INSS Resolução (2019), “Resolução publicada pelo INSS vai acelerar concessão de benefícios”, 12/08/2019, Disponível em [link]. Acessado em 08/05/2020.

INSS Fraudes (2019), “Medida provisória combate fraudes e melhora a qualidade dos gastos na Previdência”, Ministério da Economia - INSS, Disponível em [link]. Acessado em: 10/05/2020.

INSS Boletim (2020), “Boletim Estatístico da Previdência Social - Volume 25 Nr 4”, Ministério da Economia - Secretaria de Políticas de Previdência Social, Abril 2020, Disponível em [link]. Acessado em: 10/05/2020.

INSS Treinamento (2019), “Instituto Nacional do Seguro Social, Treinamento em Serviço em Reconhecimento Inicial de Direito e Cadastro para Concessores”, Ministério da Economia - INSS, Disponível em [link]. Acessado em 20/05/2020.

IPEA 2009, “Acompanhamento e análise - Vinte Anos da Constituição Federal - Volume 1”, IPEA - Diretoria de Estudos e Políticas Sociais, Políticas Sociais, Disponível em: [link]. Acessado em: 10/05/2020.

Lundberg, S. e Lee, S.I. (2017). “A Unified Approach to Interpreting Model Predictions”, Disponível em: [link]. Acessado em: 08/08/2021.

Mitchel, T. (1997), “Machine Learning”. New York; McGraw-Hill Science/Engineering/Math; (March 1, 1997).

Molnar, C. (2019) "Interpretable machine learning. A Guide for Making Black Box Models Explainable", Disponível em: [link]. Acessado em: 08/05/2020.

MP-DF 2019, “Ação Civil Pública“, Ministério Público Federal, Procuradoria da República no DF, 31/07/2019, Disponível em: [link]. Acessado em: 02/05/2020.

Pacheco Junior, João Carlos. Modelos para detecção de fraudes utilizando técnicas de aprendizado de máquina / João Carlos Pacheco Junior. - 2019. Disponível em: [link]. Acessado em: 02/05/2020.

Rangel, L. A. e Caetano, M.A.R. (2015), “Previdência Social, Políticas Sociais: Acompanhamento e Análise”, Artigos - Nr 2, IPEA, Disponível em: [link]. Acessado em: 10/05/2020.

Senado Federal (2008), “Direitos da Seguridade Social”, Coleção Direitos Sociais - Volume II, Lei Orgânica da Seguridade Social - Lei nº8212 de 24/07/1991 / PL - Poder Legislativo Federal (D.O.U. 25/07/1991), Disponível em: [link]. Acessado em: 10/05/2020.

Tesouro (2019), “Boletim Resultado do Tesouro Nacional (RTN)”, Ministério da Economia – Secretaria Especial de Fazenda - Secretaria do Tesouro Nacional, Disponível em: [link]. Acessado em: 08/05/2020.

Downloads

Published

2022-10-18

Como Citar

Barchilon, N., Escovedo, T., & Kalinowski, M. (2022). Machine Learning Aplicado ao Resultado de Pedido de Concessão de Benefícios do INSS – Análise Ampliada. ISys - Revista Brasileira De Sistemas De Informação, 15(1), 5:1–5:28. https://doi.org/10.5753/isys.2022.2224

Issue

Section

Versões estendidas de artigos selecionados