School Dropout Prediction Model Based on Undergraduate Course Self-Assessment Data

Authors

  • Ronei dos Santos Oliveira Instituto Federal de Educação, Ciência e Tecnologia da Paraíba, campus João Pessoa https://orcid.org/0009-0008-3261-437X
  • Francisco Petronio Alencar de Medeiros Instituto Federal de Educação, Ciência e Tecnologia da Paraíba, campus João Pessoa https://orcid.org/0000-0003-2955-6785

DOI:

https://doi.org/10.5753/rbie.2024.3542

Keywords:

School dropout, Educational data mining, Predictive model, Self-evaluation

Abstract

School dropout is a daily challenge for educational institutions. In the specific case of higher education, high dropout rates lead to financial losses and a shortage of professionals in the market. This research aimed to develop and evaluate a predictive model to identify students prone to dropout, using data from a semester-based self-assessment model of undergraduate courses at Federal University of Paraíba (UFPB). The study analyzed the relationship between school dropout and institutional self-assessment by utilizing educational data mining and the CRISP-DM methodology, followed by exploratory analysis and data preparation for classification. Various modeling techniques, such as Decision Trees, Random Forest, and Support Vector Machines, were applied, with the models evaluated using performance metrics, revealing an accuracy of 87.97%, precision of 91.72%, recall of 91.67%, and F-measure of 91.57% in identifying students with a high probability of dropout. Approximately 59% of active students at UFPB, admitted from 2017 onwards, showed a high probability of abandoning their courses in the proposed predictive model tests. This information can support institutional decisions and the implementation of effective policies and actions against dropouts, aiming to improve academic outcomes. The study contributes to advancements in predicting school dropout, providing valuable insights for decision-making and preventive strategies in UFPB and other higher education institutions.

Downloads

Download data is not yet available.

References

Alban, M., & Mauricio, D. (2019). Predicting university dropout through data mining: A Systematic Literature. Indian Journal of Science and Technology, 12(4), 1-12. [GS Search]

ANDIFES, A., ABRUEM, A., & SESu/MEC, S. (1996). Diplomação, retenção e evasão nos cursos de graduação em instituições de ensino superior públicas: resumo do relatório apresentado a ANDIFES, ABRUEM e SESu/MEC pela Comissão Especial. Avaliação: Revista Da Avaliação Da Educação Superior, 1(2). Recuperado de [Link]. [GS Search]

Baggi, C. A. D. S., & Lopes, D. A. (2011). Evasão e avaliação institucional no ensino superior: uma discussão bibliográfica. Avaliação: Revista da Avaliação da Educação Superior (Campinas), 16(02), 355-374. [GS Search]

Baker, R., Isotani, S., & Carvalho, A. (2011). Mineração de dados educacionais: Oportunidades para o brasil. Revista Brasileira de informática na educação, 19(02), 03. [GS Search]

Batista, G. E., Prati, R. C., & Monard, M. (2004). A study of the behavior of several methods for balancing machine learning training data. ACM SIGKDD explorations newsletter, 6(1), 20-29. DOI: https://doi.org/10.1145/1007730.1007735. [GS Search]

Bolón-Canedo, V., Sánchez-Maroño, N., & Alonso-Betanzos, A. (2013). A review of feature selection methods on synthetic data. Knowledge and information systems, 34, 483-519. DOI: https://doi.org/10.1007/s10115-012-0487-8. [GS Search]

Costa, F. J., Dias, J. J. L. Avaliação da formação superior pelo discente: proposta de um instrumento. Avaliação: Revista da Avaliação da Educação Superior (Campinas), v. 25, n. 2, p. 275–296, maio 2020. DOI: https://doi.org/10.1590/S1414-4077/S1414-40772020000200003. [GS Search]

dos Santos, V. H. B., Saraiva, D. V., & de Oliveira, C. T. (2021). Uma análise de trabalhos de mineração de dados educacionais no contexto da evasão escolar. In Anais do XXXII Simpósio Brasileiro de Informática na Educação (pp. 1196-1210). SBC. DOI: https://doi.org/10.5753/sbie.2021.218167. [GS Search]

Gamba, E., & Righetti, S. (2022). Em crise, universidades federais participam de mais da metade da produção científica. Folha de São Paulo. Recuperado de [Link]

Géron, A. (2019). Mãos à Obra: Aprendizado de Máquina com Scikit-Learn & TensorFlow. Alta Books. [GS Search]

Hastie, T., Tibshirani, R., Friedman, J. H., & Friedman, J. H. (2009). The elements of statistical learning: data mining, inference, and prediction (Vol. 2, pp. 1-758). New York: springer. [GS Search]

Joshi, A. V. (2020). Machine Learning and Artificial Intelligence. Springer. [GS Search]

Lottering, R., Hans, R., & Lall, M. (2020). A model for the identification of students at risk of dropout at a university of technology. In 2020 International Conference on Artificial Intelligence, Big Data, Computing and Data Communication Systems (icABCD) (pp. 1-8). IEEE. DOI: https://doi.org/10.1109/icABCD49160.2020.9183874. [GS Search]

Louppe, G. (2014). Understanding random forests: From theory to practice. arXiv preprint arXiv:1407.7502. DOI: https://doi.org/10.48550/arXiv.1407.7502. [GS Search]

Lousrhania, L. (2021). Universidades públicas lideram ranking brasileiro de patentes. Rádio Agência Nacional. Recuperado de [Link]

Manrique, R., Nunes, B. P., Marino, O., Casanova, M. A., & Nurmikko-Fuller, T. (2019). An analysis of student representation, representative features and classification algorithms to predict degree dropout. In Proceedings of the 9th International Conference on Learning Analytics & Knowledge (pp. 401-410). DOI: https://doi.org/10.1145/3303772.3303800. [GS Search]

Mapa do Ensino Superior no Brasil – 13ª Edição. Instituto Semesp, 2023. Recuperado de [Link]

Pereira, R. T., & Zambrano, J. C. (2017). Application of decision trees for detection of student dropout profiles. In 2017 16th IEEE international conference on machine learning and applications (ICMLA) (pp. 528-531). IEEE. DOI: https://doi.org/10.1109/ICMLA.2017.0-107. [GS Search]

Prestes, E. M. D. T., & Fialho, M. G. D. (2018). Evasão na educação superior e gestão institucional: o caso da Universidade Federal da Paraíba. Ensaio: Avaliação e Políticas Públicas em Educação, 26, 869-889. DOI: https://doi.org/10.1590/S0104-40362018002601104. [GS Search]

Rafiq, M. A., Rabbi, A. M., & Ahammad, R. (2021, June). A data science approach to Predict the University Students at risk of semester dropout: Bangladeshi University Perspective. In 2021 5th International Conference on Trends in Electronics and Informatics (ICOEI) (pp. 1350-1354). IEEE. DOI: https://doi.org/10.1109/ICOEI51242.2021.9453067. [GS Search]

Ramos, J. L. C., Rodrigues, R. L., Silva, J. C. S., & de Oliveira, P. L. S. (2020, November). CRISP-EDM: uma proposta de adaptação do Modelo CRISP-DM para mineração de dados educacionais. In Anais do XXXI Simpósio Brasileiro de Informática na Educação (pp. 1092-1101). SBC. DOI: https://doi.org/10.5753/cbie.sbie.2020.1092. [GS Search]

Saccaro, A., França, M. T. A., & Jacinto, P. D. A. (2019). Fatores Associados à Evasão no Ensino Superior Brasileiro: um estudo de análise de sobrevivência para os cursos das áreas de Ciência, Matemática e Computação e de Engenharia, Produção e Construção em instituições públicas e privadas. Estudos Econômicos (São Paulo), 49, 337-373. DOI: https://doi.org/10.1590/0101-41614925amp. [GS Search]

Santos, C. H. D., de Lima Martins, S., & Plastino, A. (2021). É Possível Prever Evasão com Base Apenas no Desempenho Acadêmico?. In Anais do XXXII Simpósio Brasileiro de Informática na Educação (pp. 792-802). SBC. DOI: https://doi.org/10.5753/sbie.2021.218105. [GS Search]

Saraiva, D., Pereira, S., Gallindo, E., Braga, R., & Oliveira, C. (2019, July). Uma proposta para prediçao de risco de evasao de estudantes em um curso técnico em informática. In Anais do XXVII Workshop sobre Educaçao em Computaçao (pp. 319-333). SBC. DOI: https://doi.org/10.5753/wei.2019.6639. [GS Search]

Sukhbaatar, O., Ogata, K., & Usagawa, T. (2018). Mining educational data to predict academic dropouts: a case study in blended learning course. In TENCON 2018-2018 IEEE region 10 conference (pp. 2205-2208). IEEE. DOI: https://doi.org/10.1109/TENCON.2018.8650138. [GS Search]

Verikas, A., Gelzinis, A., & Bacauskiene, M. (2011). Mining data with random forests: A survey and results of new tests. Pattern recognition, 44(2), 330-349. DOI: https://doi.org/10.1016/j.patcog.2010.08.011. [GS Search]

Published

2024-01-09

How to Cite

OLIVEIRA, R. dos S.; MEDEIROS, F. P. A. de. School Dropout Prediction Model Based on Undergraduate Course Self-Assessment Data. Brazilian Journal of Computers in Education, [S. l.], v. 32, p. 1–21, 2024. DOI: 10.5753/rbie.2024.3542. Disponível em: https://journals-sol.sbc.org.br/index.php/rbie/article/view/3542. Acesso em: 21 nov. 2024.

Issue

Section

Articles