Técnicas de minería de datos y aprendizaje automático aplicadas a la deserción estudiantil: un mapeo sistemático de la literatura

Authors

DOI:

https://doi.org/10.5753/rbie.2024.3296

Keywords:

Mapeo sistemático de la literatura, Abandono estudiantil, Procesamiento de datos, Aprendizaje automático

Abstract

Este trabajo presenta un Mapeo Sistemático de la Literatura sobre la deserción estudiantil, a partir del cual buscamos responder la siguiente pregunta de investigación: ¿qué herramientas, técnicas de aprendizaje automático, factores inductores, bases de datos abiertas y métricas de evaluación de algoritmos se han utilizado para identificar las causas de la deserción estudiantil? El protocolo de mapeo se desarrolló con base en los lineamientos presentados por Petersen (2008) y Kitchenham (2004). Por tanto, consistió en definir preguntas de investigación, criterios de selección, definir cadenas de búsqueda, definir fuentes de búsqueda, entre otros elementos. Entre los resultados se destaca que la herramienta R fue la más utilizada, se destacó la clasificación entre técnicas de aprendizaje automático y los principales trabajos en el área se centraron en estudiar factores relacionados con las características individuales del estudiante. Además, se encontraron 15 bases de datos abiertas. Finalmente, las métricas de evaluación del algoritmo que destacaron son: Recall, Accuracy, and Precision. Los resultados de este mapeo brindan una visión integral del estado del arte en la investigación de la deserción estudiantil, incluidas las herramientas y técnicas más populares y los factores inductores más investigados. Los investigadores pueden utilizar los resultados de este trabajo para dirigir los esfuerzos de investigación hacia la creación de modelos utilizando los tres tipos de factores inductores y el suministro de bases de datos abiertas.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Barros, T. M., Silva, I., & Guedes, L. A. (2019). Determination of Dropout Student Profile Based on Correspondence Analysis Technique. IEEE Latin America Transactions, 17(09), 1517–1523. https://doi.org/10.1109/TLA.2019.8931146. [GS Search]

Bonaccorso, G. (2017). Machine learning algorithms. Packt Publishing Ltd. [GS Search]

Costa, E., Baker, R. S., Amorim, L., Magalhães, J., & Marinho, T. (2013). Mineração de dados

educacionais: conceitos, técnicas, ferramentas e aplicações. Jornada de Atualização em Informática na Educação, 1(1), 1–29. [GS Search]

de Campos, A., Galafassi, C., Bastiani, E., Paz, F. J., Campos, R. L., Wives, L. K., Cazella, S. C., Reategui, E. B., & Barone, D. A. C. (2020). Mineração de Dados Educacionais e Learning Analytics no contexto educacional brasileiro: um mapeamento sistemático. Informática na educação: teoria & prática, 23(3 Set/Dez). https://doi.org/https://doi.org/10.22456/1982-1654.102618 [GS Search]

Deepika, K., & Sathvanaravana, N. (2018). Analyze and predicting the student academic performance using data mining tools. 2018 Second International Conference on Intelligent Computing and Control Systems (ICICCS), 76–81. https://doi.org/10.1109/ICCONS.2018.8663197. [GS Search]

Dombrovskaia, L., José, P., & Rodrıguez, P. (2020). Prediction of student’s retention in first year of engineering program at a technological chilean university. 2020 39th International Conference of the Chilean Computer Science Society (SCCC), 1–4. https://doi.org/10.1109/SCCC51225.2020.9281195. [GS Search]

Elhorst, J. P. (2014). Matlab software for spatial panels. International Regional Science Review, 37(3), 389–405. https://doi.org/10.1177/0160017612452429. [GS Search]

Faria, S. M. S. M. L. d. (2014). Educational data mining e learning analytics na melhoria do ensino online (tese de dout.) [GS Search].

Freitas, F. A. d. S., Vasconcelos, F. F., Peixoto, S. A., Hassan, M. M., Dewan, M., Albuquerque, V. H. C. d., et al. (2020). IoT System for School Dropout Prediction Using Machine Learning Techniques Based on Socioeconomic Data . Electronics, 9(10), 1613. https://doi.org/10.3390/electronics9101613. [GS Search]

Fuzeto, R., & Braga, R. (2016). Um mapeamento sistemático em progresso sobre internet das coisas e educação à distância. Anais dos Workshops do Congresso Brasileiro de Informática na Educação, 5(1), 1334. https://doi.org/10.5753/cbie.wcbie.2016.1334. [GS Search]

German, D. M., Adams, B., & Hassan, A. E. (2013). The evolution of the R software ecosystem. 2013 17th European Conference on Software Maintenance and Reengineering, 243–252. https://doi.org/10.1109/CSMR.2013.33. [GS Search]

Grandini, M., Bagli, E., & Visani, G. (2020). Metrics for multi-class classification: an overview. arXiv preprint arXiv:2008.05756. https://doi.org/10.48550/arXiv.2008.05756. [GS Search]

Ignacio, L. F. F. (2021). Aprendizado de máquina: da teoria à aplicação. [GS Search]

Kitchenham, B. (2004). Procedures for performing systematic reviews. Keele, UK, Keele University, 33(2004), 1–26. [GS Search]

Lima, J., Alves, P., Pereira, M., & Almeida, S. (2018). Using academic analytics to predict dropout risk in engineering courses. 17th European Conference on e-Learning ECEL 2018, 316–321. [GS Search]

Lobo, M. B. d. C. M. (2012). Panorama da evasão no ensino superior brasileiro: aspectos gerais das causas e soluções. [GS Search].

Marques, L. T. (2020). Mateo: uma abordagem de descoberta de conhecimento para desvendar as causas da evasão escolar . [GS Search]

Marques, L. T., De Castro, A. F., Marques, B. T., Silva, J. C. P., & Queiroz, P. G. G. (2019). Mineração de dados auxiliando na descoberta das causas da evasão escolar: Um Mapeamento Sistemático da Literatura. Revista Novas Tecnologias na Educação, 17(3), 194–203. https://doi.org/10.22456/1679-1916.99470. [GS Search]

MEC, M. d. E. (2019). Censo da Educação Superior. [Link]

Muschelli, J. (2020). ROC and AUC with a binary predictor: a potentially misleading metric. Journal of classification, 37(3), 696–708. https://doi.org/10.1007/s00357-019-09345-1. [GS Search]

Nagy, M., & Molontay, R. (2018). Predicting dropout in higher education based on secondary school performance. 2018 IEEE 22nd international conference on intelligent engineering systems (INES), 000389–000394. https://doi.org/10.1109/INES.2018.8523888. [GS Search]

Naik, A., & Samant, L. (2016). Correlation review of classification algorithm using data mining tool: WEKA, Rapidminer, Tanagra, Orange and Knime. Procedia Computer Science, 85, 662–668. https://doi.org/10.1016/j.procs.2016.05.251 [GS Search]

Pašic, Ð., & Ku ´ cak, D. (2020). Machine learning model for detecting high school students as ˇcandidates for drop-out from a study program. 2020 43rd International Convention on Information, Communication and Electronic Technology (MIPRO), 1140–1144. https://doi.org/10.23919/MIPRO48935.2020.9245405. [GS Search]

Petersen, K., Feldt, R., Mujtaba, S., & Mattsson, M. (2008). Systematic mapping studies in software engineering. 12th International Conference on Evaluation and Assessment in Software Engineering (EASE) 12, 1–10. https://doi.org/10.14236/ewic/EASE2008. [GS Search]

Pinto, S. C. (2021). Os custos da evasão de discentes das universidades brasileiras na modalidade de ensino presencial: uma perspectiva de custos contábeis e custos econômicos.[GS Search]

Ratra, R., & Gulia, P. (2020). Experimental evaluation of open source data mining tools (WEKA and Orange). Int. J. Eng. Trends Technol, 68(8), 30–35. [GS Search]

Sari, E. Y., Sunyoto, A., et al. (2019). Optimization of Weight Backpropagation with Particle Swarm Optimization for Student Dropout Prediction. 2019 4th International Conference on Information Technology, Information Systems and Electrical Engineering (ICITISEE), 423–428. https://doi.org/10.1109/ICITISEE48480.2019.9004032. [GS Search]

Silva, I., & Moody, G. B. (2014). An open-source toolbox for analysing and processing physionet databases in matlab and octave. Journal of open research software, 2(1). < a href="https://doi.org/10.5334/jors.bi.">https: //doi.org/10.5334/jors.bi. [GS Search]

Sofyan, Y., & Kurniawan, H. (2009). Teknik Analisis Statistik terlengkap dengan Software SPSS. Salemba Infotek, Jakarta. [GS Search]

Sousa, L. R. d., Carvalho, V. O. d., Penteado, B. E., & Affonso, F. J. (2021). A systematic mapping on the use of data mining for the face-to-face school dropout problem. Proceedings. [GS Search]

Stancin, I., & Jovi ˇ c, A. (2019). An overview and comparison of free Python libraries for data ´mining and big data analysis. 2019 42nd International Convention on Information and Communication Technology, Electronics and Microelectronics (MIPRO), 977–982. https://doi.org/10.23919/MIPRO.2019.8757088. [GS Search]

Tinto, V. (1975). Dropout from higher education: A theoretical synthesis of recent research. Review of educational research, 45(1), 89–125. https://doi.org/https://doi.org/10.3102/00346543045001089

Valente, A., Holanda, M., Mariano, A. M., Furuta, R., & Da Silva, D. (2022). Analysis of Academic Databases for Literature Review in the Computer Science Education Field. 2022 IEEE Frontiers in Education Conference (FIE), 1–7. https:// doi.org/10.1109/FIE56618.2022.9962393. [GS Search]

Wen, J., Li, S., Lin, Z., Hu, Y., & Huang, C. (2012). Systematic literature review of machine learning based software development effort estimation models. Information and Software Technology, 54(1), 41–59. https://doi.org/10.1016/j.infsof.2011.09.002. [GS Search]

Archivos adicionales

Published

2024-04-25

Cómo citar

NASCIMENTO, F. F. do; DANTAS, L. C. de O.; CASTRO, A. F. de; QUEIROZ, P. G. G. . Técnicas de minería de datos y aprendizaje automático aplicadas a la deserción estudiantil: un mapeo sistemático de la literatura. Revista Brasileña de Informática en la Educación, [S. l.], v. 32, p. 270–294, 2024. DOI: 10.5753/rbie.2024.3296. Disponível em: https://journals-sol.sbc.org.br/index.php/rbie/article/view/3296. Acesso em: 4 jul. 2024.

Issue

Section

Artículos