Educational Data Mining Process applied to Student Performance Prediction: A comparison between Machine Learning and Deep Learning Techniques


  • Vanessa Faria de Souza UFRGS
  • Tony Carlos Bignardi dos Santos UFRGS



Educational Data Mining, Deep Learning, Machine Learning, Performance Prediction


With the increase in the availability of data, especially in the educational context, specific areas have emerged for the extraction of relevant information, such as Educational Data Mining (EDM), which integrates numerous techniques that support the capture, processing and analysis of these sets of records. The main technique associated with MDE is Machine Learning (ML), which has been used for decades in data processing in different contexts, but with the technological evolution other techniques have stood out such as Deep Learning (DL), based on the application of Multilayer Artificial Neural Networks. With a focus on this context, this study aims to predict the performance of students, using a set of public data, and to compare ML and DL techniques, in addition to indicating which are the main predictive attributes for student performance. For this, an EDM process based on 4 steps was implemented: 1) Data collection; 2) Resource extraction and data cleaning (pre-processing and transformation); 3) Analytical processing and algorithms; and 4) Analysis and interpretation of results. As a result, it was identified that the models generated from the traditional ML algorithms have a good performance, but inferior to the DL model, which had an accuracy of 94%, and it was found that attributes related to school activities are more predictive for the performance of students. students than data on demographic and socioeconomic characteristics. Keywords: Educational Data Mining, Deep Learning, Machine Learning, Performance Prediction.


Author Biographies

Vanessa Faria de Souza, UFRGS

Doutoranda no PPGIE (Programa de Pós-Graduação em Informática na Educação) da Universidade Federal do Rio Grande do Sul (UFRGS). Mestre em Informática pelo PPGI (Programa de Pós-Graduação em Informática) da Universidade Tecnológica Federal do Paraná (UTFPR), na área de Computação Aplicada, e ênfase em Engenharia de Software. Possuo especialização em Educação Especial Inclusiva, com ênfase em Tecnologia Assistiva. Sou graduada em Sistemas de Informação pela Universidade Estadual do Norte do Paraná (2011). Completei a Licenciatura em Matemática, pela UTFPR. Atualmente sou professora dedicação exclusiva no Instituto Federal do Rio Grande do Sul, Campus Ibirubá nos Cursos de Ciência da Computação e no Técnico em Informática Integrado do Ensino Médio o qual estou atualmente como Coodenadora. Também já Atuei como Professora do Magistério Superior na Universidade Estadual do Norte do Paraná (UENP) nos cursos de Graduação Ciência da Computação e Sistemas de informação, nas disciplinas de Sistemas Digitais, Projeto e Análise de Algoritmo, Tópicos Avançados em Computação, Computação Simbólica e Numérica, Metodologia Científica. Assim como na UTFPR. Também já atuei como professora de Matemática no Ensino Básico.

Tony Carlos Bignardi dos Santos, UFRGS

Professor do IFMS no Campus Coxim (2012) e estudante do Doutorado em Informática na Educação pela UFRGS (2019). Possui graduação em Sistemas de Informação pela UFMS (2007), pós-graduação em Docência para a Educação Profissional, Científica e Tecnológica pelo IFMS (2015) e mestrado em Arquitetura de Computadores pela UFMS-FACOM (2016).


SOUZA, V. F. de; SANTOS, T. C. B. dos. Educational Data Mining Process applied to Student Performance Prediction: A comparison between Machine Learning and Deep Learning Techniques. Brazilian Journal of Computers in Education, [S. l.], v. 29, p. 519–546, 2021. DOI: 10.5753/rbie.2021.29.0.519. Disponível em: Acesso em: 18 oct. 2024.


