Factors that may affect students performance in the ENEM Exam: a systematic review of the literature
DOI:
https://doi.org/10.5753/rbie.2023.3087Keywords:
ENEM, Student performance, Factors, Data analysis, Data miningAbstract
Evaluating student performance in diverse contexts is a very hard task. This is not different when discussing factors associated with student performance regarding tests such as the National High School Examination (ENEM). Several factors such as the students own knowledge acquired throughout their academic career, as well as other ones arising from their experiences, or even social or economic situation, may impact on diverse results in the test. ENEM historical data made available comprise diverse information about the individual results of students as well as answers obtained by means of questionnaires formulated at registration time. Due to the high dimensionality of the data and the complexity of analyzes that might be carried out from these datasets, an essential question is how to identify which factors are really more relevant for such analyses. Data mining techniques, such as predictive models and feature selection, have been used as a means to help obtaining such analyses. In this light, this work presents a systematic literature review in order to identify the main factors that may influence the performance of students in the ENEM test, considering studies published along the last ten years. The results obtained showed that the most relevant factors are related to socioeconomic issues, with the following attributes being most evident: family income, age, sex and race. Parents' level of education is also highlighted. Attributes related to test scores and characterization of the students' schools of origin with respect to the physical and pedagogical structure are additionally emphasized. This study points out some paths that may be accomplished on complementary research.
Downloads
References
Albuquerque, D., Tarrataca, L., Brandão, D., & Coutinho, R. (2022). A Genetic Algorithm with Flexible Fitness Function for Feature Selection in Educational Data: Comparative Evaluation. Journal of Information and Data Management, 13(3). doi: 10.5753/jidm.2022.2480. [GS Search]
Alexandrino Garcia, R., Luiz Gonçalves Rios-Neto, E., & Miranda-Ribeiro, A. de. (2021). School performance, infpastructure and teaching practice effects on secondary education in Brazil. Brazilian Journal of Population Studies, 38, 1–32. doi: 10.20947/S0102-3098a0152. [GS Search]
Alpaydin, E. (2010). Introduction to machine learning (2nd ed). MIT Press. [GS Search]
Alves, R. D., Cechinel, C., & Queiroga, E. (2018). Predição do desempenho de Matemática e Suas Tecnologias do ENEM utilizando técnicas de Mineração De Dados. Anais dos Workshops do Congresso Brasileiro de Informática na Educação, 7(1), 469. [GS Search]
Baker, R. S. J. D. (2010). Data Mining for Education. International Encyclopedia of Education, 7(3), 112-118. [GS Search]
Banni, M. R., Oliveira, M. V. dos P., & Bernardini, F. C. (2021). Uma análise experimental usando mineração de dados educacionais sobre os dados do enem para identificação de causas do desempenho dos estudantes. Anais do Workshop sobre as Implicações da Computação na Sociedade (WICS), 57–66. doi: 10.5753/wics.2021.15964. [GS Search]
Baradwaj, B. K., & Pal, S. (2012). Mining educational data to analyze students’ performance. doi: 10.48550/ARXIV.1201.3417. [GS Search]
Castro, V. G. de. (2014). Determinantes do sucesso educacional: Reflexões teóricas sobre as possibilidades de sucesso escolar em contextos de desvantagem social. Sociologias Plurais, 2(1). doi: 10.5380/sclplr.v2i1.64758. [GS Search]
Castro, M. H. G., & Tiezzi, S. (2004). A reforma do ensino médio e a implantação do Enem no Brasil. Desafios, 65(11), 46-115. [GS Search]
Cao, L. (2017). Data science: a comprehensive overview. ACM Computing Surveys (CSUR), 50(3), 1-42. doi: 10.1145/3076253. [GS Search]
Chandrashekar, G., & Sahin, F. (2014). A survey on feature selection methods. Computers & Electrical Engineering, 40(1), 16-28. doi: 10.1016/j.compeleceng.2013.11.024. [GS Search]
Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP-DM 1.0: Step-by-step data mining guide. SPSS inc, 9(13), 1-73. Recuperado de [Link]
Coutinho, F. L., Leite, R. S., & Souza Filho, S. A. (2018). Intenção em ingressar no ensino superior: Uma análise sob a perspectiva dos valores e dos fatores motivacionais. Revista Gestão Universitária na América Latina - GUAL, 122–145. doi: 10.5007/1983-4535.2018v11n3p122. [GS Search]
De Oliveira, C. G., Barwaldt, R., & Lucca, G. (2020). Análise do desempenho de pessoas com deficiência que prestaram o exame nacional do ensino médio - ENEM. #Tear: Revista de Educação, Ciência e Tecnologia, 9(1). doi: 10.35819/tear.v9.n1.a4038. [GS Search]
Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). From Data Mining to Knowledge Discovery in Databases. AI Magazine, 17(3), 37. doi: 10.1609/aimag.v17i3.1230. [GS Search]
Ferreira, L. A., Rodrigues, R. L., & Souza, R. N. P. M. de. (2021). Dados abertos educacionais brasileiros: Um mapeamento sistemático da literatura. Anais do XXXII Simpósio Brasileiro de Informática na Educação (SBIE 2021), 1186–1195. doi: 10.5753/sbie.2021.218158. [GS Search]
Ferreira, M. B., Amorim, M., Ogasawara, E., & Barbastefano, R. (2021). A interdisciplinaridade no desempenho da nota de matemática: Um olhar para evolução do processo de ensino por meio de modelos regressivos. Anais da Escola Regional de Informática do Rio de Janeiro (ERI-RJ), 41–48. doi: 10.5753/eri-rj.2021.18773. [GS Search]
Filho, J. C., Penteado, B. E., Bittencourt, I. I., & Isotani, S. (2021). Utilização de notas escolares para predição da nota ENEM em ciências humanas. RENOTE, 19(2), 223–233. doi: 10.22456/1679-1916.121211. [GS Search]
Franco, J. J., Miranda, F. L. de A., Stiegler, D., Dantas, F. R., Brancher, J. D., & Nogueira, T. do C. (2020). Usando Mineração de Dados para Identificar Fatores mais Importantes do Enem dos Últimos 22 Anos. Anais do Simpósio Brasileiro de Informática na Educid 1112–1121. doi: 10.5753/cbie.sbie.2020.1112. [GS Search]
Goldschmidt, R., Passos, E., & Bezerra, E. (2015). Data mining. Elsevier Brasil. [GS Search]
Gomes, C. M. A., Amantes, A., & Jelihovschi, E. G. (2020). Applying the regression tree method to predict students’ science achievement. Trends in Psychology, 28(1), 99–117. doi: 10.9788/s43076-019-00002-5. [GS Search]
Gomes, T., Gouveia, R., & Batista, M. C. (2017). Dados Educacionais Abertos: Associações em dados dos inscritos do Exame Nacional do Ensino Médio. Anais do Workshop de Informática na Escola, 895–904. doi: 10.5753/cbie.wie.2017.895. [GS Search]
Han, J., Kamber, M., & Pei, J. (2012). Data Mining: Concepts and Techniques. (3 ed) Elsevier Inc. (USA): Morgan Kaufmann. doi: 10.1016/C2009-0-61819-5
Harrington, P. (2012). Machine learning in action. (Vol. 5). Greenwich, CT: Manning. [GS Search]
Inep | Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Exame Nacional do Ensino Médio (Enem): Apresentação. (2022). Recuperado de: [Link]. Acesso em: 20 mar. 2023.
Inep | Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira. Exame Nacional do Ensino Médio (Enem): Microdados. 2020. Recuperado de: [Link]. Acesso em: 20 mar. 2023.
Jaloto, A., & Primi, R. (2021). Fatores socioeconômicos associados ao desempenho no Enem. Em Aberto, 34(112). doi: 10.24109/2176-6673.emaberto.34i112.5002. [GS Search]
Júnior, G. C., Nascimento, R., Alves, G., & Gouveia, R. (2017). Identificando correlações e outliers entre bases de dados educacionais. Anais dos Workshops do Congresso Brasileiro de Informática na Educação, 6(1), 694. [GS Search]
Kelleher, J. D., Mac Namee, B., & D’Arcy, A. (2020). Fundamentals of machine learning for predictive data analytics: Algorithms, worked examples, and case studies. The MIT Press. [GS Search]
Kitchenham, B. A. & Charters, S. (2007). Guidelines for performing Systematic Literature Reviews in Software Engineering (EBSE 2007-001). Keele University and Durham University Joint Report. Recuperado de: [Link]. Acesso em: 12 ago. 2022. [GS Search]
Li, X., & Patel, P. C. (2021). Weather and high-stakes exam performance: Evidence from student-level administrative data in Brazil. Economics Letters, 199, 109698. doi: 10.1016/j.econlet.2020.109698. [GS Search]
Lima, A. M. S., Florez, A. Y. C., Lescano, A. I. A., Novaes, J. V. de O., Martins, N. de F., Junior, C. T., Sousa, E. P. M. de, Junior, J. F. R., & Cordeiro, R. L. F. (2020). Analysis of ENEM’s attendants between 2012 and 2017 using a clustering approach. Journal of Information and Data Management, 11(2). doi: 10.5753/jidm.2020.2023. [GS Search]
Lima, P. D. S. N., Ambrósio, A. P. L., Ferreira, D. J., & Brancher, J. D. (2019). Análise de dados do Enade e Enem: Uma revisão sistemática da literatura. Avaliação: Revista da Avaliação da Educação Superior (Campinas), 24(1), 89–107. doi: 10.1590/s1414-40772019000100006. [GS Search]
Liu, H., & Motoda, H. (Eds.). (2007). Computational methods of feature selection. CRC Press. [GS Search]
Lucena, J. P. O., & Dos Santos, H. N. L. (2020). A relação entre desempenho no Exame Nacional do Ensino Médio e o perfil socioeconômico: Um estudo com os microdados de 2016. Revista de Gestão e Secretariado, 11(2), 1–23. doi: 10.7769/gesec.v11i2.994. [GS Search]
Markoski, A., Zancanaro, L., Guerra, P. A. C., Bertolini, C., & Silveira, S. R. (2019). Descoberta de Indicadores e Padrões nos Participantes do ENEM. Revista Eletrônica de Sistemas de Informação e Gestão Tecnológica, 10(1). Recuperado de: [Link]. [GS Search]
Martinez-Plumed, F., Contreras-Ochando, L., Ferri, C., Hernandez-Orallo, J., Kull, M., Lachiche, N., Ramirez-Quintana, M. J., & Flach, P. (2019). Crisp-dm twenty years later: From data mining processes to data science trajectories. IEEE Transactions on Knowledge and Data Engineering, 33(8), 3048–3061. doi: 10.1109/TKDE.2019.2962680. [GS Search]
Medeiros, I. C. (2021). O ciclo da inclusão digital: Social-digital-social / Digital inclusion cycle: social-digital-social. Brazilian Journal of Development, 7(8), 75705–75714. doi: 10.34117/bjdv7n8-002. [GS Search]
Melo, R. O., Freitas, A. C. de, Francisco, E. de R., & Motokane, M. T. (2022). Impacto das variáveis socioeconômicas no desempenho do Enem: Uma análise espacial e sociológica. Revista de Administração Pública, 55, 1271–1294. doi: 10.1590/0034-761220200843. [GS Search]
Miranda, P. R., & Azevedo, M. L. N. D. (2020). Fies e Prouni na expansão da educação superior brasileira: Políticas de democratização do acesso e/ou de promoção do setor privado-mercantil? Educação Formação, 5(3), e1421. doi: 10.25053/redufor.v5i15set/dez.1421. [GS Search]
Mitchell, T. M. (1997). Machine learning. McGraw-Hill.
Noguera, V., Branco, K., & Ciferri, C. (2019). Gêneros e suas nuances no ENEM. Anais do Women in Information Technology (WIT), 41–50. doi: 10.5753/wit.2019.6711. [GS Search]
Penteado, B. E. (2016). Correlational analysis between school performance and municipal indicators in brazil supported by linked open data. Proceedings of the 25th International Conference Companion on World Wide Web - WWW ’16 Companion, 507–512. doi: 10.1145/2872518.2890459. [GS Search]
Pimentel, J. S., Ospina, R., & Ara, A. (2021). Learning time acceleration in support vector regression: A case study in educational data mining. Stats, 4(3), 682–700. doi: 10.3390/stats4030041. [GS Search]
Rahman, Md. M., Watanobe, Y., Matsumoto, T., Kiran, R. U., & Nakamura, K. (2022). Educational data mining to support programming learning using problem-solving data. IEEE Access, 10, 26186–26202. doi: 10.1109/ACCESS.2022.3157288. [GS Search]
Ramos, J., Rodrigues, R., Silva, J., & Oliveira, P. (2020). CRISP-EDM: uma proposta de adaptação do Modelo CRISP-DM para mineração de dados educacionais. In Anais do XXXI Simpósio Brasileiro de Informática na Educação, (pp. 1092-1101). Porto Alegre: SBC. doi: 10.5753/cbie.sbie.2020.1092. [GS Search]
Romero, C., Romero, J. R., & Ventura, S. (2014). A survey on pre-processing educational data. Em A. Peña-Ayala (Org.), Educational Data Mining (Vol. 524, p. 29–64). Springer International Publishing. doi: 10.1007/978-3-319-02738-8_2. [GS Search]
Santos, B., Oliveira, C. G., Topin, L. O. H., Mendizabal, O. M., & Barwaldt, R. (2019). Analysis of candidates profile for the national entrance exams for admission to brazilian universities. 2019 IEEE Frontiers in Education Conference (FIE), 1-8. doi: 10.1109/FIE43999.2019.9028381. [GS Search]
Silva Filho, R. L. C., & Adeodato, P. J. L. (2019). Data mining solution for assessing the secondary school students of brazilian federal institutes. 2019 8th Brazilian Conference on Intelligent Systems (BRACIS), 574–579. doi: 10.1109/BRACIS.2019.00106. [GS Search]
Silva, L. A., Morino, A. H., & Sato, T. M. C. (2014). Prática de mineração de dados no exame nacional do ensino médio. Anais dos Workshops do Congresso Brasileiro de Informática na Educação, 3(1), 651. [GS Search]
Silva, V. A. A. da, Moreno, L. L. O., Gonçalves, L. B., Soares, S. S. R. F., & Júnior, R. R. S. (2020). Identificação de Desigualdades Sociais a partir do desempenho dos alunos do Ensino Médio no ENEM 2019 utilizando Mineração de Dados. Anais do Simpósio Brasileiro de Informática na Educação, 72–81. doi: 10.5753/cbie.sbie.2020.72. [GS Search]
Soares, R. D. C., Neto, N. W., Coutinho, L. R., e Silva, F. J. D. S., dos Santos, D. V., & Teles, A. S. (2021). Mineração de dados da educação básica brasileira usando as bases do INEP: Uma revisão sistemática da literatura. RENOTE, 19(1), 361–370. doi: 10.22456/1679-1916.118526. [GS Search]
Stearns, B., Rangel, F., Firmino, F., Rangel, F., & Oliveira, J. (2017). Prevendo Desempenho dos Candidatos do ENEM Através de Dados Socioeconômicos. In Anais do XXXVI Concurso de Trabalhos de Iniciação Científica da SBC. Porto Alegre: SBC. [GS Search]
Vinicios do Carmo, R., Felipe Heckler, W., & Varella de Carvalho, J. (2021). Uma Análise do Desempenho dos Estudantes do Rio Grande do Sul no ENEM 2019. RENOTE, 18(2), 378–387. doi: 10.22456/1679-1916.110257. [GS Search]
Additional Files
Published
How to Cite
Issue
Section
License
Copyright (c) 2023 Janderson Ferreira Dutra, João Batista Firmino Júnior, Damires Yluska de Souza Fernandes
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.