School Dropout Prediction in Computer Science Degree

Authors

  • Hiago Oliveira de Jesus Universidade do Estado do Amazonas
  • Luis Cuevas Rodriguez Universidade do Estado do Amazonas
  • Almir de Oliveira Costa Junior Universidade do Estado do Amazonas

DOI:

https://doi.org/10.5753/rbie.2021.29.0.255

Keywords:

School dropout, Educational Data Mining, Artificial Neural Network

Abstract

In the first year of the degree and throughout the Degree in Informatics, students manifest great difficulties in the programming disciplines, whether due to the lack of prior knowledge, difficulties in solving problems, logicalmathematical reasoning, abstraction, among other unknown factors. The data of the students’ school records represent relevant data to predict the risk of dropout in the Computer Science Degree Course of the educational institution of this study. In view of the high failure rates in the course subjects, the following hypothesis was raised "It is possible to predict dropout in the Computer Science Degree". This article presents an educational data mining, whose objective is to predict students at risk of dropout. This research followed the knowledge discovery methodology in the database, which consisted of selecting and preparing the data for training the predictive model of multilayer neural network. The results obtained with the predictive model were evaluated using performance evaluation metrics, with 98 % of correct answers identified students at risk of dropping out of the course.

Downloads

Download data is not yet available.

References

Alpaydin, E. (2010). Introduction to Machine Learning.The MIT Press. [GS Search]

Baepler, P., & Murdoch, C. J. (2007). Academic analytics and data mining in highereducation.International Journal for the Scholarship of Teaching and Learning,4(2). DOI: 10.20429/ijsotl.2010.040217 [GS Search]

Barber, R., & Sharkey, M. (2012). Course correction: Using analytics to predict coursesuccess.International Conference on Learning Analytics and Knowledge, 259-262. DOI: 10.1145/2330601.2330664 [GS Search]

Bramer, M. (2007). Principles of data mining. New York: Cambridge University Press. Springer. [GS Search]

Brasil (2014). Planejando a próxima década: conhecendo as 20 metas do plano nacional de educação. Ministério da Educação, MEC. [link]

Campbell, P., J. P. De Blois, & Oblinger, D. G. (2007). Academic analytics: A new tool for a new era. EDUCAUSE review,42(4), 40-57. [GS Search]

Castro, C. S., & Vilarim, G. O. (2013). Licenciatura em computação no cenário nacional: embates, institucionalização e o nascimento de um novo curso. Revista Espaço Acadêmico,13(148),18-25. [GS Search]

Chapman, P., Clinton, J., Kerber, R., Khabaza, T., Reinartz, T., Shearer, C., & Wirth, R. (2000). CRISP-DM 1.0 step-by-step data mine guide. CRISP-DM Consortium. Disponível em: [link]

CNE/CES (2016). Conselho Nacional de Educação/Câmara de Educação Superior. Resolução nº 5/2016. institui as diretrizes curriculares nacionais para os Cursos de Graduação em Computação. Ministério da Educação. Processo 23001.000026/2012-95. Parecer CNE/CES nº 136/2012. Homologação em Diário Oficial em 27 de outubro de 2016. Disponível em: [link]

CNE/CP (2015). Conselho Nacional de Educação/Conselho Pleno. Resolução nº2, de 1º de julho de 2015, que define a Diretrizes Curriculares Nacionais para a formação inicial em nível superior (cursos de licenciatura, cursos de formação pedagógica para graduados e cursos de segunda licenciatura) e para a formação continuada. Disponível em: [link]

Cohen, N. L., Koedinger, W. K., & Matsuda, N. (2011). A machine learning approach for automatic student model discovery. International Conference on Educational Data Mining, Eindhoven, 44-53. [GS Search]

Coutinho, E. F., Lima, E. T. d., & Santos, C. C. (2017). Um panorama sobre o desempenho de uma disciplina inicial de programação em um curso de graduação. Revista Tecnologias na Educação. [GS Search]

Da Cruz, M. K., Becker, F., & Hinterholz, L. (2016). Carga horária prática na formação de professores de computação e informática educativa. Anais do Workshop de Informática na Escola. DOI: 10.5753/cbie.wie.2016.698 [GS Search]

Daniel, B. K. (2016). Big data and learning analytics in higher education: Current theory andpractice. Springer. DOI: 10.1007/978-3-319-06520-5 [GS Search]

De Amo, S. (2004). Técnicas de mineração de dados. Jornada de Atualização em Informática. [GS Search]

Faceli, K., Lorena, A., Gama, J., & Carvalho, A. (2011). Inteligência artificial: Uma abordagem de aprendizado de máquina. LTC, Rio de Janeiro. Disponível em: [link]

Falcão, T. P., Araújo, D. R. B., França, R., Andrade, E. C., & César, F. (2018). Currículo da licenciatura em computação: uma proposta alinhada às novas diretrizes e demandas contemporâneas. Anais dos Workshops do Congresso Brasileiro de Informática na Educação. DOI: 10.5753/cbie.wcbie.2018.1108 [GS Search]

Feyyad, U. M., Shapiro, G. P., Smyth, P., & Uthurusamy, R. (1996). Data mining and knowledgediscovery: making sense out of data.IEEE Expert,11(5), 20-25. DOI: 10.1109/64.539013 [GS Search]

Hamalainen, W., & Vinni, M. (2010). Classifiers for educational data mining. Handbook of Educational Data Mining, Chapman Hall/CRC Data Mining and Knowledge Discovery Series. [GS Search]

Han, J., Pei, J., & Kamber, M. (2011). Data mining: concepts and techniques. Elsevier Editora Ltda. [GS Search]

Haykin, S. (2009). Neural networks and learning machines. [GS Search]

Kaski, S., & Kohonen, T. (1996). Exploratory data analysis by the self-organizing map: Structures of welfare and poverty in the world.In: CITESEER. Neural networks in financial engineering. Proceedings of the third international conference on neural networks in thecapital markets. [GS Search]

Luciano, A. P. C., & Santos, A. A. (2013). Caminhos do licenciado em computação no brasil: Estudo de mercado a partir de uma pesquisa com egressos. Anais dos Workshops do Congresso Brasileiro de Informática na Educação. DOI: 10.5753/cbie.sbie.2013.517 [GS Search]

Matos, G. F. B., E. e Silva (2012). Currículo de licenciatura em computação: uma reflexão sobre perfil de formação à luz dos referenciais curriculares da SBC. Congresso da Sociedade Brasileira de Computação. [GS Search]

Priecht, S. S., & Pazeto, T. A. (2009). Análise, sugestões e perspectivas de um curso de licenciatura em informática. Anais do Workshop sobre Educação em Informática. [GS Search]

Romero, C., & Ventura, S. (2010). Educational data mining: A review of the state of the art. IEEE Transactions on Systems, Man, and Cybernetics, Part C (Applications and Reviews), 40(6), 601-618. DOI: 10.1109/TSMCC.2010.2053532 [GS Search]

Romero, S., C. Ventura (2013). Data mining in education. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery,3(1), 12-27. DOI: 10.1002/widm.1075 [GS Search]

Santos, W. O. (2017). Mulheres na computação uma análise da participação feminina nos cursos de licenciatura em computação. Anais dos Workshops do Congresso Brasileiro de Informática na Educação. DOI: 10.5753/cbie.wcbie.2017.814 [GS Search]

SBC (2002). Sociedade Brasileira de Computação. Currículo de Referência para Cursos de Licenciatura em Computação. Versão homologada na assembleia da SBC em julho de 2002 no Congresso da Sociedade Brasileira de Computação. Disponível em: [link]

SBC (2017). Sociedade Brasileira de Computação. Referenciais de Formação para os Cursos de Graduação em Computação. Comissão de Educação da SBC. Disponível em: [link]

Silva, L. A., & Silva, L. (2014). Fundamentos de mineração de dados educacionais. Anais dos Workshops do Congresso Brasileiro de Informática na Educação. DOI: [GS Search]

Silva, L. A., Silveira, I. F., Silva, L., Ramos, J. L. C., & Rodrigues, R. L. (2017). Ciência de dados educacionais: definições e convergências entre as áreas de pesquisa. Anais dos Workshops do Congresso Brasileiro de Informática na Educação. DOI: 10.5753/cbie.wcbie.2017.764 [GS Search]

Silvestre, A. L. (2007). Análise de dados e estatística descritiva. Escolar Editora. [GS Search]

Witten, I. H., & Frank, E. (2005). Practical machine learning tools and techniques. Morgan Kaufmann Series in Data Management Systems. [GS Search]

Zaki, M. J., & Meira Junior, W. (2014). Data mining and analysis: Fundamental concepts and algorithms. New York: Cambridge University Press. [GS Search]

Published

2021-03-12

How to Cite

DE JESUS, H. O.; RODRIGUEZ, L. C.; COSTA JUNIOR, A. de O. School Dropout Prediction in Computer Science Degree. Brazilian Journal of Computers in Education, [S. l.], v. 29, p. 255–272, 2021. DOI: 10.5753/rbie.2021.29.0.255. Disponível em: https://journals-sol.sbc.org.br/index.php/rbie/article/view/2997. Acesso em: 22 nov. 2024.

Issue

Section

Special Issue :: Technical-Scientific Production in Computing Degree