Mining Data to Understand Influence Factors of Educational Quality in Maranhão
DOI:
https://doi.org/10.5753/rbie.2023.2831Keywords:
Educational Data Mining, Maranhão, Education, Correlation Analysis, Factor Analysis, Regression, Decision TreeAbstract
The state of Maranhão has low levels of quality in basic education, as can be seen in the national performance assessments over the years. The problem of low educational quality can be approached and investigated from the view point of several areas. One of them is the use of Educational Data Mining, which is increasingly present in scientific studies, and is also used to support decision-making by public policy makers. However, research with data from a geographic region, or a particular location, may still be scarce, as is the case in the state of Maranhão. This research aims to understand what are the factors that influence the quality of public education in the state of Maranhão. For this purpose, data mining techniques were used, such as exploratory data analysis, correlation analysis, factor analysis, regression and decision tree. The data used are from state public high schools in Maranhão. Results of this study show a diagnosis of the state's educational situation, with the identification of what significantly influences the performance of education.
Downloads
References
Agarwal, S. (2013). Data mining: Data mining concepts and techniques. In 2013 international conference on machine intelligence and research advancement (pp. 203–207). doi:10.1109/ICMIRA.2013.45. [GS Search]
Akoglu, H. (2018). User’s guide to correlation coefficients. Turkish Journal of Emergency Medicine, 18(3), 91-93. doi: 10.1016/j.tjem.2018.08.001. [GS Search]
Azevedo, A., & Santos, M. F. (2008). Kdd, semma and crisp-dm: a parallel overview. In A. Abraham (Ed.), Iadis european conf. data mining (p. 182-185).
Barbieri, C. (2001). Bi–business intelligence–modelagem & tecnologia.
Brasil (1988). Constituição da república federativa do Brasil de 1988. Diário Oficial da República Federativa do Brasil. [Link]
Carvalho, J., Cruz, L., & Gouveia, R. (2017). Descoberta de conhecimento com aprendizado de máquina supervisionado em dados abertos dos censos da educação básica e superior. In Anais dos workshops do congresso brasileiro de informática na educação (Vol. 6, pp. 674–683). doi:10.5753/cbie.wcbie.2017.674 [GS Search]
Castro Soares, R., Neto, N. W., Coutinho, L. R., da Silva, F. J., dos Santos, D. V., & Teles, A. S. (2021). Mineração de dados da educaçao básica brasileira usando as bases do inep: Uma revisão sistemática da literatura. RENOTE, 19(1), 361–370. doi: 10.22456/1679-1916.118526 [GS Search]
Curral, J. (1994). Statistics packages: A general overview.
DiStefano, C., Zhu, M., & Mindrila, D. (2009). Understanding and using factor scores: Considerations for the applied researcher. Practical Assessment, Research, and Evaluation, 14(1), 20. doi:10.7275/da8t-4g52. [GS Search]
Fayyad, U., Piatetsky-Shapiro, G., & Smyth, P. (1996). From data mining to knowledge discovery in databases. AI magazine, 17(3), 37–37. doi:10.1609/aimag.v17i3.1230 [GS Search]
Fernandes, E., Holanda, M., Victorino, M., Borges, V., Carvalho, R., & Van Erven, G. (2019). Educational data mining: Predictive analysis of academic performance of public school students in the capital of brazil. Journal of Business Research, 94, 335–343. doi:10.1016/j.jbusres.2018.02.012 [GS Search]
Figueiredo Filho, D. B., & Silva Júnior, J. A. d. (2010). Visão além do alcance: uma introdução à análise fatorial. Opinião pública, 16(1), 160–185. doi:10.1590/S0104-62762010000100007 [GS Search]
Fonseca, S. O. d., & Namen, A. A. (2016). Data mining on inep databases: An initial analysis aiming to improve brazilian educational system. Educação em Revista, 32, 133–157. doi:10.1590/0102-4698140742 [GS Search]
Garcia, S. C. (2003). O uso de árvores de decisão na descoberta de conhecimento na área da saúde. Unpublished master’s thesis. [GS Search]
Gorsuch, R. L. (2014). Factor analysis: Classic edition.
IBGE (2021). Maranhão - IBGE Cidades. [Link]
INEP (2022a). Portal de Dados Abertos do Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP). [Link]
INEP (2022b). Índice de Desenvolvimento da Educação Básica (IDEB) - Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP). [Link]
Júnior, G. C., Nascimento, R., Alves, G., & Gouveia, R. (2017). Identificando correlaçoes e outliers entre bases de dados educacionais. In Anais dos workshops do congresso brasileiro de informática na educação (Vol. 6, pp. 694–703). doi:10.5753/cbie.wcbie.2017.694 [GS Search]
Lima, D. A., Ferreira, M. E. A., & Silva, A. F. F. (2021). Machine learning and data visualization to evaluate a robotics and programming project targeted for women. Journal of Intelligent & Robotic Systems, 103(1), 1–20. doi:10.1007/s10846-021-01443-w [GS Search]
Lira, S. A. (2004). Análise de correlação: Abordagem teórica e de construção dos coeficientes com aplicações.
Maranhão, G. (2022). Piso salarial do professor com jornada de 40 horas no maranhão é R$ 3 mil a mais que o nacional. [Link]
Namen, A. A., Borges, S. X. d. A., & Sadala, M. d. G. S. (2013). Indicadores de qualidade do ensino fundamental: o uso das tecnologias de mineração de dados e de visões multidimensionais para apoio à análise e definição de políticas públicas. Revista Brasileira de Estudos Pedagógicos, 94(238), 677–700. doi:10.1590/S2176-66812013000300003 [GS Search]
Nascimento Bem, L., da Silva Pereira, V., & Souza, E. (2017). Data mart para análise comparativa de dados do ideb em municípios da microrregião do pajeú em pernambuco. In Anais dos workshops do congresso brasileiro de informática na educação (Vol. 6, pp. 704–713). doi:10.5753/cbie.wcbie.2017.704 [GS Search]
Orange Data Mining (2022). Orange Documentation. Tree Viewer. [Link]
Pacini, I. B. d. A. (2020). Indicadores educacionais: Um estudo dos limites e potencialidades da prova brasil da rede estadual de ensino do tocantins. Humanidades & Inovação, 7(18), 242–257. [GS Search]
Pallant, J. (2020). Spss survival manual: A step by step guide to data analysis using ibm spss. Routledge. [GS Search]
Peña-Ayala, A. (2014). Educational data mining: A survey and a data mining-based analysis of recent works. Expert Systems with Applications, 41(4, Part 1), 1432-1462. doi:10.1016/j.eswa.2013.08.042 [GS Search]
Rigo, S., Cambruzzi, W., Barbosa, J., & Cazella, S. (2014). Aplicações de mineração de dados educacionais e learning analytics com foco na evasão escolar: oportunidades e desafios. Revista Brasileira de Informática na Educação, 22(01), 132. doi:10.5753/rbie.2014.22.01.132 [GS Search]
Rigotti, J. I. R., & Cerqueira, C. A. (2015). As bases de dados do inep e os indicadores educacionais: conceitos e aplicações. Livros, 71–88. [GS Search]
Rodrigues, R. L., De Medeiros, F. P., & Gomes, A. S. (2013). Modelo de regressão linear aplicado à previsão de desempenho de estudantes em ambiente de aprendizagem. In Brazilian symposium on computers in education (simpósio brasileiro de informática na educação-sbie) (Vol. 24, p. 607-616). doi:10.5753/cbie.sbie.2013.607 [GS Search]
Santos, A., & de Medeiros, F. P. A. (2020). Relationship of federal funding to ideb results in a state in brazil: an approach based on educational data mining. In 15th iberian conference on information systems and technologies (cisti) (pp. 1–4). doi:10.23919/CISTI49556.2020.9140924 [GS Search]
SEDUC-MA, S. E. E. M. (2020). Maranhão mantém trajetória de crescimento e atinge 3,7 no ideb, maior nota da história. [Link]
Shearer, C. (2000). The crisp-dm model: the new blueprint for data mining.
Silva Pinto, G., Júnior, O. d. G. F., & de Barros Costa, E. (2019). Identificação dos fatores de melhorias no ideb pelo uso de mineração de dados: Um estudo de caso em escolas municipais de teotônio vilela-alagoas. RENOTE, 17(3), 183–193. doi:10.22456/1679-1916.99469 [GS Search]
Silva Pinto, G., Júnior, O. F., Costa, E., Barbirato, J. C. C., & Rodrigues, W. R. M. (2019). Identificação dos fatores de melhorias no ideb pelo uso de mineração de dados: Um estudo de caso em escolas municipais de maceió. In Brazilian symposium on computers in education (Vol. 30, pp. 1828–1837). doi:10.5753/cbie.sbie.2019.1828 [GS Search]
Tan, P.-N., Steinbach, M., & Kumar, V. (2009). Introdução ao datamining: mineração de dados.
Witten, I. H., Frank, E., Hall, M. A., Pal, C. J., & DATA, M. (2005). Practical machine learning tools and techniques. In Data mining (Vol. 2, p. 4). doi:10.1016/C2009-0-19715-5 [GS Search]
Additional Files
Published
How to Cite
Issue
Section
License
Copyright (c) 2023 Raimundo de Castro Soares, Nelson Weber Neto, Luciano Reis Coutinho, Davi Viana dos Santos, Francisco José da Silva e Silva, Ariel Soares Teles
This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.