Workflow for the acquisition, processing, and dissemination of Brazilian public data focused on education
DOI:
https://doi.org/10.5753/jidm.2024.3570Keywords:
Datasets, Open data, Public data, Education data, Smart governmentAbstract
This article aims to demonstrate the process of creating public databases focused on the educational and population areas. It describes the process of obtaining data from official government sources such as INEP (National Institute for Educational Studies and Research) and IBGE (Brazilian Institute of Geography and Statistics), the procedures for data adaptation and optimization to create their historical series, as well as the best practices followed for their development and the generated metadata. Highlighting the specificities between the themes of education and population, reporting their challenges and peculiarities of each dataset. It also reports the results that can already be directly obtained from each dataset and how, when combined, they can track indicators of the National Education Plan, one of the largest Brazilian public policies focused on education.
Downloads
References
Albuquerque, A. (2022). A population projection engine. url[link].
Albuquerque, A., Barros, A., Alencar, A., Nascimento, A., Bittencourt, I., and Mello, R. (2022). Dataset de estimativas populacionais desagregada por município e idade 2014-2020. In Anais do IV Dataset Showcase Workshop, pages 25–34, Porto Alegre, RS, Brasil. SBC. DOI: 10.5753/dsw.2022.225525.
Balbinot, A. D. and Haubert, A. (2015). Análise temporal das matrículas em educação especial entre 2005 e 2013 no estado do paraná. Revista Prâksis, 2:121–132.
Balbinot, A. D. and Haubert, A. (2017). Análise de matrículas como indicadores da evolução da educação especial no estado do rio de janeiro. REVISTA ELETRÔNICA PESQUISEDUCA, 9(19):663–673.
Barros, A. N., Alencar, A., Nascimento, A., de Albuquerque, A. F., and Mello, R. F. (2022). Elaboração do conjunto de dados agregados do censo da educação básica. In Anais do IV Dataset Showcase Workshop, pages 35–45. SBC.
de Atividades Especiais TCE-SC, D. (2021). Metodologia estimação populacional. url[link]
Ferreira, J., Miranda, M., Abelha, A., and Machado, J. (2010). O processo etl em sistemas data warehouse. In INForum, pages 757–765.
Gonçalves, M. V. F., dos Santos, J. S., Ferreira, C. Z., Zavaleta, J., da Cruz, S. M. S., and Sampaio, J. O. (2021). Datasets curados e enriquecidos com proveniência da campanha nacional de vacinação contra covid-19. In Anais do III Dataset Showcase Workshop, pages 148–159. SBC.
Gonzaga, M. R. and Schmertmann, C. P. (2016). Estimativa de taxas de mortalidade por idade e sexo para pequenas áreas com regressão de topals: uma aplicação para o brasil em 2010. Revista Brasileira de Estudos de População, 33(3):629–652.
González, M., Fernández Vázquez, E., and Morollón, F. (2015). A methodological note for local demographic projections: A shift-share analysis to disaggregate official aggregated estimations. 16:43–50.
Ozkan, K. S., Khan, H., Deligonul, S., Yeniyurt, S., Gu, Q. C., Cavusgil, E., and Xu, S. (2022). Race for market share gains: How emerging market and advanced economy mnes perform in each other’s turf. Journal of Business Research, 150:208–222. DOI: https://doi.org/10.1016/j.jbusres.2022.04.040.
Vasconcelos, F. F., Tavares, J. V., Ribeiro, M. U., Coutinho, F. J., and Clarindo, J. P. (2021). Candidata: um dataset para análise das eleições no brasil. In Anais do III Dataset Showcase Workshop, pages 160–168. SBC.