Portal de Gestão e Qualidade de Dados em Big Data
DOI:
https://doi.org/10.5753/reic.2025.5984Keywords:
Big data, qualidade de dados, portal de dadosAbstract
O crescente volume de dados demanda maior controle e monitoramento das informações geradas. Nesse contexto, ferramentas de gerenciamento de dados tornam-se essenciais para atender às necessidades de grandes instituições no Brasil. Órgãos como o ICMBio e o INMET já utilizam soluções desse tipo, mas o INPE ainda carece de um portal específico que atenda a essas demandas. Este artigo apresenta o desenvolvimento de uma ferramenta baseada nos princípios FAIR, voltada à inserção e indexação padronizada de dados em um banco de dados não relacional. Os resultados demonstram que a ferramenta atende adequadamente aos princípios FAIR.
Downloads
Referências
Barbosa, L., Shayer Lyra, R., et al. (2021). Governança de dados-2021. Escola Nacional de Administração Pública. Disponível em: [link].
Brunner, R. J. and Kim, E. J. (2016). Teaching data science. Procedia Computer Science, 80:1947–1956. DOI: 10.1016/j.procs.2016.05.513.
de Oliveira, S. S. (2014). Bancos de dados não-relacionais: um novo paradigma para armazenamento de dados em sistemas de ensino colaborativo. Revista da Escola de Administração Pública do Amapá, 2(1):184–194. Disponível em: [link].
Harris, C. R., Millman, K. J., van der Walt, S. J., Gommers, R., Virtanen, P., Cournapeau, D., Wieser, E., Taylor, J., Berg, S., Smith, N. J., Kern, R., Picus, M., Hoyer, S., van Kerkwijk, M. H., Brett, M., Haldane, A., del Río, J. F., Wiebe, M., Peterson, P., Gérard-Marchant, P., Sheppard, K., Reddy, T., Weckesser, W., Abbasi, H., Gohlke, C., and Oliphant, T. E. (2020). Array programming with NumPy. Nature, 585(7825):357–362. DOI: 10.1038/s41586-020-2649-2.
Hazen, B. T., Boone, C. A., Ezell, J. D., and Jones-Farmer, L. A. (2014). Data quality for data science, predictive analytics, and big data in supply chain management: An introduction to the problem and suggestions for research and applications. International Journal of Production Economics, 154:72–80. DOI: 10.1016/j.ijpe.2014.04.018.
Henning, P., Ribeiro, C. J. S., Sales, L., Moreira, J., and da Silva Santos, L. O. B. (2018). Desmistificando os princípios FAIR: conceitos, métricas, tecnologias e aplicações inseridas no ecossistema dos dados FAIR. Tendências da Pesquisa Brasileira em Ciência da Informação, 11(1). Disponível em: [link].
Henning, P. C., Ribeiro, C. J. S., Santos, L. O. B., and dos Santos, P. X. (2019). GO FAIR e os princípios FAIR: o que representam para a expansão dos dados de pesquisa no âmbito da ciência aberta. Em Questão, 25(2):389–412. DOI: 10.19132/1808-5245252.389-412.
Hows, D., Membrey, P., and Plugge, E. (2019). Introdução ao MongoDB. Novatec Editora.
Hoyer, S. and Hamman, J. (2017). xarray: ND labeled arrays and datasets in Python. Journal of Open Research Software, 5(1):10–10. DOI: 10.5334/jors.148.
Hunter, J. D. (2007). Matplotlib: A 2D graphics environment. Computing in Science & Engineering, 9(3):90–95. DOI: 10.1109/MCSE.2007.55.
ICMBio, L. (2010). Instituto Chico Mendes de Conservação da Biodiversidade. Disponível em: [link].
INPE (2018). INPE amplia monitoramento da Amazônia com dados da nova geração de satélites ambientais. Disponível em: [link]. Acesso em: 01/10/2025.
Macedo, A. d. S. and Fisch, G. (2018). Variabilidade temporal da radiação solar durante o experimento GoAmazon 2014/15. Revista Brasileira de Meteorologia, 33(2):353–365. DOI: 10.1590/0102-7786332017.
Martin, S. T., Artaxo, P., Machado, L. A. T., Manzi, A. O., Souza, R. A. F. d., Schumacher, C., Wang, J., Andreae, M. O., Barbosa, H., Fan, J., et al. (2016). Introduction: Observations and modeling of the Green Ocean Amazon (GoAmazon2014/5). Atmospheric Chemistry and Physics, 16(8):4785–4797. DOI: 10.5194/acp-16-4785-2016.
O’Higgins, N. (2011). MongoDB and Python: Patterns and Processes for the Popular Document-Oriented Database. O’Reilly Media, Inc.
Palanisamy, G. (2016). ARM Data File Standards Version 1.2. Technical report, DOE Office of Science Atmospheric Radiation Measurement (ARM) Program.
Peppler, R., Kehoe, K., Monroe, J., Theisen, A., and Moore, S. (2016). The ARM data quality program. Meteorological Monographs, 57:12.1–12.14. DOI: 10.1175/AMSMONOGRAPHS-D-15-0039.1.
Rew, R. and Davis, G. (1990). NetCDF: an interface for scientific data access. IEEE Computer Graphics and Applications, 10(4):76–82. DOI: 10.1109/38.56302.
Richards, T. (2021). Getting Started with Streamlit for Data Science. Packt Publishing. Disponível em: [link].
Sales, L. F. and Sayão, L. F. (2018). A ciência invisível: revelando os dados da cauda longa da pesquisa. In XIX Encontro Nacional de Pesquisa em Ciência da Informação (XIX ENANCIB).
Smith, B. (2015). Beginning JSON. Apress.
Teixeira, M. P. and Santos, G. C. (2019). Gestão de dados científicos para pesquisadores. RDBCI: Revista Digital de Biblioteconomia e Ciência da Informação, 17:e019035. DOI: 10.20396/rdbci.v17i0.8657527.
Waskom, M. L. (2021). seaborn: statistical data visualization. Journal of Open Source Software, 6(60):3021. DOI: 10.21105/joss.03021.
Wes McKinney (2010). Data Structures for Statistical Computing in Python. In Stéfan van der Walt and Jarrod Millman, editors, Proceedings of the 9th Python in Science Conference, pages 56–61. DOI: 10.25080/Majora-92bf1922-00a.
Wilkinson, M. D., Dumontier, M., Aalbersberg, I. J., Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., da Silva Santos, L. B., Bourne, P. E., et al. (2016). The FAIR guiding principles for scientific data management and stewardship. Scientific Data, 3(1):1–9. DOI: 10.1038/sdata.2016.18.
Downloads
Published
Como Citar
Issue
Section
Licença
Copyright (c) 2025 Os autores

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
