Ecore4PROV-DM: A Metamodel for Enhancing Data Provenance Adoption in Information Systems

Authors

DOI:

https://doi.org/10.5753/isys.2024.4691

Keywords:

Data Provenance, Model-Driven Engineering, W3C PROV, W3C PROV-DM, Metamodel Evaluation

Abstract

Effective management of data provenance is essential in Information Systems, particularly for data-intensive applications. Despite the W3C PROV family of documents establishing a standard for representing provenance, integrating this information into software development processes remains a significant challenge. This paper addresses the problem by introducing the Ecore4PROV-DM metamodel, developed using Model-Driven Engineering techniques to align with the W3C PROV data model (PROV-DM). The metamodel's application is demonstrated through real-world scenarios, including the Urban Observatory project at Newcastle University. Evaluated using a subset of the Metamodel Quality Requirements and Evaluation (MQuaRE) framework, focusing on three key quality requirements, Ecore4PROV-DM exhibits high accuracy and completeness, making it a robust tool for provenance modeling. By bridging the gap between the conceptual richness of W3C PROV-DM and practical implementation needs, Ecore4PROV-DM facilitates precise provenance representation and seamless integration into diverse Information Systems.

Downloads

Não há dados estatísticos.

Biografia do Autor

Marcos Alves Vieira, Instituto Federal Goiano (IF Goiano) – Campus Iporá / Universidade Federal de Goiás (UFG) - Instituto de Informática (INF)

Professor do Instituto Federal Goiano (IF Goiano) - Campus Iporá. É Bacharel em Informática pelo Instituto Federal de Goiás (IFG), Mestre e Doutor em Ciência da Computação pelo Instituto de Informática (INF) da Universidade Federal de Goiás (UFG). Durante o mestrado, desenvolveu pesquisa com foco em Espaços Inteligentes para Computação Ubíqua, aliado à Engenharia Baseada em Modelos. No doutorado, aplicou técnicas de Engenharia Baseada em Modelos para desenvolver um metamodelo permitindo a instanciação de modelos de Proveniência de Dados em conformidade com o padrão W3C PROV, que foi usado como base para a construção de uma ferramenta para modelagem gráfica de proveniência.

Gislainy Crisostomo Velasco, Universidade Federal de Goiás (UFG) - Instituto de Informática (INF)

Possui graduação em Sistemas de Informação pela Universidade Federal de Goiás (2018). Mestra em Ciência da Computação pela UFG. Atualmente é Staff Software Engineer - Tropix, Inc.. Tem experiência na área de Ciência da Computação, com ênfase em Ciência da Computação, atuando principalmente nos seguintes temas: blockchain, smart contracts, Non-Fungible Token (Nft)

Sergio Carvalho, Universidade Federal de Goiás (UFG) - Instituto de Informática (INF)

Sergio Teixeira de Carvalho possui experiência em projetos de pesquisa e de desenvolvimento na área de Computação com ênfase em sistemas computacionais, sistemas distribuídos e engenharia de software. Desenvolve pesquisas nos campos da computação ubíqua, blockchain e aplicações descentralizadas, jogos digitais e computação aplicada à saúde. É doutor em Computação pela Universidade Federal Fluminense (UFF), mestre em Computação Aplicada e Automação, também pela UFF, especialista em Educação a Distância pela Universidade Católica de Brasília (UCB) e bacharel em Ciências da Computação pela Universidade Federal de Goiás (UFG). Atualmente, é professor associado do Instituto de Informática (INF) da UFG, atuando no programa de pós-graduação em Ciência da Computação, na pós-graduação lato sensu em Saúde Digital, e na graduação em cursos da área de Ciência da Computação. É membro efetivo da ACM (Association for Computing Machinery), SBC (Sociedade Brasileira de Computação) e SBIS (Sociedade Brasileira de Informática em Saúde). É membro do Conselho Diretor do Instituto de Informática da UFG, do qual foi presidente de junho de 2017 até junho de 2021. Foi diretor do Instituto de Informática/UFG no período de junho de 2017 a junho de 2021, e vice-diretor no período de junho de 2013 a junho de 2017. É membro da CGIS desde 2019, da qual foi também vice-coordenador de agosto de 2022 a junho de 2023. É membro do colegia do Comitê de Ética em Pesquisa com Seres Humanos (CEP) da UFG. Foi professor em diversas Faculdades e Centros Universitários em cursos de graduação e de especialização na área de Computação, exercendo também o cargo de coordenador de cursos. Por mais de dezessete anos, atuou como profissional de Tecnologia da Informação em empresas privadas e instituições públicas nos três níveis de governo (municipal, estadual e federal), atuando como diretor de Desenvolvimento de Sistemas de Software, diretor de suporte e infraestrutura, gerente e coordenador de projetos de software, e nas áreas de desenvolvimento de software, administração de bancos de dados e administração de redes e sistemas.

Referências

ARDC, Australian Research Data Commons (2022). Data Provenance. Disponível em: [link]. Acesso em: 16 abr. 2024.

Bastin, L., Reynolds, O., Garcia-Dominguez, A., and Sprinks, J. (2023). Facilitating provenance documentation with a model-driven-engineering approach. In EGU General Assembly 2023, pages 24–28, Vienna, Austria. EGU23-8321.

Bruel, J. M., Combemale, B., Guerra, E., Jézéquel, J.-M., Kienzle, J., de Lara, J., Mussbacher, G., Syriani, E., and Vangheluwe, H. (2018). Model transformation reuse across metamodels. In Rensink, A. and Sánchez Cuadrado, J., editors, Theory and Practice of Model Transformation, pages 92–109, Cham. Springer International Publishing.

Bucchiarone, A., Cabot, J., Paige, R. F., and Pierantonio, A. (2020). Grand challenges in model-driven engineering: an analysis of the state of the research. Software and Systems Modeling, 19(1):5–13.

Callahan, S. P., Freire, J., Santos, E., Scheidegger, C. E., Silva, C. T., and Vo, H. T. (2006). Vistrails: visualization meets data management. In Proceedings of the 2006 ACM SIGMOD International Conference on Management of Data, SIGMOD ’06, page 745–747, New York, NY, USA. Association for Computing Machinery.

Community, T. G. (2022). The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2022 update. Nucleic Acids Res., 50(W1):W345–W351.

Gil, Y., Miles, S., Belhajjame, K., Deus, H., Garijo, D., Klyne, G., Missier, P., Soiland-Reyes, S., and Zednik, S. (2013). PROV Model Primer.

Glavic, B. (2021). Data provenance. Foundations and Trends® in Databases, 9(3-4):209–441.

Herschel, M., Diestelkämper, R., and Ben Lahmar, H. (2017). A survey on provenance: What for? What form? What from? The VLDB Journal, 26(6):881–906.

Hu, R., Yan, Z., Ding, W., and Yang, L. T. (2020). A survey on data provenance in IoT. World Wide Web, 23(2):1441–1463.

ISO Central Secretary (2023). Geographic information – Metadata – Part 3: XML schema implementation for fundamental concepts. Standard, International Organization for Standardization, Geneva, CH.

Kinderen, S. D., Kaczmarek-Hess, M., Ma, Q., and Razo-Zapata, I. S. (2017). Towards Meta Model Provenance: A Goal-Driven Approach to Document the Provenance of Meta Models. In Poels, G., Gailly, F., Asensio, E. S., and Snoeck, M., editors, 10th IFIP Working Conference on The Practice of Enterprise Modeling (PoEM), volume LNBIP-305 of The Practice of Enterprise Modeling, pages 49–64, Leuven, Belgium. Springer International Publishing. Part 1: Regular Papers.

Kudo, T. N. (2021). A metamodel for aligning requirements standards and testing standards and a framework for evaluating metamodels [in Portuguese]. PhD thesis, Universidade Federal de São Carlos, São Carlos – SP, Brazil.

Kudo, T. N., Bulcão Neto, R. F., and Vincenzi, A. M. R. (2020a). Toward a Metamodel Quality Evaluation Framework: Requirements, Model, Measures, and Process. In Proceedings of the XXXIV Brazilian Symposium on Software Engineering, SBES ’20, page 102–107, New York, NY, USA. Association for Computing Machinery.

Kudo, T. N., Bulcão-Neto, R. F., and Vincenzi, A. M. R. (2020b). Metamodel Quality Requirements and Evaluation (MQuaRE). Technical report, Departamento de Computação, UFScar, São Carlos-SP, Brazil. v 2.0.

López-Fernández, J. J., Cuadrado, J. S., Guerra, E., and de Lara, J. (2015). Example-driven meta-model development. Software & Systems Modeling, 14(4):1323–1347.

Ludäscher, B., Altintas, I., Berkley, C., Higgins, D., Jaeger, E., Jones, M., Lee, E. A., Tao, J., and Zhao, Y. (2006). Scientific workflow management and the kepler system. Concurr. Comput., 18(10):1039–1065.

Madiot, F., Goubet, L., Begaudeau, S., Chauvin, M., Musset, J., and Pupier, A. (2024). Eclipse Acceleo Wiki. Disponível em: [link]. Acesso em: 16 abr. 2024.

Madiot, F. and Paganelli, M. (2015). Eclipse sirius demonstration. P&D@ MoDELS, 1554:9–11.

Moreau, L. (2017). PROV-Template: A Quick Start.

Moreau, L., Batlajery, B. V., Huynh, T. D., Michaelides, D., and Packer, H. (2018). A templating system to generate provenance. IEEE Transactions on Software Engineering, 44(2):103–121.

Moreau, L., Missier, P., Belhajjame, K., B’Far, R., Cheney, J., Coppens, S., Cresswell, S., Gil, Y., Groth, P., Lebo, G. K. T., McCusker, J., Miles, S., Myers, J., and Sahoo, S. (2013a). PROV-DM: The PROV Data Model.

Moreau, L., Missier, P., Cheney, J., and Soiland-Reyes, S. (2013b). PROV-N: The Provenance Notation.

Pérez, B., Rubio, J., and Sáenz-Adán, C. (2018). A systematic review of provenance systems. Knowledge and Information Systems, 57(3):495–543.

Rodrigues da Silva, A. (2015). Model-driven engineering: A survey supported by the unified conceptual model. Computer Languages, Systems & Structures, 43:139–155.

Schmidt, D. C. (2006). Guest editor’s introduction: Model-driven engineering. Computer, 39(2):0025–31.

Steinberg, D., Budinsky, F., Merks, E., and Paternostro, M. (2008). EMF: Eclipse Modeling Framework. Pearson Education, Boston.

Velasco, G. C., Vieira, M. A., and Carvalho, S. T. (2023). Evaluation of a high-level metamodel for developing smart contracts on the ethereum virtual machine. In Anais do VI Workshop em Blockchain: Teoria, Tecnologias e Aplicações, pages 29–42, Porto Alegre, RS, Brasil. SBC.

Vieira, M. A. and Carvalho, S. T. (2024). MDE-Based Graphical Tool for Modeling Data Provenance According to the W3C PROV Standard. In Proceedings of the 12th International Conference on Model-Based Software and Systems Engineering - MODELSWARD, pages 141–148. INSTICC, SciTePress.

Völter, M., Stahl, T., Bettin, J., Haase, A., and Helsen, S. (2013). Model-driven software development: technology, engineering, management. John Wiley & Sons.

Wolf, M., Kunze, J. A., Lagoze, C., and Weibel, D. S. (1998). Dublin Core Metadata for Resource Discovery. RFC 2413.

Wolstencroft, K., Haines, R., Fellows, D., Williams, A., Withers, D., Owen, S., Soiland-Reyes, S., Dunlop, I., Nenadic, A., Fisher, P., Bhagat, J., Belhajjame, K., Bacall, F., Hardisty, A., Nieva de la Hidalga, A., Balcazar Vargas, M. P., Sufi, S., and Goble, C. (2013). The Taverna workflow suite: designing and executing workflows of Web Services on the desktop, web or in the cloud. Nucleic Acids Research, 41(W1):W557–W561.

Downloads

Published

2024-12-26

Como Citar

Alves Vieira, M., Crisostomo Velasco, G., & Carvalho, S. (2024). Ecore4PROV-DM: A Metamodel for Enhancing Data Provenance Adoption in Information Systems. ISys - Revista Brasileira De Sistemas De Informação, 17(1), 13:1 – 13:31. https://doi.org/10.5753/isys.2024.4691

Issue

Section

Versões estendidas de artigos selecionados