Um framework para a construção automática de perfis de pesquisa com base em modelagem de tópicos semânticos
Keywords:
Modelagem de tópicos, Word embeddingAbstract
Esforços recentes são focados em identificar equipes multidisciplinares e detectar redes de coautoria explorando estratégias de modelagem de tópicos. Apesar da importância, nenhum desses realiza uma avaliação real da qualidade dos tópicos construídos. Este trabalho propõe um framework que permite resumir artigos escritos por pesquisadores para construir perfis de pesquisa automaticamente e realizar avaliações online sobre esses perfis. Foram considerados experimentos considerando o repositório Lattes, contrastando dois tipos de avaliação: (1) uma offline na qual exploramos uma métrica tradicional (NPMI); e (2) um online onde os pesquisadores avaliam seus perfis. O presente trabalho demonstra a importância em combinar ambas avaliações (offline e online) para media a qualidade de uma solução.
Downloads
Referências
Bangor, A., Kortum, P. T., and Miller, J. T. (2008). An empirical evaluation of the system usability scale. International Journal of Human–Computer Interaction, 24(6):574–594.
de Siqueira, G. O., Canuto, S. D., Gonc¸alves, M. A., and Laender, A. H. F. (2020). A pragmatic approach to hierarchical categorization of research expertise in the presence of scarce information. Int. J. Digit. Libr., 21(1):61–73.
Gusenbauer, M. (2019). Google scholar to overshadow them all? comparing the sizes of 12 academic search engines and bibliographic databases. Scientometrics, 118(1):177–214.
Kocaballi, A. B., Laranjo, L., and Coiera, E. (2018). Measuring user experience in conversational interfaces: a comparison of six questionnaires. In Proceedings of the 32nd International BCS Human Computer Interaction Conference, page 21. BCS Learning & Development Ltd.
Lee, D. D. and Seung, H. S. (1999). Learning the parts of objects by non-negative matrix factorization. Nature, 401(6755):788–791.
Nikolenko, S. I. (2016). Topic quality metrics based on distributed word representations. In SIGIR’16.
Nunes, D., Matos, D., Gomes, J., and Neto, F. (2021a). Chronic pain and language: A topic modelling approach to personal pain descriptions. https://arxiv.org/abs/2109.00402.
Nunes, D. A. P., de Matos, D. M., Ferreira-Gomes, J., and Neto, F. (2021b). Chronic pain and language: A topic modelling approach to personal pain descriptions. CoRR, abs/2109.00402.
Pedro, A., Pereira, A., Cecilio, P., Pena, N., Viegas, F., Tuler, E., Dias, D. R., and Rocha, L. (2021). An Article-Oriented Framework for Automatic Semantic Analysis of COVID-19 Researches, pages 172–187. Springer International Publishing. Salton, G. and Buckley, C. (1988). Term-weighting approaches in automatic text retrieval. Information Processing & Management, 24(5):513–523.
Viegas, F., Canuto, S., Gomes, C., Luiz, W., Rosa, T., Ribas, S., Rocha, L., and Gonc¸alves, M. A. (2019). Cluwords: exploiting semantic word clustering representation for enhanced topic modeling. pages 753–761.