PATopics: Um framework para automatizar a extração de informações em documentos de patentes farmacêuticas
DOI:
https://doi.org/10.5753/reic.2023.3417Keywords:
Patentes farmacêuticas, Modelagem de tópicos, Processamento de linguagem naturalAbstract
As patentes farmacêuticas são compostas por documentos com muitos detalhes sobre a invenção e explicação da metodologia/resultados. Gerenciá-los corresponde a pesquisas manuais exaustivas. Para mitigar esse problema, propusemos o PATopics, um framework capaz de extrair informações relevantes de textos de patentes, construir tópicos relevantes, correlacioná-los com caracterı́sticas úteis de patentes e apresentar as informações em uma interface web amigável. Avaliamos o framework usando 4.832 patentes farmacêuticas referentes a 809 moléculas patenteadas por 478 empresas. Nossas análises consideraram as demandas de três perfis de usuários – pesquisadores, quı́micos e empresas – mostrando a praticidade e utilidade do PATopics nesse cenário.
Downloads
Referências
Garattini, L., Badinella Martini, M., and Mannucci, P. M. (2022). Pharmaceutical patenting in the European Union: reform or riddance. Internal and Emergency Medicine, 17(3):937–939.
Genin, B. L. and Zolkin, D. S. (2021). Similarity search in patents databases. The evaluations of the search quality. World Patent Information, 64(February):102022.
Khachigian, L. M. (2020). Pharmaceutical patents: reconciling the human right to health with the incentive to invent. Drug Discovery Today, 25(7):1135–1141.
Meng, Z., Shen, H., Huang, H., Liu, W., Wang, J., and Sangaiah, A. K. (2018). Search result diversification on attributed networks via nonnegative matrix factorization. Information Processing & Management, 54(6):1277–1291.
Reinhardt, U. E. (2001). Perspectives on the pharmaceutical industry. Health Affairs, 20(5):136–149.
Sammut, C. and Webb, G. I., editors (2010). TF–IDF, pages 986–987. Springer US, Boston, MA.
Viegas, F., Canuto, S., Gomes, C., Luiz, W., Rosa, T., Ribas, S., Rocha, L., and Gonçalves, M. A. (2019). Cluwords: Exploiting semantic word clustering representation for enhanced topic modeling. pages 753–761.
Waters, H. and Graf, M. (2018). The Costs of Chronic Disease in the U.S. Milken Institute, (August):24.
Downloads
Published
Como Citar
Issue
Section
Licença
Copyright (c) 2023 Os autores
Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial 4.0 International License.