Uma ferramenta para rastreamento semântico de eventos a partir de documentos da Web
Keywords:
Rastreamento Semântico, Word Embeedings, Máquinas de BuscaAbstract
Explorar os grandes acervos criados por veículos de mídia com as ferramentas de busca tradicionais é algo impraticável para usuários exigentes. Assim, propomos uma ferramenta de exploração temporal que visa facilitar a realização de consultas em acervos de notícias. Concentramos nossos esforços em duas frentes (i) permitir que usuários façam consultas com adição de informações de documentos representados por word embbedings e (ii) desenvolver uma estratégia para resgate de informação temporal para gerar timelines apresentadas por uma interface adequada. Avaliamos nossa solução em um acervo de um jornal brasileiro e demonstramos que a mesma consegue traçar diferentes timelines, cobrindo diferentes subtópicos de um mesmo tema.
Downloads
Referências
Alonso, O., Gertz, M., and Baeza-Yates, R. (2009). Clustering and exploring search results using timeline constructions. In Proceedings of ACM CIKM.
Azad, H. K. and Deepak, A. (2019). Query expansion techniques for information retrieval: A survey. Information Processing and Management, 56(5):1698–1735.
Kanhabua, N. and Anand, A. (2016). Temporal information retrieval. In Proceedings of ACM SIGIR.
Kuzi, S., Shtok, A., and Kurland, O. (2016). Query expansion using word embeddings. In Proceedings of ACM CIKM.
Le, Q. and Mikolov, T. (2014). Distributed representations of sentences and documents. In Proceedings of ICML.
Li, J. and Cardie, C. (2014). Timeline generation: Tracking individuals on twitter. In Proceedings of ACM WWW.
Matthews, M., Tolchinsky, P., Blanco, R., Atserias, J., Mika, P., and Zaragoza, H. (2010). Searching through time in the new york times. In Proceedings of ACM HCIR.
Mikolov, T., Chen, K., Corrado, G., and Dean, J. (2013a). Efficient estimation of word representations in vector space. In Proceedings of ICLR.
Mikolov, T., Sutskever, I., Chen, K., Corrado, G., and Dean, J. (2013b). Distributed representations of words and phrases and their compositionality. In Proceedings of ICNIPS.
Rocchio, J. J. (1971). Relevance feedback in information retrieval. In Proceedings of The Smart retrieval system - experiments in automatic document processing.
Roy, D., Paul, D., Mitra, M., and Garain, U. (2016). Using word embeddings for automatic query expansion. ArXiv, abs/1606.07608.
Singh, J., Nejdl, W., and Anand, A. (2016). History by diversity: Helping historians search news archives. In Proceedings of ACM CHIIR.
Sparck Jones, K., Walker, S., and Robertson, S. (2000). A probabilistic model of information retrieval: development and comparative experiments: Part 1. Information Processing & Management, 36(6):779–808.