Fast CUDA-based Implementations of Automatic Document Classification Algorithms
DOI:
https://doi.org/10.5753/reic.2014.1026Abstract
Com a Web 2.0, observamos um novo cenário: existe mais dados do que podemos analisar e organizá-los é um dos grandes problemas em Ciência da Computação. Existem muitos algoritmos com este propósito, destacando os de Classificação Automática de Documentos (CAD). Muitas propostas visam tornar esses algoritmos computacionalmente viáveis, sendo os melhores resultados obtidos pela paralelização em GPUs (Graphics Processing Units). Neste trabalho apresentamos duas versões paralelas em GPU de algoritmos de CAD, o GPU-NB, baseado no Naïve Bayes, e o G-KNN, baseado no KNN. Mostramos que, além de alcançarem a mesma eficácia, nossas propostas são mais rápidas que suas versões em CPU.