Atribuição de autoria em trabalhos escolares por meio da estilometria e processamento de linguagem natural




Estilometria, Atribuição de Autoria, Classificação de Documentos Escolares, Extração de Características Estilométricas, Comitês de Árvores de Decisão


O aumento no volume de documentos digitais associado ao seu uso no processo de verificação de aprendizagem demanda recursos computacionais para compreensão e análise de autoria. A literatura propõe distinguir os autores pelo estilo de escrita e palavras-chave. Entretanto, estes trabalhos não estão inseridos no contexto educacional e são majoritariamente em inglês. Tal cenário é desafiador, pois apresenta menos documentos por autor, homogeneidade entre o grupo de autores e menor quantidade de trabalhos anteriores e recursos para o idioma. Devido ao baixo volume de exemplos, usamos bases jornalísticas robustas como referência. Por meio dos experimentos verificamos que, em domínios específicos, representações baseadas em características de estilo são superiores à abordagens textuais, as quais sofrem influência do tópico em corpora mais abrangentes. Este trabalho revelou que o comitê de árvores de decisão extremamente aleatórias associado às características de estilo propostas foi superior aos demais modelos em todas as bases utilizadas, alcançando uma média de 71% na taxa de acerto e AUC 0,81.


Não há dados estatísticos.


