Investigação de Enviesamento de Modelos de Aprendizado de Máquina para Diagnóstico de Doenças Neurodegenerativas via Registros de Marcha e Voz
DOI:
https://doi.org/10.5753/reic.2025.6402Keywords:
Doenças neurodegenerativas, diagnóstico, enviesamento, aprendizado de máquinaAbstract
Este trabalho sintetiza os principais achados de uma pesquisa sobre vieses em modelos de aprendizado de máquina para o diagnóstico de doenças neurodegenerativas por análise da marcha e da voz. Avaliamos como técnicas de sobreamostragem, como o janelamento da marcha e o uso indiscriminado de múltiplas amostras de voz por pessoa, inflam métricas de desempenho ao tratar amostras do mesmo sujeito como independentes. Comparando protocolos que ignoram ou preservam essas dependências em dois conjuntos de dados, observamos que desconsiderá-las inflaciona as métricas, enquanto sua preservação fornece avaliações mais fiáveis. Os resultados destacam a importância da segregação adequada das amostras para obter modelos diagnósticos confiáveis.
Downloads
Referências
Atarachi, J. and Uchida, E. (1959). A clinical study of parkinsonism. Recent Advances in Research on the Nervous System, 3:871–882.
Berman, T. and Bayati, A. (2018). What are neurodegenerative diseases and how do they affect the brain? Frontiers for Young Minds, 6. DOI: 10.3389/frym.2018.00070.
Bielby, J., Kuhn, S., Colreavy-Donnelly, S., Caraffini, F., O’Connor, S., and Anastassi, Z. A. (2020). Identifying parkinson’s disease through the classification of audio recording data. In 2020 IEEE Congress on Evolutionary Computation (CEC), pages 1–7. IEEE.
Bucci, G. d. F. F. B., Chagas, A. L. d. B., Félix, J. P., Nascimento, H. A. D. d., and Soares, F. (2025). Transformer: O poder da atenção no auxílio ao diagnóstico de múltiplas doenças neurodegenerativas. Revista Eletrônica de Iniciação Científica em Computação, 23(1):158–164. DOI: 10.5753/reic.2025.6048.
Chagas, A., Bucci, G., Félix, J., Salvini, R., Nascimento, H., and Soares, F. (2025). Exploring biases in machine learning models for neurodegenerative diseases diagnosis through gait and voice analysis. In Anais Estendidos do XXV Simpósio Brasileiro de Computação Aplicada à Saúde, pages 1–6, Porto Alegre, RS, Brasil. SBC. DOI: 10.5753/sbcas_estendido.2025.7498.
Chagas, A., Lobo, P. S., Felix, J., do Nascimento, H., and Salvini, R. (2024a). Analyzing the impact of voice data replication on machine learning models for parkinson’s disease diagnosis. In Anais da XII Escola Regional de Informática de Goiás, pages 263–264, Porto Alegre, RS, Brasil. SBC. DOI: 10.5753/erigo.2024.5092.
Chagas, A. L., Bucci, G., Felix, J., Fonseca, A., Nascimento, H., and Soares, F. (2024b). Avaliando a sobreamostragem de dados temporais de marcha no diagnóstico automático de doenças neurodegenerativas. In Simpósio Brasileiro de Computação Aplicada à Saúde (SBCAS), Goiânia, GO, Brazil, June 25–28, 2024, pages 1–12. SBC.
Chagas, A. L. B., Felix, J. P., and Nascimento, H. A. D. (2024c). Gait analysis for the diagnosis of neurodegenerative diseases. In Anais Estendidos do XX Congresso Brasileiro de Informática em Saúde - CBIS’24, pages 484–485, Belo Horizonte.
da Silva, M. I., Felix, J. P., de Stecca Prado, T., de Bastos Chagas, A. L., Bucci, G. d. F. F. B., da Fonseca, A. U., and Soares, F. (2024). Sobre a análise de sinais de voz para o diagnóstico da doença de parkinson. Journal of Health Informatics, 16(Especial).
Dutta, S., Chatterjee, A., and Munshi, S. (2009). An automated hierarchical gait pattern identification tool employing cross-correlation-based feature extraction and recurrent neural network based classification. Expert Systems, 26(2):202–217.
Erdaş, Ç. B., Sümer, E., and Kibaroğlu, S. (2021). Neurodegenerative disease detection and severity prediction using deep learning approaches. Biomedical Signal Processing and Control, 70:103069.
Felix, J., da Silva, M. I., Chagas, A. L., Salvini, R., Nascimento, H., and Soares, F. (2025). Analyzing the effect of replicated voice samples in parkinson’s disease classification. In 2025 IEEE Canadian Conference of Electrical and Computer Engineering (CCECE). Aceito para publicação.
Felix, J., Fonseca, A. U., Nascimento, H., and Guimarães, N. (2022). Rede neural multicamadas para classificação de doenças neurodegenerativas a partir de sinais de marcha. In Anais do XXIV Congresso Brasileiro de Automática, pages 1354–1361. SBA.
Fraiwan, L. and Hassanin, O. (2021). Computer-aided identification of degenerative neuromuscular diseases based on gait dynamics and ensemble decision tree classifiers. Plos one, 16(6):e0252380.
Hausdorff, J. (2000). Gait in neurodegenerative disease database. Disponível em: [link].
Heemels, M.-T. (2016). Neurodegenerative diseases.
Ho, A. K., Iansek, I. H., Marigliani, R. L., Bradshaw, J., and Gates, M. C. (1998). Speech impairment in a large sample of patients with parkinson’s disease. Behavioural Neurology, 11(3):131–137.
Little, M. A., McSharry, P. E., Hunter, E. J., Spielman, J., and Ramig, L. O. (2009). Suitability of dysphonia measurements for telemonitoring of parkinson’s disease. IEEE Transactions on Biomedical Engineering, 56(4):1015–1022. DOI: 10.1109/TBME.2008.2005954.
Mayeux, R. (2003). Epidemiology of neurodegeneration. Annual Review of Neuroscience, 26(1):81–104.
Naranjo, L., Pérez, C. J., Campos-Roca, Y., and Martín, J. (2016). Addressing voice recording replications for parkinson’s disease detection. Expert Systems with Applications, 46:286–292. DOI: 10.1016/j.eswa.2015.10.034.
Ning, Z., Li, L., and Jin, X. (2018). Classification of neurodegenerative diseases based on CNN and LSTM. In 2018 9th International Conference on Information Technology in Medicine and Education (ITME), pages 82–85. IEEE.
Noella, R. S. N. and Priyadarshini, J. (2023). Machine learning algorithms for the diagnosis of alzheimer and parkinson disease. Journal of Medical Engineering & Technology, 47(1):35–43. PMID: 36043506. DOI: 10.1080/03091902.2022.2097326.
Ouhmida, A., Fattah, J., Khaireddin, Y., and Maaroufi, M. (2021). Voice-based deep learning medical diagnosis system for parkinson’s disease prediction. In 2021 International Congress of Advanced Technology and Engineering (ICOTEN). IEEE.
Prez, C. (2016). Parkinson Dataset with replicated acoustic features. UCI Machine Learning Repository. DOI: 10.24432/C5701F.
Varghese, J., Brenner, A., Fujarski, M., van Alen, C. M., Plagwitz, L., and Warnecke, T. (2024). Machine Learning in the Parkinson’s disease smartwatch (PADS) dataset. npj Parkinson’s Disease, 10(1):9.
Vyas, T., Yadav, R., Solanki, C., Darji, R., Desai, S., and Tanwar, S. (2022). Deep learning-based scheme to diagnose parkinson’s disease. Expert Systems, 39(3):e12739. DOI: 10.1111/exsy.12739.
Yasar, A., Saritas, I., Sahman, M., and Cinar, A. (2019). Classification of parkinson disease data with artificial neural networks. In IOP conference series: materials science and engineering, volume 675, page 012031. IOP Publishing.
Downloads
Published
Como Citar
Issue
Section
Licença
Copyright (c) 2025 Os autores

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
