Análise Comparativa de Algoritmos de Aprendizado de Máquina para Predição de Recidiva de Câncer de Próstata com Dados da Fundação Oncocentro de São Paulo
DOI:
https://doi.org/10.5753/reic.2026.6648Keywords:
Câncer de Próstata, Aprendizado de Máquina, Predição de Recidiva, Dados Desbalanceados, Classificação SupervisionadaAbstract
O câncer de próstata é a neoplasia mais comum entre os homens no Brasil, tornando o estudo dos casos de recidiva um tema de grande interesse para a medicina. O foco principal deste trabalho está na aplicação do aprendizado de máquina supervisionado, por meio de uma análise comparativa dos algoritmos de classificação — Random Forest, XGBoost, HistGradientBoosting e Naive Bayes — para predizer a ocorrência da recidiva. Busca-se principalmente avaliar o desempenho desses modelos na predição do atributo de recidiva com base nos demais atributos presentes na base de dados da Fundação Oncocentro de São Paulo. Espera-se contribuir para o estudo da eficácia de distintas abordagens de aprendizado de máquina em dados clínicos abertos e desbalanceados sobre o câncer de próstata. Os resultados obtidos são significativos e apontam para a superioridade de modelos mais simples neste cenário, além de indicarem a possibilidade de continuidade dos estudos com técnicas mais avançadas.
Downloads
Referências
Antunes, M. E., Araújo, T. G., Till, T. T., Pantaleão, E., Mancera, P. F. A., and Oliveira, M. H. d. (2025). Machine learning models for predicting prostate cancer recurrence and identifying potential molecular biomarkers. Disponível em: [link]. Último acesso em 28 de agosto de 2025.
Bigonha, R. S. (2025). Fundamentos do Aprendizado de Máquina. Disponível em: [link]. Último acesso em 28 de agosto de 2025.
Bonaccorso, G. (2017). Machine Learning Algorithms: Reference Guide for Popular Algorithms for Data Science and Machine Learning. Packt Publishing, Birmingham, UK. Disponível em: [link]. Acesso em: 8 de dezembro de 2025.
Fonseca, R. P., Fernandes Junior, A. S., Lima, V. S., Lima, S. S. S., Castro, A. F. d., Horta, H. d. L. e., and Favato Neto, B. (2007). Recidiva bioquímica em câncer de próstata: artigo de revisão. Revista Brasileira de Cancerologia, 53(2):167–172. DOI: 10.32635/2176-9745.RBC.2007v53n2.1812.
INCA (2025). Números do câncer. Disponível em: [link]. Último acesso em 28 de agosto de 2025.
Kourou, K., Exarchos, T. P., Exarchos, K. P., Karamouzis, M. V., and Fotiadis, D. I. (2015). Machine learning applications in cancer prognosis and prediction. Computational and Structural Biotechnology Journal, 13:8–17. DOI: 10.1016/j.csbj.2014.11.005.
Lee, S. J., Yu, S. H., Kim, Y., Kim, J. K., Hong, J. H., Kim, C.-S., Seo, S. I., Byun, S.-S., Jeong, C. W., Lee, J. Y., and Choi, I. Y. (2020). Prediction system for prostate cancer recurrence using machine learning. Journal of Clinical Medicine. DOI: 10.3390/jcm9041200.
Maeda, A. E., Crocco, P. F., Ruppert, G. C. S., Dametto, M., and Bonacin, R. (2022). Um estudo sobre a predição da recidiva de câncer usando técnicas de aprendizado de máquina. In XXIV Jornada de Iniciação Científica do Centro de Tecnologia da Informação Renato Archer (JICC 2022), Campinas, SP. Disponível em: [link]. Último acesso em 28 de agosto de 2025.
Shalev-Shwartz, S. and Ben-David, S. (2014). Understanding Machine Learning: From Theory to Algorithms. Cambridge University Press. Disponível em: [link]. Acesso em: 8 de dezembro de 2025.
Uddin, S., Khan, A., Hossain, M. E., and Moni, M. A. (2019). Comparing different supervised machine learning algorithms for disease prediction. BMC Medical Informatics and Decision Making. Disponível em: [link]. Último acesso em 28 de agosto de 2025.
Wang, P., Li, Y., and Reddy, C. K. (2019). Machine learning for survival analysis: A survey. ACM Computing Surveys (CSUR). Disponível em: [link]. Último acesso em 28 de agosto de 2025.
Zardeto, H. N., Schmidt, T. P., and Schneider, I. J. C. (2022). Prostate cancer: Analysis of survival and prognostic factors by age at diagnosis. Research, Society and Development, 11(8):e49411831344. DOI: 10.33448/rsd-v11i8.31344.
Downloads
Published
Como Citar
Issue
Section
Licença
Copyright (c) 2026 Os autores

Este trabalho está licenciado sob uma licença Creative Commons Attribution 4.0 International License.
