Avaliação de Desempenho de Classificadores a Partir de Dados Relacionados à Precipitação Pluviométrica Coletados por Estação Meteorológica Automática
DOI:
https://doi.org/10.5753/reic.2025.5420Keywords:
Aprendizado de Máquina, Precipitação, Inteligência Artificial Explicável, Modelos clássicos, Recursos hídricosAbstract
A previsão de precipitação é essencial para o planejamento e a gestão dos recursos hídricos, afetando áreas como agricultura, geração de energia, planejamento urbano e conservação da água. No caso da agricultura, essa previsão permite a coleta de dados precisos sobre a distribuição e quantidade das chuvas, otimizando o uso da água e aumentando a produtividade. Este estudo explora a aplicação de diferentes abordagens clássicas de aprendizado de máquina na previsão de precipitações, utilizando um conjunto de dados pluviométricos de Tianguá (CE), abrangendo etapas como pré-processamento, balanceamento de dados, avaliação de nove modelos diferentes e explicação local de um modelo. O objetivo é realizar uma análise comparativa do desempenho de algoritmos como Logistic Regression (LR), Naive Bayes (NB), Extra Tree (ET), Extreme Learning Machine (ELM), k-nearest neighbors (k-NN), Multilayer Perceptron (MLP), Random Forest (RF), Support Vector Machines (SVM) e um modelo ensemble. Além disso, foi aplicado o método Local Interpretable Model-Agnostic Explanations (LIME), visando identificar o modelo mais adequado e compreender os atributos que mais influenciam as classificações. Essa abordagem fornece insights valiosos para a melhoria da performance em estudos futuros, como a aplicação de técnicas de seleção de atributos. Entre os modelos testados, o ensemble baseado na votação majoritária de quatro algoritmos apresentou a melhor performance geral, com acurácia de 85% e excelente equilíbrio no F1-Score, tornando-o uma escolha robusta para aplicações que requerem previsões confiáveis. Embora o modelo NB tenha mostrado menor acurácia (76%), destacou-se pela alta precisão (91%), indicando que, quando previa chuva, quase sempre acertava, além de apresentar excelente sensibilidade para detectar ausência de precipitação (recall de 88%). Outros modelos registraram acurácia entre 83% e 84%, sendo alternativas viáveis conforme as necessidades específicas de cada aplicação. Ao explicar o modelo ET por meio do método LIME, a análise das dez primeiras predições do conjunto de teste apontou que as características mais influentes para prever chuvas incluíram umidade máxima e instantânea, além de temperatura mínima e instantânea, enquanto fatores como temperatura máxima e umidade mínima foram mais relevantes para prever a ausência de chuvas.
Descargas
Citas
Ardabili, S., Mosavi, A., Dehghani, M., and Várkonyi-Kóczy, A. R. (2020). Deep Learning and Machine Learning in Hydrological Processes Climate Change and Earth Systems a Systematic Review. In Várkonyi-Kóczy, A. R., editor, Engineering for Sustainable Future, pages 52–62, Cham. Springer International Publishing. DOI: 10.1007/978-3-030-36841-8_5.
Borella, L. d. C., Borella, M. R. d. C., and Corso, L. L. (2022). Climate analysis using neural networks as supporting to the agriculture. Gestão Produção, 29:e06. DOI: 10.1590/1806-9649-2022v29e06.
Danandeh Mehr, A., Rikhtehgar Ghiasi, A., Yaseen, Z. M., Sorman, A. U., and Abualigah, L. (2023). A novel intelligent deep learning predictive model for meteorological drought forecasting. Journal of Ambient Intelligence and Humanized Computing, 14(8):10441–10455. DOI: 10.1007/s12652-022-03701-7.
Dotse, S.-Q., Larbi, I., Limantol, A. M., and De Silva, L. C. (2024). A review of the application of hybrid machine learning models to improve rainfall prediction. Modeling Earth Systems and Environment, 10(1):19–44. DOI: 10.1007/s40808-023-01835-x.
Fernández-Delgado, M., Cernadas, E., Barro, S., and Amorim, D. (2014). Do we Need Hundreds of Classifiers to Solve Real World Classification Problems? The Journal of Machine Learning Research, 15(1):3133–3181. Disponível em [link].
Latif, S. D. and Ahmed, A. N. (2023). A review of deep learning and machine learning techniques for hydrological inflow forecasting. Environment, Development and Sustainability, 25(11):12189–12216. DOI: 10.1007/s10668-023-03131-1.
Maaten, L. v. d. and Hinton, G. (2008). Visualizing data using t-SNE. Journal of Machine Learning Research, 9(Nov):2579–2605. Disponível em [link].
Mishra, S. (2017). Handling imbalanced data: Smote vs. random undersampling. Int. Res. J. Eng. Technol., 4(8):317–320. Disponível em [link].
Molnar, C. (2020). Interpretable Machine Learning. Leanpub.
Pedregosa, F., Varoquaux, G., Gramfort, A., Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M., and Duchesnay, E. (2011). Scikit-learn: Machine Learning in Python. Journal of Machine Learning Research, 12:2825–2830. Disponível em [link].
Pereira Filho, A. J., Pinto, M. A. R. C., Manfredini, L., Lima, F. A. d., Pinto, A. C. e. C., Moribe, C. H., Vemado, F., and Silva Júnior, I. W. d. (2020). Sistema Integrado de Estimativa e Previsão de Precipitação para Bacias Hidrográficas da CESP. Revista Brasileira de Meteorologia, 35(4):529–552. DOI: 10.1590/0102-7786352023.
Ribeiro, M. T., Singh, S., and Guestrin, C. (2016). "Why Should I Trust You?": Explaining the Predictions of Any Classifier. In Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, KDD ’16, page 1135–1144, New York, NY, USA. Association for Computing Machinery. DOI: 10.1145/2939672.2939778.
Ribeiro, P. L. (2024). Análise e previsão de secas no norte de Minas Gerais utilizando machine learning. Dissertação de Mestrado, PROFÁGUA, Universidade Federal de Itajubá. Disponível em [link].
Sokolova, M. and Lapalme, G. (2009). A systematic analysis of performance measures for classification tasks. Information Processing & Management, 45(4):427–437. DOI: 10.1016/j.ipm.2009.03.002.
Sousa, R., Brito, R., and Ximenes, J. (2021). Avaliação de Desempenho Utilizando Diferentes Arquiteturas de Aprendizagem Profunda a Partir de Dados Relacionados a Precipitação Pluviométrica Coletados por Estação Meteorológica Automática. In Anais do XIV Encontro Unificado de Computação do Piauí e XI Simpósio de Sistemas de Informação, pages 168–175, Porto Alegre, RS, Brasil. SBC. DOI: 10.5753/enucompi.2021.17768.
Waqas, M., Humphries, U. W., Wangwongchai, A., Dechpichai, P., and Ahmad, S. (2023). Potential of Artificial Intelligence-Based Techniques for Rainfall Forecasting in Thailand: A Comprehensive. Water, 15(16). DOI: 10.3390/w15162979.
Ximenes de Brito, R., DE OLIVEIRA, A. C., and de Oliveira, A. C. (2025). Classificação de Precipitações - INMET - Tianguá - 2021 - IFCE. Conjunto de dados de precipitações coletados do INMET referente ao município de Tianguá (CE) durante o período de 15/03/2018 a 11/05/2021. Disponível em [link].
Descargas
Published
Cómo citar
Issue
Section
Licencia
Derechos de autor 2025 Os autores

Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
