Muses or Stereotypes? Identifying Historical Patterns of Sexism in a Corpus of Brazilian Lyrics
DOI:
https://doi.org/10.5753/jis.2025.5233Keywords:
Gender Bias, Natural Language Processing (NLP), Corpus-based Analysis, Brazilian Music, Algorithmic DiscriminationAbstract
This study aims to identify gender bias in Brazilian songs by analyzing the most frequent predicatives used to describe women and the most referenced occupations associated with the feminine gender. To achieve this, we created a corpus containing 146,612 song lyrics and applied natural language processing techniques to extract sentences that describe women. The identified predicatives were annotated and used to train a machine learning model that categorizes them into five descriptive categories. Additionally, we compiled a list of occupations mentioned in the lyrics. From a distant reading perspective, the results reveal a persistent historical pattern of sexism: women are predominantly portrayed through physical and emotional traits, while men are more frequently associated with character and social roles. In the professional domain, women are mainly depicted in caregiving and entertainment roles. These findings align with previous studies and contribute to methodological advancements in identifying gender bias in Portuguese-language texts.
The text contains potentially harmful and offensive examples.
Downloads
References
Assis, C. L. (2014). “Entre tapas e beijos”: representações sociais sobre a violência de gênero para adolescentes. 2:229–242. DOI: https://doi.org/10.12957/psi.saber.soc.2013.8796.
Barocas, S. and Selbst, A. D. (2016). Big data’s disparate impact. California Law Review, 104(3):671–732.
Betti, L., Abrate, C., and Kaltenbrunner, A. (2023). Large scale analysis of gender bias and sexism in song lyrics. EPJ Data Science, 12(1). DOI: https://doi.org/10.1140/epjds/s13688-023-00384-8.
Caseli, H. M. and Nunes, M. G. V. (2024). Processamento de Linguagem Natural: Conceitos, Técnicas e Aplicações em Português. BPLN, 2ª edição.
de Araújo Lima, R., de Sousa, R. C. C., Lopes, H., and Barbosa, S. D. J. (2020). Brazilian Lyrics-Based Music Genre Classification Using a BLSTM Network. In Rutkowski, L., Scherer, R., Korytkowski, M., Pedrycz, W., Tadeusiewicz, R., and Zurada, J. M. (Eds.), Artificial Intelligence and Soft Computing, pp. 525–534. Cham: Springer International Publishing.
Duprat, R. (2008). Fruição, sedução e produção: o papel da mulher na música. Música em Perspectiva, 1(1). DOI: https://doi.org/10.5380/mp.v1i1.11717.
Feijó, M. and Macedo, R. M. S. d. (2013). Gênero, cultura e rede social: a construção social da desigualdade de gênero por meio da linguagem. Nova Perspectiva Sistêmica, 21(44):21–34.
Firmino, V., Lopes, J., and Reis, V. (2024). Identificando Padrões de Sexismo na Música Brasileira através do Processamento de Linguagem Natural. In Anais do V Workshop sobre as Implicações da Computação na Sociedade, pp. 59–69, Brasília, DF, Brasil. SBC. DOI: https://doi.org/10.5753/wics.2024.
Freitas, C. and Martins, F. (2023). Bela, recatada e do lar: o que a mineração de textos literários nos diz sobre a caracterização de personagens femininas e masculinas. Fórum Linguístico, 20:9118–9138. DOI: https://doi.org/10.5007/1984-8412.2023.e86749.
Huang, J. (2022). Changing semantics of gendered insults in music lyrics (Thesis). DOI: https://doi.org/10.6082/uchicago.3762.
IBGE (2024). Estatísticas de Gênero: Indicadores sociais das mulheres no Brasil. Available in: [link]. Last access: 23 May 2025.
Jurafsky, D. and Martin, J. H. (2023). Speech and Language Processing, volume 3.
Kong, L. (1995). Popular Music in Geographical Analyses. Progress in Human Geography, 15th edition.
Lima, C. D. and Sanches, N. P. L. (2009). A construção do eu feminino na música popular brasileira. Caderno Espaço Feminino, 21:181–205.
Lucy, L. and Bamman, D. (2021). Gender and representation bias in GPT-3 generated stories. In Akoury, N., Brahman, F., Chaturvedi, S., Clark, E., Iyyer, M., and Martin, L. J. (Eds.), Proceedings of the Third Workshop on Narrative Understanding, pp. 48–55, Virtual. Association for Computational Linguistics. DOI: https://doi.org/10.18653/v1/2021.nuse-1.5.
Moretti, F. (2008). A literatura vista de longe. Editora Arquipélago.
Moss-Racusin, C., Dovidio, J., Brescoll, V., Graham, M., and Handelsman, J. (2012). Science faculty’s subtle gender biases favor male students. Proceedings of the National Academy of Sciences, 109:16474–16479. DOI: https://doi.org/10.1073/pnas.1211286109.
Salles, I. and Pappa, G. (2021). Viés de Gênero em Biografias da Wikipédia em Português. In Anais do X Brazilian Workshop on Social Network Analysis and Mining, pp. 211–216, Porto Alegre, RS, Brasil. SBC. DOI: https://doi.org/10.5753/brasnam.2021.16142.
Schlösser, A. and Fantin, G. (2022). Percepção de mulheres acerca de conteúdos sexuais na música popular do Brasil. Ayvu: Revista de Psicologia, 9.
Silva, T. (2023). Mapeamento de Danos e Discriminação Algorítmica. Available in: [link]. Last access: 23 May 2025.
Soares, T., Gumiel, Y., Junqueira, R., Gomes, T., and Pagano, A. (2023). Viés de gênero na tradução automática do GPT-3.5 turbo: avaliando o par linguístico inglês-português. In Anais do XIV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, pp. 167–176, Porto Alegre, RS, Brasil. SBC. DOI: https://doi.org/10.5753/stil.2023.234186.
Sun, T., Gaut, A., Tang, S., Huang, Y., ElSherief, M., Zhao, J., Mirza, D., Belding, E., Chang, K.-W., and Wang, W. Y. (2019). Mitigating Gender Bias in Natural Language Processing: Literature Review. In Korhonen, A., Traum, D., and Màrquez, L. (Eds.), Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics, pp. 1630–1640, Florence, Italy. Association for Computational Linguistics. DOI: https://doi.org/10.18653/v1/P19-1159.
Taso, F., Reis, V., and Martinez, F. (2023a). Discriminação Algorítmica de Gênero: Estudo de Caso e Análise no Contexto Brasileiro. In Anais do IV Workshop sobre as Implicações da Computação na Sociedade, pp. 13–25, Porto Alegre, RS, Brasil. SBC. DOI: https://doi.org/10.5753/wics.2023.229980.
Taso, F., Reis, V., and Martinez, F. (2023b). Sexismo no Brasil: análise de um Word Embedding por meio de testes baseados em associação implícita. In Anais do XIV Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana, pp. 53–62, Porto Alegre, RS, Brasil. SBC. DOI: https://doi.org/10.5753/stil.2023.233845.
Wan, Y., Pu, G., Sun, J., Garimella, A., Chang, K.-W., and Peng, N. (2023). “Kelly is a Warm Person, Joseph is a Role Model”: Gender Biases in LLM-Generated Reference Letters. In Bouamor, H., Pino, J., and Bali, K. (Eds.), Findings of the Association for Computational Linguistics: EMNLP 2023, pp. 3730–3748, Singapore. Association for Computational Linguistics. DOI: https://doi.org/10.18653/v1/2023.findings-emnlp.243.
Wolf, N. (1991). The Beauty Myth: How Images of Beauty Are Used Against Women. HarperCollins.
Downloads
Published
How to Cite
Issue
Section
License
Copyright (c) 2025 Janaina Nogueira de Souza Lopes, Vitória Pereira Firmino, Valéria Quadros dos Reis

This work is licensed under a Creative Commons Attribution 4.0 International License.
JIS is free of charge for authors and readers, and all papers published by JIS follow the Creative Commons Attribution 4.0 International (CC BY 4.0) license.


