Como analisar o discurso dos deputados sobre mudanças climáticas utilizando técnicas vinculadas ao processamento de linguagem natural?
Atualmente, a temática referente à mudança climática se destaca por apontar um dos maiores desafios que enfrentamos na sociedade. Seu impacto socioambiental já é visível em todo o mundo, com aumento das temperaturas, intensificação de eventos climáticos extremos, e consequências graves para a biodiversidade e os seres humanos. Sendo fundamental que governos, organizações e indivíduos tomem medidas concretas para enfrentar este desafio.
Neste sentido, é importante acompanhar as políticas e discursos dos representantes governamentais sobre as mudanças climáticas. Eles são os responsáveis por criar leis e estabelecer medidas para proteger o meio ambiente e combater as mudanças climáticas. Entender o que eles estão falando sobre o assunto, se estão comprometidos em tomar medidas concretas e se estão alinhados com as metas e objetivos internacionais se torna uma ação crucial para lidar com os desafios da contemporaneidade.
Nesse contexto, ferramentas vinculadas ao processamento de linguagem natural são poderosas para a análise de discursos[1]. Com a popularização da inteligência artificial e de modelos específicos para essa área, agora é possível fazer análises mais aprofundadas e precisas dos discursos dos deputados em relação às mudanças climáticas.
A análise do discurso permite identificar tendências e padrões nas palavras e frases usadas pelos deputados em relação ao clima, e também ajuda a avaliar o grau de comprometimento dos políticos com a temática. Além disso, é possível comparar os discursos de deputados de diferentes partidos e regiões para verificar se há diferenças nas abordagens e prioridades.
Levando em conta os aspectos supracitados, o objetivo deste texto é apresentar algumas dicas e exemplos de como fazer análise de discurso de deputados sobre mudanças climáticas usando o Python. Nas subseções seguintes deste texto, vamos mostrar como coletar dados de fontes online, limpá-los e prepará-los para análise[2]. Finalmente, vamos disponibilizar o código fonte para que outros interessados possam replicar e expandir esta pesquisa.
Coletar dados de fontes online
Os dados sobre os discursos dos deputados podem ser coletados a partir do site do Congresso Nacional brasileiro[3]: https://dadosabertos.camara.leg.br/swagger/api.html#api.
Esses dados podem ser extraídos manualmente ou a partir de um API. O API é uma interface de programação de aplicativos que permite acessar os dados de forma automatizada e integrada a outros sistemas. Neste caso, o API foi implementado no código Python aqui disponibilizado, permitindo que os dados sejam coletados de forma mais eficiente e rápida.
Limpando e preparando os dados para análise
Para a realização da análise dos discursos, é importante a utilização de técnicas que visam limpar e preparar os dados para modelagem posteriores. No presente texto, foram realizadas as seguintes ações nos discursos dos deputados:
- Remoção de acentos: essa técnica remove os acentos dos textos para que o processamento possa ser realizado sem distinção entre letras acentuadas e não acentuadas.
- Remoção de stopwords: as stopwords são palavras comuns, como “é”, “e”, “de”, “em”, que não acrescentam informação significativa para a análise de discurso. Portanto, são removidas para reduzir o volume de dados a ser processado.
- Remoção de pontuação: essa técnica remove todas as pontuações dos textos, incluindo vírgulas, pontos, exclamações, entre outras, para que o processamento seja realizado apenas com as palavras.
A execução das etapas acima resultou em uma lista de texto limpo e preparado para análise. A partir deste, foi realizada a contagem de palavras relacionadas ao tema “mudança climática”. Um corpus de palavras relacionadas a esse tema, como “clima”, “alteração climática”, “aquecimento global”, “crise climática”, entre outras, foi criado e utilizado para a contagem dessas palavras nos discursos dos deputados. Isso permitiu avaliar a importância que cada deputado dá ao tema e a compreender a posição de cada um sobre o assunto. Os dados coletados sobre os discursos abarcaram o período de janeiro de 1988 a agosto de 2022. É importante destacar que principalmente nos primeiros anos, há uma série de informações faltantes na base de dados disponibilizada pelo Congresso Nacional brasileiro.
Resultados
A partir dos dados foram construídos gráficos estáticos e dinâmicos para a apresentação dos dados. Estes abarcaram os seguintes aspectos em relação aos discursos sobre a temática “mudanças climáticas”:
- Deputados que apresentaram o maior número de discursos
- Partidos que apresentaram o maior número de discursos
- Estados que apresentaram o maior número de discursos por seus deputados
- Anos que apresentaram o maior número de discursos
- Anos de nascimento dos deputados que apresentaram o maior número de discursos
Detalhadamente, foram apresentados os gráficos estáticos e dinâmicos abaixo para a maioria dos aspectos acima. Cabe destacar que em relação ao gráfico dinâmico, é possível observar como o número de discursos foi ocorrendo ao longo dos anos.
Adicionalmente, é importante informar que a contagem de palavras não considerou o contexto em que o corpus de palavra utilizado foi proferido. Nesse sentido, é importante cautela nas análises, visto que possivelmente muitas dessas palavras foram ditas com uma conotação que vai de encontro com o enfrentamento da crise climática. Por último, destaca-se a possibilidade de informações não catalogadas pela base de dados do Congresso Nacional. Assim, o valor total de discursos pode ser inexato.
O Gráfico 1 e 2 abaixo apresentam os deputados que apresentaram o maior número de discursos nos anos analisados.
Gráfico 1: Deputados que apresentaram o maior número de discursos (estático)
Fonte: elaboração própria. Dados do Congresso Nacional brasileiro.
Gráfico 2: Deputados que apresentaram o maior número de discursos (dinâmico)
Fonte: elaboração própria. Dados do Congresso Nacional brasileiro.
O Gráfico 3 e 4 abaixo apresentam os partidos políticos que apresentaram o maior número de discursos de deputados vinculados, considerando os anos analisados.
Gráfico 3: Partidos que apresentaram o maior número de discursos (estático)
Fonte: elaboração própria. Dados do Congresso Nacional brasileiro.
Gráfico 4: Partidos que apresentaram o maior número de discursos (dinâmico)
Fonte: elaboração própria. Dados do Congresso Nacional brasileiro.
O Gráfico 5 e 6 abaixo apresentam os Estados que apresentaram o maior número de discursos de deputados vinculados, considerando os anos analisados.
Gráfico 5: Estados que apresentaram o maior número de discursos por seus deputados (estático)
Fonte: elaboração própria. Dados do Congresso Nacional brasileiro.
Gráfico 6: Estados que apresentaram o maior número de discursos por seus deputados (dinâmico)
Fonte: elaboração própria. Dados do Congresso Nacional brasileiro.
O Gráfico 7 abaixo apresenta os anos que apresentaram o maior número de discursos, considerando os aqueles aqui analisados. Foi adicionado apenas o gráfico estático.
Gráfico 7: Anos que apresentaram o maior número de discursos (estático)
Fonte: elaboração própria. Dados do Congresso Nacional brasileiro.
O Gráfico 8 e 9 abaixo exibem os anos de nascimento dos deputados que apresentaram o maior número de discursos, considerando o período analisado.
Gráfico 8: Anos de nascimento dos deputados que apresentaram o maior número de discursos (estático)
Fonte: elaboração própria. Dados do Congresso Nacional brasileiro.
Gráfico 9: Anos de nascimento dos deputados que apresentaram o maior número de discursos (dinâmico)
Fonte: elaboração própria. Dados do Congresso Nacional brasileiro.
Link do código fonte em Python
Para acessar o código e realizar as ações aqui explicitadas, desde o download dos discursos, até a construção dos gráficos, acessar o repositório do Github: cpscesar/deputyspeech: The files in this repository contain the Python codes for the text published on Medium. #NLP (github.com).
Por fim, destaca-se que o código disponibilizado pode ser facilmente adaptado para outros corpus de palavras.
Caso tenha qualquer dúvida/sugestão sobre o conteúdo do texto e código, envie um comentário abaixo.
[1] Me refiro aqui ao significado mais amplo da análise de discurso e não em relação a uma técnica de análise de dados qualitativos.
[2] Não será abordado neste texto a implementação de modelos de processamento de linguagem natural. Este assunto será abordado em textos posteriores.
[3] Esta pesquisa se restringe ao Brasil. Contudo, as técnicas aqui apresentadas podem ser aplicadas em outros discursos e, também, para temáticas distintas daquelas aqui apresentadas.