Estudo do laboratório de Sensoriamento Remoto da Universidade da Amazonia (UNAMA) sobre o trabalho "Predicting the pulse of the Amazon: Machine learning insights into deforestation dynamics"
-
Fontes de Dados:
-
Dados de Desmatamento: Utilize dados do PRODES (Programa de Monitoramento da Floresta Amazônica por Satélite) do INPE (Instituto Nacional de Pesquisas Espaciais). Disponível em: http://www.obt.inpe.br/.
-
Dados de Focos de Incêndio: Utilize dados do BDQUEIMADAS do INPE. Disponível em: http://queimadas.dgi.inpe.br/.
-
Dados Socioeconômicos: Utilize dados do IBGE (Instituto Brasileiro de Geografia e Estatística) para variáveis como PIB, produção agrícola, população, etc. Disponível em: https://www.ibge.gov.br/.
-
Dados de Crédito Rural: Utilize dados do Banco Central do Brasil. Disponível em: https://www.bcb.gov.br/.
-
Dados de Unidades de Conservação: Utilize dados do ISA (Instituto Socioambiental). Disponível em: https://www.socioambiental.org/.
-
Dados de Partidos Políticos: Utilize dados de governadores e partidos políticos disponíveis no Wikipedia.
-
-
Variáveis Selecionadas:
- Desmatamento (km²) ✔️
- Focos de Incêndio ✔️
- PIB (R$) ✔️
- Área Plantada ou Colhida (hectares) ✔️
- Valor da Produção Agrícola (R$) ✔️
- PIB Agrícola Estadual (R$) ✔️
- População ✔️
- Fluxo de Crédito Rural (R$) ✔️
- Extensão de Unidades de Conservação (hectares) ✔️
- Rebanho Bovino (cabeças) ✔️
- Área de Culturas Permanentes (hectares) ✔️
- Área de Culturas Temporárias (hectares) ✔️
- Produção de Milho (R$) ✔️
- Produção de Soja (R$) ✔️
- Despesa Orçamentária (R$) ✔️
- Partido Político do Governador ✔️
-
- Dados Processados:
- Partido Político do Governador ✔️
- Desmatamento ✔️
- Área de Culturas Temporárias ✔️
- Produção de Milho (R$) ✔️
- Produção de Soja(R$) ✔️
- Despesas Orçamentárias ✔️
- Área plantada ou colhida (hectares) ✔️
- Focos de Incêndio ✔️
- Área de Culturas Permanentes (hectares) ✔️
- Extra: Dados Territoriais de todos os estados ✔️ ✔️✔️
- Dados Processados:
-
- Dados Não Processados:
- População ❌
- PIB (R$) ❌
- Extensão de Unidades de Conservação (hectares) ❌
- Fluxo de Crédito Rural (R$)❌
- Rebanho Bovino (cabeças)❌
- PIB Agrícola Estadual (R$)❌
- Dados Não Processados:
- *Juntar os Datasets Desmatamento + (Milho/ T.km**2) *: ❌
- *Juntar os Datasets Desmatamento + (Soja/ T.km**2): ❌
- *Juntar os Datasets Desmatamento + (Cabeça(Gado)/ T.km**2): ❌
- *Juntar os Datasets Desmatamento + (Cabeça(Gado)/ T.km2 + (Soja/ T.km2) + (Milho/ T.km**2):❌
- Gráficos Temporais:
- Crie gráficos de linha para identificar padrões temporais nas variáveis.
- Matriz de Correlação:
- Analise a correlação entre as variáveis para identificar relações significativas.
- Algoritmos de Machine Learning:
- Árvores de Decisão
- Random Forest
- Extra Trees
- Gradient Boosting
- Support Vector Machine (SVM)
- Avaliação de Modelos:
- Utilize métricas como coeficiente de determinação (R²), erro quadrático médio (MSE) e erro absoluto médio (MAE) para avaliar o desempenho dos modelos.
- Importância das Variáveis:
- Utilize SHAP (SHapley Additive exPlanations) para interpretar a importância das variáveis nos modelos.
- Ferramentas:
- Utilize Python com bibliotecas como Pandas, scikit-learn, SHAP, e Matplotlib/Seaborn para visualização.
- Ambiente:
- Utilize Google Colab ou um ambiente local com Python instalado.
- Treinamento dos Modelos:
- Treine os modelos com o conjunto de treinamento e avalie com o conjunto de teste.
- Validação Cruzada:
- Utilize validação cruzada para garantir que os modelos não estão superajustados.
- Interpretação dos Resultados:
- Utilize SHAP para interpretar a contribuição de cada variável para as previsões dos modelos.
- Análise dos Resultados:
- Compare o desempenho dos modelos e discuta as variáveis mais importantes.
- Recomendações de Políticas:
- Com base nos resultados, proponha políticas para mitigar o desmatamento.
- Disponibilização dos Dados:
- Disponibilize os dados e códigos utilizados para replicação e validação por outros pesquisadores.
- Coletar dados das fontes mencionadas.
- Pré-processar os dados (transformação categórica, normalização, divisão em treino/teste).
- Treinar e avaliar modelos de machine learning (Árvores de Decisão, Random Forest, Extra Trees, Gradient Boosting, SVM).
- Realizar análise exploratória e interpretar os resultados com SHAP.
- Concluir com recomendações políticas e disponibilizar dados e códigos.