Skip to content

LABSensing/LabSesing-case-study

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

101 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Estudo do laboratório de Sensoriamento Remoto da Universidade da Amazonia (UNAMA) sobre o trabalho "Predicting the pulse of the Amazon: Machine learning insights into deforestation dynamics"

1. Coleta de Dados

  • Fontes de Dados:

    • Dados de Desmatamento: Utilize dados do PRODES (Programa de Monitoramento da Floresta Amazônica por Satélite) do INPE (Instituto Nacional de Pesquisas Espaciais). Disponível em: http://www.obt.inpe.br/.

    • Dados de Focos de Incêndio: Utilize dados do BDQUEIMADAS do INPE. Disponível em: http://queimadas.dgi.inpe.br/.

    • Dados Socioeconômicos: Utilize dados do IBGE (Instituto Brasileiro de Geografia e Estatística) para variáveis como PIB, produção agrícola, população, etc. Disponível em: https://www.ibge.gov.br/.

    • Dados de Crédito Rural: Utilize dados do Banco Central do Brasil. Disponível em: https://www.bcb.gov.br/.

    • Dados de Unidades de Conservação: Utilize dados do ISA (Instituto Socioambiental). Disponível em: https://www.socioambiental.org/.

    • Dados de Partidos Políticos: Utilize dados de governadores e partidos políticos disponíveis no Wikipedia.

  • Variáveis Selecionadas:

    • Desmatamento (km²) ✔️
    • Focos de Incêndio ✔️
    • PIB (R$) ✔️
    • Área Plantada ou Colhida (hectares) ✔️
    • Valor da Produção Agrícola (R$) ✔️
    • PIB Agrícola Estadual (R$) ✔️
    • População ✔️
    • Fluxo de Crédito Rural (R$) ✔️
    • Extensão de Unidades de Conservação (hectares) ✔️
    • Rebanho Bovino (cabeças) ✔️
    • Área de Culturas Permanentes (hectares) ✔️
    • Área de Culturas Temporárias (hectares) ✔️
    • Produção de Milho (R$) ✔️
    • Produção de Soja (R$) ✔️
    • Despesa Orçamentária (R$) ✔️
    • Partido Político do Governador ✔️

2.Processamento dos Dados:

    • Dados Processados:
      • Partido Político do Governador ✔️
      • Desmatamento ✔️
      • Área de Culturas Temporárias ✔️
      • Produção de Milho (R$) ✔️
      • Produção de Soja(R$) ✔️
      • Despesas Orçamentárias ✔️
      • Área plantada ou colhida (hectares) ✔️
      • Focos de Incêndio ✔️
      • Área de Culturas Permanentes (hectares) ✔️
      • Extra: Dados Territoriais de todos os estados ✔️ ✔️✔️
    • Dados Não Processados:
      • População ❌
      • PIB (R$) ❌
      • Extensão de Unidades de Conservação (hectares) ❌
      • Fluxo de Crédito Rural (R$)❌
      • Rebanho Bovino (cabeças)❌
      • PIB Agrícola Estadual (R$)❌

2. ❌ Análise Estatística dos Dados

  • *Juntar os Datasets Desmatamento + (Milho/ T.km**2) *: ❌
  • *Juntar os Datasets Desmatamento + (Soja/ T.km**2): ❌
  • *Juntar os Datasets Desmatamento + (Cabeça(Gado)/ T.km**2): ❌
  • *Juntar os Datasets Desmatamento + (Cabeça(Gado)/ T.km2 + (Soja/ T.km2) + (Milho/ T.km**2):❌

3. Análise Exploratória de Dados

  • Gráficos Temporais:
    • Crie gráficos de linha para identificar padrões temporais nas variáveis.
  • Matriz de Correlação:
    • Analise a correlação entre as variáveis para identificar relações significativas.

4. Modelagem

  • Algoritmos de Machine Learning:
    • Árvores de Decisão
    • Random Forest
    • Extra Trees
    • Gradient Boosting
    • Support Vector Machine (SVM)
  • Avaliação de Modelos:
    • Utilize métricas como coeficiente de determinação (R²), erro quadrático médio (MSE) e erro absoluto médio (MAE) para avaliar o desempenho dos modelos.
  • Importância das Variáveis:
    • Utilize SHAP (SHapley Additive exPlanations) para interpretar a importância das variáveis nos modelos.

5. Implementação

  • Ferramentas:
    • Utilize Python com bibliotecas como Pandas, scikit-learn, SHAP, e Matplotlib/Seaborn para visualização.
  • Ambiente:
    • Utilize Google Colab ou um ambiente local com Python instalado.

6. Execução e Validação

  • Treinamento dos Modelos:
    • Treine os modelos com o conjunto de treinamento e avalie com o conjunto de teste.
  • Validação Cruzada:
    • Utilize validação cruzada para garantir que os modelos não estão superajustados.
  • Interpretação dos Resultados:
    • Utilize SHAP para interpretar a contribuição de cada variável para as previsões dos modelos.

7. Conclusão e Relatório

  • Análise dos Resultados:
    • Compare o desempenho dos modelos e discuta as variáveis mais importantes.
  • Recomendações de Políticas:
    • Com base nos resultados, proponha políticas para mitigar o desmatamento.

8. Publicação e Compartilhamento

  • Disponibilização dos Dados:
    • Disponibilize os dados e códigos utilizados para replicação e validação por outros pesquisadores.

Resumo dos Passos:

  1. Coletar dados das fontes mencionadas.
  2. Pré-processar os dados (transformação categórica, normalização, divisão em treino/teste).
  3. Treinar e avaliar modelos de machine learning (Árvores de Decisão, Random Forest, Extra Trees, Gradient Boosting, SVM).
  4. Realizar análise exploratória e interpretar os resultados com SHAP.
  5. Concluir com recomendações políticas e disponibilizar dados e códigos.

About

Estudo do laboratório de Sensoriamento Remoto da Universidade da Amazonia (UNAMA) sobre o trabalho "Predicting the pulse of the Amazon: Machine learning insights into deforestation dynamics" DOI: https://doi.org/10.1016/j.jenvman.2024.121359

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors