GitHub - lpanjwani/MARL-drones: Drone Automation using Multi-Agent Reinforcement Learning

Multi-Agent Reinforcement Learning Drones

Introduction

This project is a multi-agent reinforcement learning project that uses MAPPO and MADDPG algorithms to train a group of drones. The drones are trained in a simulated environment adopted from Gym-PyBullet-Drones.

Dependencies

Installation

python3 -m pip install -e .

Usage

Single Agent

Policy Proximal Optimization (PPO)

gui=False
record_video=True
n_gpu = 1
algo_type = "hover"
action_type = "pid"

python scripts/learning/singleagent_ppo.py \
  --env=$algo_type \
  --act=$action_type \
  --record_video=$record_video \
  --gui=$gui

Deep Deterministic Policy Gradient (DDPG)

gui=False
record_video=True
n_gpu = 1
algo_type = "hover"
action_type = "pid"

python scripts/learning/singleagent_ddpg.py \
  --env=$algo_type \
  --act=$action_type \
  --record_video=$record_video \
  --gui=$gui

Multi-Agent

Policy Proximal Optimization (PPO)

For Training:

gui=False
record_video=True
num_drones = 2
n_gpu = 0
algo_type = "flock"

RLLIB_NUM_GPUS=$n_gpu \
  python scripts/learning/multiagent_ppo.py \
  --env $algo_type \
  --num_drones $num_drones \
  --record_video=$record_video \
  --gui=$gui

For Testing:

colab=True
gui=False
record_video=True
result_folder="./results/save-flock-2-cc-kin-rpm-08.21.2023_13.55.36"

python scripts/learning/test_multiagent_ppo.py \
  --exp $result_folder \
  --record_video=$record_video \
  --gui=$gui \
   --colab=$colab

Deep Deterministic Policy Gradient (DDPG)

For Training:

gui=False
record_video=True
num_drones = 2
n_gpu = 0
algo_type = "flock"

RLLIB_NUM_GPUS=$n_gpu \
  python scripts/learning/multiagent_ddpg.py \
  --env $algo_type \
  --num_drones $num_drones \
  --record_video=$record_video \
  --gui=$gui

For Testing:

colab=True
gui=False
record_video=True
result_folder="./results/save-flock-2-cc-kin-rpm-08.21.2023_13.55.36"

python scripts/learning/test_multiagent_ddpg.py \
  --exp $result_folder \
  --record_video=$record_video \
  --gui=$gui \
   --colab=$colab

Results

csv =  "./results/save-flock-2-cc-kin-rpm-08.21.2023_13.55.36/DDPG/progress.csv"
label = "Multi-Agent DDPG"

python scripts/visualize/results.py \
  --csv $csv \
  --label $label

Name		Name	Last commit message	Last commit date
Latest commit History 732 Commits
gym_pybullet_drones		gym_pybullet_drones
scripts		scripts
.gitignore		.gitignore
CITATION.cff		CITATION.cff
LICENSE		LICENSE
README.md		README.md
notebook.ipynb		notebook.ipynb
pypi_description.md		pypi_description.md
pyproject.toml		pyproject.toml

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Multi-Agent Reinforcement Learning Drones

Introduction

Dependencies

Installation

Usage

Single Agent

Policy Proximal Optimization (PPO)

Deep Deterministic Policy Gradient (DDPG)

Multi-Agent

Policy Proximal Optimization (PPO)

Deep Deterministic Policy Gradient (DDPG)

Results

About

Uh oh!

Releases

Packages

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Multi-Agent Reinforcement Learning Drones

Introduction

Dependencies

Installation

Usage

Single Agent

Policy Proximal Optimization (PPO)

Deep Deterministic Policy Gradient (DDPG)

Multi-Agent

Policy Proximal Optimization (PPO)

Deep Deterministic Policy Gradient (DDPG)

Results

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Uh oh!

Contributors

Uh oh!

Languages

Packages