Reward Shaping using Difference Rewards (D++)

The underlying architecture is MADDPG, and I am modifying the Multiagent Parlicle Environment such that it returns the shaped reward. Thus take a look at "MPE_custom" repository > dpprs branch.

This is a work in progress.

MADDPG-PyTorch

PyTorch Implementation of MADDPG is taken from Shariq Iqbal.

Requirements

OpenAI baselines, commit hash: 98257ef8c9bd23a24a330731ae54ed086d9ce4a7
My fork of Multi-agent Particle Environments
PyTorch, version: 0.3.0.post4
OpenAI Gym, version: 0.9.4
Tensorboard, version: 0.4.0rc3 and Tensorboard-Pytorch, version: 1.0 (for logging)

The versions are just what I used and not necessarily strict requirements.

How to Run

All training code is contained within main.py. To view options simply run:

python main.py --help

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
algorithms		algorithms
assets		assets
baselines		baselines
utils		utils
.gitignore		.gitignore
.~lock.Experiments.ods#		.~lock.Experiments.ods#
Experiments.ods		Experiments.ods
LICENSE		LICENSE
README.md		README.md
__init__.py		__init__.py
evaluate.py		evaluate.py
evaluate_stat_runs.py		evaluate_stat_runs.py
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reward Shaping using Difference Rewards (D++)

MADDPG-PyTorch

Requirements

How to Run

About

Releases

Packages

Languages

License

yathartha3/DPP

Folders and files

Latest commit

History

Repository files navigation

Reward Shaping using Difference Rewards (D++)

MADDPG-PyTorch

Requirements

How to Run

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages