R2D2

RECURRENT EXPERIENCE REPLAY IN DISTRIBUTED REINFORCEMENT LEARNING (n-step Q-learning is not implemented)

conda env create --file environment.yaml

OpenAI Gym environment

python models/lstm_burn_in/run.py

Marlo environment

python models/lstm_burn_in/run_marlo.py

Name		Name	Last commit message	Last commit date
Latest commit History 1 Commit
debugs		debugs
models		models
.DS_Store		.DS_Store
.gitignore		.gitignore
README.md		README.md
environment.yml		environment.yml
reward_plotter.py		reward_plotter.py
run.py		run.py

Provide feedback