Name		Name	Last commit message	Last commit date
parent directory ..
config		config
core		core
gifs		gifs
models		models
README.md		README.md
environment.yml		environment.yml
main.py		main.py
rollout.py		rollout.py

README.md

Twin Delayed DDPG

TD3 can be seen as an improved version of DDPG, which utilizes clipped double q-learning, meaning that it learns two action value functions instead of one.

Also, the actor updates are delayed (updates are less frequent than the critic updates).


The result of trained DDPG agent after 500 episodes for HalfCheetah environment.


The result of trained DDPG agent after 500 episodes for Pendulum environment.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

TD3

TD3

README.md

Twin Delayed DDPG

Files

TD3

Directory actions

More options

Directory actions

More options

Latest commit

History

TD3

Folders and files

parent directory

README.md

Twin Delayed DDPG