diff --git a/gym-control/scripts/train-all.sh b/gym-control/scripts/train-all.sh deleted file mode 100755 index 9d0a207..0000000 --- a/gym-control/scripts/train-all.sh +++ /dev/null @@ -1,5 +0,0 @@ -(sh scripts/train-qlearn.sh)& -(sh scripts/train-cem.sh)& -(sh scripts/train-sarsa.sh)& -(sh scripts/train-dqn.sh)& -(sh scripts/train-duel-dqn.sh)& diff --git a/gym-control/scripts/train-cem.sh b/gym-control/scripts/train-cem.sh index 51e9dcc..0b0b593 100755 --- a/gym-control/scripts/train-cem.sh +++ b/gym-control/scripts/train-cem.sh @@ -6,35 +6,35 @@ do (export CUDA_VISIBLE_DEVICES=1 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward noisy)& (export CUDA_VISIBLE_DEVICES=2 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward noisy)& (export CUDA_VISIBLE_DEVICES=3 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=4 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=5 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=0 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=1 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=4 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=5 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=6 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=7 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=2 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=3 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=4 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=5 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=0 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=1 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=2 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=3 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=0 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=1 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=2 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=3 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=4 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=5 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=6 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=7 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=4 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=5 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=0 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=1 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=2 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=3 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=4 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=5 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=0 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=1 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=2 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=3 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=4 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=5 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=6 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=7 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate)& (export CUDA_VISIBLE_DEVICES=0 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward surrogate --smooth True)& (export CUDA_VISIBLE_DEVICES=1 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward surrogate --smooth True)& (export CUDA_VISIBLE_DEVICES=2 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward surrogate --smooth True)& (export CUDA_VISIBLE_DEVICES=3 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=4 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=5 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=4 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=5 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=4 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=5 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=6 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=7 && python cem_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate --smooth True)& done diff --git a/gym-control/scripts/train-dqn.sh b/gym-control/scripts/train-dqn.sh index e20268c..96efea5 100755 --- a/gym-control/scripts/train-dqn.sh +++ b/gym-control/scripts/train-dqn.sh @@ -6,35 +6,35 @@ do (export CUDA_VISIBLE_DEVICES=1 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward noisy)& (export CUDA_VISIBLE_DEVICES=2 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward noisy)& (export CUDA_VISIBLE_DEVICES=3 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=4 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=5 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=6 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=7 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=4 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=5 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=6 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=7 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy)& (export CUDA_VISIBLE_DEVICES=0 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward noisy --smooth True)& (export CUDA_VISIBLE_DEVICES=1 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward noisy --smooth True)& (export CUDA_VISIBLE_DEVICES=2 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward noisy --smooth True)& (export CUDA_VISIBLE_DEVICES=3 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=4 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=5 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=6 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=7 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=4 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=5 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=6 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=7 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy --smooth True)& (export CUDA_VISIBLE_DEVICES=0 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward surrogate)& (export CUDA_VISIBLE_DEVICES=1 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward surrogate)& (export CUDA_VISIBLE_DEVICES=2 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward surrogate)& (export CUDA_VISIBLE_DEVICES=3 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=4 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=5 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=6 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=7 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=4 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=5 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=6 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=7 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate)& (export CUDA_VISIBLE_DEVICES=0 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward surrogate --smooth True)& (export CUDA_VISIBLE_DEVICES=1 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward surrogate --smooth True)& (export CUDA_VISIBLE_DEVICES=2 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward surrogate --smooth True)& (export CUDA_VISIBLE_DEVICES=3 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=4 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=5 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=6 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=7 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=4 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=5 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=6 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=7 && python dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate --smooth True)& done diff --git a/gym-control/scripts/train-duel-dqn.sh b/gym-control/scripts/train-duel-dqn.sh index ae3e8f4..78e879b 100755 --- a/gym-control/scripts/train-duel-dqn.sh +++ b/gym-control/scripts/train-duel-dqn.sh @@ -6,35 +6,35 @@ do (export CUDA_VISIBLE_DEVICES=1 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward noisy)& (export CUDA_VISIBLE_DEVICES=2 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward noisy)& (export CUDA_VISIBLE_DEVICES=3 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=4 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=5 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=6 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=7 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=4 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=5 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=6 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=7 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy)& (export CUDA_VISIBLE_DEVICES=0 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward noisy --smooth True)& (export CUDA_VISIBLE_DEVICES=1 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward noisy --smooth True)& (export CUDA_VISIBLE_DEVICES=2 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward noisy --smooth True)& (export CUDA_VISIBLE_DEVICES=3 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=4 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=5 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=6 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=7 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=4 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=5 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=6 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=7 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy --smooth True)& (export CUDA_VISIBLE_DEVICES=0 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward surrogate)& (export CUDA_VISIBLE_DEVICES=1 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward surrogate)& (export CUDA_VISIBLE_DEVICES=2 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward surrogate)& (export CUDA_VISIBLE_DEVICES=3 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=4 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=5 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=6 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=7 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=4 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=5 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=6 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=7 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate)& (export CUDA_VISIBLE_DEVICES=0 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward surrogate --smooth True)& (export CUDA_VISIBLE_DEVICES=1 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward surrogate --smooth True)& (export CUDA_VISIBLE_DEVICES=2 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward surrogate --smooth True)& (export CUDA_VISIBLE_DEVICES=3 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=4 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=5 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=6 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=7 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=4 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=5 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=6 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=7 && python duel_dqn_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate --smooth True)& done diff --git a/gym-control/scripts/train-sarsa.sh b/gym-control/scripts/train-sarsa.sh index f805752..663e396 100755 --- a/gym-control/scripts/train-sarsa.sh +++ b/gym-control/scripts/train-sarsa.sh @@ -6,35 +6,35 @@ do (export CUDA_VISIBLE_DEVICES=1 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward noisy)& (export CUDA_VISIBLE_DEVICES=2 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward noisy)& (export CUDA_VISIBLE_DEVICES=3 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=4 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=5 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=6 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy)& -(export CUDA_VISIBLE_DEVICES=7 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=4 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=5 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=6 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy)& +(export CUDA_VISIBLE_DEVICES=7 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy)& (export CUDA_VISIBLE_DEVICES=0 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward noisy --smooth True)& (export CUDA_VISIBLE_DEVICES=1 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward noisy --smooth True)& (export CUDA_VISIBLE_DEVICES=2 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward noisy --smooth True)& (export CUDA_VISIBLE_DEVICES=3 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=4 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=5 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=6 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy --smooth True)& -(export CUDA_VISIBLE_DEVICES=7 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=4 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=5 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=6 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward noisy --smooth True)& +(export CUDA_VISIBLE_DEVICES=7 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward noisy --smooth True)& (export CUDA_VISIBLE_DEVICES=0 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward surrogate)& (export CUDA_VISIBLE_DEVICES=1 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward surrogate)& (export CUDA_VISIBLE_DEVICES=2 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward surrogate)& (export CUDA_VISIBLE_DEVICES=3 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=4 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=5 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=6 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate)& -(export CUDA_VISIBLE_DEVICES=7 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=4 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=5 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=6 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate)& +(export CUDA_VISIBLE_DEVICES=7 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate)& (export CUDA_VISIBLE_DEVICES=0 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.1 --reward surrogate --smooth True)& (export CUDA_VISIBLE_DEVICES=1 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.2 --reward surrogate --smooth True)& (export CUDA_VISIBLE_DEVICES=2 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.3 --reward surrogate --smooth True)& (export CUDA_VISIBLE_DEVICES=3 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.4 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=4 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=5 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=6 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate --smooth True)& -(export CUDA_VISIBLE_DEVICES=7 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=4 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.6 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=5 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.7 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=6 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.8 --reward surrogate --smooth True)& +(export CUDA_VISIBLE_DEVICES=7 && python sarsa_cartpole.py --log_dir $log_dir --error_positive 0.9 --reward surrogate --smooth True)& done