GitHub - DecentGradient/3dtictactoe: Deep Reinforcement Learning agent playing 3D TicTacToe using Deep Deterministic Policy Gradient algorithm

DecentGradient / 3dtictactoe Public

Notifications You must be signed in to change notification settings
Fork 0
Star 1

Deep Reinforcement Learning agent playing 3D TicTacToe using Deep Deterministic Policy Gradient algorithm

Notifications

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
__pycache__		__pycache__
backupscripts		backupscripts
chk/dqvrand		chk/dqvrand
common		common
data		data
plots		plots
3dTicTacToe.pdf		3dTicTacToe.pdf
LICENSE		LICENSE
README		README
__init__.py		__init__.py
capstone (1).pdf		capstone (1).pdf
pgqvrand.py		pgqvrand.py
pgrandvpg.py		pgrandvpg.py
pgvpgrand.py		pgvpgrand.py
randvpgq.py		randvpgq.py

Repository files navigation

Directory List
    backupscripts - experiments done during development imports may not resolve unless moved back to parent
    chk - checkpoints - not used
    common -
        1 benchmark.py - benchmarking objects
        2 dnn.py - deep version of ddpg network and training objects
        3 game.py - the game environment
        4 nn.py - shallow version of dnn.py originally used
        5 q.py - implementation of DQN
        6 replay_buffer.py - memory buffer for dnn
    data - pickled results of experiments
    plots - images generated by pyplot of pickeld data
    results - NA

Scripts in parent directory
    pgqvrand.py - ddpg player 1 vs random player 2
    randvpgq.py   random player 1 vs ddpg player 2
    pgvpgrand.py - ddpg player 1 vs ddpg player 2 with 50% random moves
    pgrandvpg.py - ddpg player with 50% random moves  1 vs ddpg player 2