Обучить RL выигрывать в игру симулятор владельца продукта. Онлайн версия игры доступна по ссылке: https://npg-team.itch.io/product-owner-simulator Исходный код игры расположен в приватном репозитории
- Перевести логику игры на Python - код находится в папке game
- Создать интерфейс игры, понятный алгоритму - код лежит в папке environment
- Изучить и написать алгоритм машинного обучения с подкреплением (reinforcement learning) - код лежит в папке algorithms
- Собрать пайплайн обучения - код лежит в папке pipeline
- Написать взаимодействие с веб версией, чтобы сравнить результаты алгоритма с результатами людей - TBA
Можно запустить main.py файл. Он создаст нового агента и начнет его обучене. В процессе будут идти логи для каждого эпизода и важного события в игре.