Deep Reinforcement Learning for HCIL Masters

1. 개요

강화학습을 공부합니다.
실습과 구현에 집중합니다.
전원 완주를 목표로 합니다.

2. 계획

처음 5주 동안 홍콩과기대 김성훈 교수님의 강의를 듣습니다.
다음 2주 동안 Open AI Gym에서 어려운 것 1개 혹은 쉬운 것 2개를 골라서 자유 구현합니다.
- 수강생끼리는 프로젝트가 겹치지 않게 합니다.

회차	날짜	제목	발표자
1	2019.7.15	Dummy Q Learning	김민지
2	2019.7.22	Q-learning exploit & exploration and discounted reward	김준회
3	2019.7.29	Q-learning in nondeterministic world	박관모
4	2019.8.5	Q-network	정석원
5	2019.8.12	DQN	최길웅
6	2019.8.19	프로젝트 구현 1	고형권
7	2019.8.26	프로젝트 구현 2	안단태

강의 동영상 및 자료는 시즌 RL 페이지에서 참조하세요.

3. 진행 방식

3-1. 수강생의 할 일

발표자를 제외한 모든 수강생은 매주 금요일 자정까지 실습 과제를 수행합니다.
또한, 코드와 수행 결과를 요약한 보고서를 발표자에게 보내야 합니다. (필수 내용만 포함해서 간단하게 써주세요)
과제 수행 중 질문사항은 목요일 자정 이후에 발표자에게 물어보세요!

3-2. 발표자의 할 일

발표자는 세미나 시간 전까지 다음을 준비해야 합니다.

목요일 자정 전까지 숙제를 숙지해서 수강생 질문에 대비
자신의 코드를 잘 정리해서(모듈화, 주석 등) 본 레포지토리와 구글 드라이브에 업로드
수강생들의 코드를 본 레포지토리와 구글 드라이브에 업로드
수강생들의 과제 수행률에 대한 점검
학습 내용에 대한 간단한 리뷰

3-3. 세미나 시간에 하는 일

세미나 시간엔 발표자의 브리핑을 듣고, 수강생들이 서로의 코드를 보면서 피드백을 주고 받습니다.

Projects

5주차: 주제 발표

2주 동안 구현할 강화학습 프로젝트 주제 제안발표를 준비해 와주시기 바랍니다 (3 슬라이드 이내)

필수 포함 내용: 환경에 대한 설명(개관, observation space, action space, reward)과 프로젝트의 목표 수치

너무 쉬운 주제를 가져오시면 청중의 피드백에 의해 반려/강화될 수 있습니다. OpenAI Gym Environment는 다음의 카테고리만 허용됩니다.

Atari
Box2D
MuJoCo
Roboschool
Robotics

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

index.md

index.md

Deep Reinforcement Learning for HCIL Masters

1. 개요

2. 계획

3. 진행 방식

3-1. 수강생의 할 일

3-2. 발표자의 할 일

3-3. 세미나 시간에 하는 일

Projects

5주차: 주제 발표

Files

index.md

Latest commit

History

index.md

File metadata and controls

Deep Reinforcement Learning for HCIL Masters

1. 개요

2. 계획

3. 진행 방식

3-1. 수강생의 할 일

3-2. 발표자의 할 일

3-3. 세미나 시간에 하는 일

Projects

5주차: 주제 발표