- 主要内容
- 周三:对强化学习(reinforcement learning)的初步介绍
- Markov 决策过程
- Q-learning
- 应用:吃豆人游戏等
- 周五:深度强化学习介绍
- Policy Gradient & REINFORCE 算法
- A3C 算法
- 模仿学习(Imitation Learning)
- 应用:Atari 游戏, AlphaGo 围棋等
- 周三:对强化学习(reinforcement learning)的初步介绍
- 报告人:罗宇矗
- 开始时间:本周三、周五(8月23、25日)上午 9:40
- 地点:东校区会议室
学习建议:建议大家先从下面的两组视频课程中选择一组学习,学完后再仔细阅读后面提供的文字资料,完成这些后,在自己电脑上安装 Keras 并跑一跑文档中的示例代码。也务必认真阅读 Keras 中文文档中的新手指南和快速开始。遇到问题先查文档,解决不了再在 Twist 上讨论解决。
- 选项一:CS231n (240分钟)
- 中文字幕版(2016)观看地址:网易云课堂
- 需注册后观看,注意对应下面列出的“内容”项学习,这个课程的内容很好,前几节课的部分内容已经在前面有学过,大家也可以在完成这些内容的学习后再复习一遍
- 注意:这周内容比较多,在【神经网络训练细节】这一内容中,大家可以只学 part1
- 英文原版含英文字幕(2017):YouTube
- 本周学习内容
- Introduction to Neural Networks [反向传播与神经网络初步]
- Convolutional Neural Networks [卷积神经网络详解]
- Training Neural Networks, part I [神经网络训练细节 part1]
- 中文字幕版(2016)观看地址:网易云课堂
- 选项二:Machine Learning 2017, 李宏毅,台湾大学 (260分钟)
- Keras 中文文档
- CS231n 课程笔记
(本项目内容修改自 Udacity ML Nanodegree digit_recognition)
截止日期:8 月 26 日(星期六) 18:30 提交邮箱:[email protected] 邮件以及附件格式: 暑期研讨班作业-姓名-Week_6
这个项目推荐使用 Python 2.7 (使用 Python 3 的同学需要自行解决兼容问题),需要安装下面这些python包:
你同样需要安装好相应软件使之能够运行Jupyter Notebook。
初始代码包含在 assignment\digit_recognition.ipynb
这个notebook文件中。这里面有一些代码已经实现好来帮助你开始项目,但是为了完成项目,你还需要实现附加的功能。
在命令行中,确保当前目录为 assignment
,运行下列命令:
jupyter notebook digit_recognition.ipynb
这会启动 Jupyter Notebook 并把项目文件打开在你的浏览器中。