使用机器学习让飞思卡尔小车实现自动驾驶（基于摄像头）

ml-agents介绍(重点看)

ml-agents创建简单环境中文示例

安装ml-agents(了解)

安装unity3D 2018.4.18f1
Install the com.unity.ml-agents Unity package ml-agents-0.14.1
Unity ML-Agent之Agents设计(部分内容已经和最新版本不对应但可以参考名词翻译部分)
码云同步项目地址
深度学习PPO算法简介

按照教程安装集成环境Anaconda

关于车轮组件问题

车身抖动是个综合现象
- 不过有个罩住四个轮子的车体是必不可少的
车子漂移是要调整前向和侧向摩擦力
- 需要结合悬挂和重力很麻烦而且还有可能导致车子又变抖

WheelCollider示例里的摩擦力设置会导致车子抓地力无限大

WheelCollider中文手册

完成游戏逻辑、小车控制、奖惩设置

调整ml-agents/config/trainer_config.yaml 里面的参数（不会调用默认参数就还行）
重命名为 mlagents-learn config/config.yaml 在命令行中运行：

mlagents-learn config/config.yaml --run-id=WJAutoCar-1 --train
mlagents-learn config/config.yaml --env=E:/WJAutoCar/build/WJAutoCar.exe --run-id=WJAutoCar-1 --train
(其中WJAutoCar是游戏中大脑的名字)
然后在unity中点击▶️运行
开始进行训练后，ml-agents 文件夹将包含一个 summaries 目录。为了更详细地观测训练过程，您可以使用 TensorBoard。在命令行中运行：

tensorboard --logdir=summaries
然后导航至 localhost:6006。
3D Balance Ball 环境入门
ml-agents创建简单环境中文示例
Unity3D ML-Agent-0.8.1 学习二（单代理学习）(写制作场景的过程可以参考)
从 TensorBoard 中，您将看到摘要统计信息：
- Lesson - 只有在进行课程训练时才有意义。 3D Balance Ball 环境中不使用此项。
- Cumulative Reward - 所有 agent 的平均累积场景奖励。在成功训练期间应该增大。
- Entropy - 模型决策的随机程度。在成功训练过程中应该缓慢减小。如果减小得太快，应增大 beta 超参数。
- Episode Length - 所有 agent 在环境中每个场景的平均长度。
- Learning Rate - 训练算法搜索最优 policy 时需要多大的步骤。随着时间推移应该减小。
- Policy Loss - policy 功能更新的平均损失。与 policy （决定动作的过程）的变化程度相关。此项的幅度在成功训练期间应该减小。
- Value Estimate - agent 访问的所有状态的平均价值估算。在成功训练期间应该增大。
- Value Loss - 价值功能更新的平均损失。与模型对每个状态的价值进行预测的能力相关。此项在成功训练期间应该减小。

关于自动驾驶的思考

假设我们在训练一个外卖员送外卖我们会给外卖员设定送到朝向目标移动的奖励同时我们会给外卖员不遵守交通规则以及超时的惩罚然而就在超时和遵守交通规则的两难里面机器学习的外卖员自然也会像人类一样稍微不遵守交通规则从而在规定时间内送到因为这样奖励更多所以在机器学习的训练中如何让模型不做那些人类伦理所不能接受的事情也是要注意的一个点

现存问题

训练时摄像头和多个位置速度传感器并存时训练得非常慢甚至像没有使用摄像头摸黑训练一样
当车辆重置时车轮还有惯性旋转

已解决问题

车辆速度奖励获取异常

将奖励车辆速度的触发放在AgentAction方法中而不要放在Update中因为在训练过程中是加速的Update会比正常速度调用少很多
道路存在极少素材重叠

使用ProGrids设置靠近吸附来拼接赛道就能够有效防止重叠和细小的缝隙
车辆控制非常差

更换车轮组件Wheel Controller 3D

下一步要做

PPO强化学习的中文解释
Tensorflow训练参数解释
增加不同赛道
增加车辆及行人躲避训练
Marathon Environments

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

使用机器学习让飞思卡尔小车实现自动驾驶（基于摄像头）

ml-agents介绍(重点看)

安装ml-agents(了解)

按照教程安装集成环境Anaconda

关于车轮组件问题

完成游戏逻辑、小车控制、奖惩设置

关于自动驾驶的思考

现存问题

已解决问题

下一步要做

Files

README.md

Latest commit

History

README.md

File metadata and controls

使用机器学习让飞思卡尔小车实现自动驾驶（基于摄像头）

ml-agents介绍(重点看)

安装ml-agents(了解)

按照教程安装集成环境Anaconda

关于车轮组件问题

完成游戏逻辑、小车控制、奖惩设置

关于自动驾驶的思考

现存问题

已解决问题

下一步要做