We read every piece of feedback, and take your input very seriously.
To see all available qualifiers, see our documentation.
d3b975f
一条完整的赛道 三个不同训练时长的模型可以选择 1 在包含一个弯道的赛道训练30分钟 2 在完整赛道训练240分钟(但训练时的赛道比较宽 所以该模型在训练的赛道会漂移后反向行进) 3 在当前的比模型2更窄的赛道并且根据赛道的方向给予奖励 反向给予惩罚的情况下训练60多分钟