142页"ICML会议"强化学习笔记整理，值得细读-网络知识

CML 是 International Conference on Machine Learning的缩写，即国际机器学习大会。ICML如今已发展为由国际机器学习学会（IMLS）主办的年度机器学习国际顶级会议。其中强化学习便是该会议很重要的一个话题，每年都有非常多的投稿。本文整理了David Abel总结的ICML2018、2019两年的深度强化学习笔记，详看正文。

ICML-2019-RL-Note

作者整理简介：我在本次会议的RL分场上度过了大部分时间（可惜错过了所有主题演讲), 所以我的大部分反思（和笔记）都集中在RL：

关于非策略评估和非策略学习的大量工作（例如，参见Hanna 等人[35]，Le等人[49]，Fujimoto等人[26]，Gottesman等人的工作）等[32]
探索再次成为一个热门话题（参见Mavrin等人[57]，Fatemi等人[25]，Hazan等人[37]，Shani等人[76]的工作）。除了策略评估（以及其他一些评估），这也是RL中的基本问题之一。
一些非常好的工作继续澄清分布式RL [10]（参见[74，57，67]的工作）。
作者认为我们需要标准化RL中的评估。并不是说我们只需要一个单一的方法或一个域，而是目前评估协议中有太多差异。