强化学习对抗训练

ROBUST REINFORCEMENT LEARNING ON STATE OBSERVATIONS WITH LEARNED OPTIMAL ADVERSARY 中文:基于学习的最优对手的状态观测下的稳健强化学习 解决问题:作者提出了一种交替训练框架(ATLA),在训练过程中在线训练对手和代理,


环境不确定性+RL+AutoDriving+Chen Lv

Towards Safe Autonomous Driving: Decision Making with Observation‑Robust Reinforcement Learning 中文:迈向安全的自动驾驶:基于观察稳健强化学习的决策 对抗代理 目标:最大化自动驾驶汽车策略的受扰动变异距离