Содержание курса Deep Reinforcement Learning
Запись на курс здесь. Канал в телеграм для оперативных объявлений: https://t.me/DeepRLfall2017.
Семинары:
- Definitions. Type of tasks (prediction, control). Bellman equations.
- Value methods, generalized policy iteration (Q-learning, policy iteration).
- Policy gradient methods (Vanilla PG + baselines).
- Advanced policy gradient (PPO, TRPO) and actor-critic methods (A2C).
- Model-based RL (MCTS, PILCO).
- Exploration techniques.
- Other topics and research frontiers.
Домашние задания:
- Survey. Definitions and Bellman equations. Programming assignment: tabular Q-learning.
- Deep Q-learning.
- Policy gradient.
Syllabus для курса будет взят из курса CS294 от Berkeley University: http://rll.berkeley.edu/deeprlcourse/
Видео-лекции будут использоваться вот отсюда: youtube.com
Written on September 6, 2017