Содержание курса Deep Reinforcement Learning

Запись на курс здесь. Канал в телеграм для оперативных объявлений: https://t.me/DeepRLfall2017.

Семинары:

  1. Definitions. Type of tasks (prediction, control). Bellman equations.
  2. Value methods, generalized policy iteration (Q-learning, policy iteration).
  3. Policy gradient methods (Vanilla PG + baselines).
  4. Advanced policy gradient (PPO, TRPO) and actor-critic methods (A2C).
  5. Model-based RL (MCTS, PILCO).
  6. Exploration techniques.
  7. Other topics and research frontiers.

Домашние задания:

  1. Survey. Definitions and Bellman equations. Programming assignment: tabular Q-learning.
  2. Deep Q-learning.
  3. Policy gradient.

Syllabus для курса будет взят из курса CS294 от Berkeley University: http://rll.berkeley.edu/deeprlcourse/

Видео-лекции будут использоваться вот отсюда: youtube.com

Written on September 6, 2017