Board

Lab board

랩 신입생을 위한 기초 강화학습 스터디

페이지 정보

profile_image

작성자 최고관리자

댓글 0건 조회 1,549회 작성일 2022-01-21 14:07

본문

1주: RL Basics     

  • RL frameworks and MDP
  • Value functions and Policy iteration
  • MC Control                 
  • On-Policy SARSA and Off-Policy Q-Learning 

2주: DQN and Policy Gradient Methods

  • DQN and Stabilization Techniques (Double DQN, Dueling DQN, PER)
  • Theoretical Analysis of PG
  • REINFORCE

3주: PG Algorithms

  • DPG
  • Actor-Critic
  • DDPG
  • PPO

4주: Advanced PG

  • A3C, TD3, SAC
  • Meta-RL
  • IRL and GAIL

댓글목록

등록된 댓글이 없습니다.