랩 신입생을 위한 기초 강화학습 스터디
페이지 정보

작성자 최고관리자
댓글 0건 조회 1,549회 작성일 2022-01-21 14:07
본문
1주: RL Basics
- RL frameworks and MDP
- Value functions and Policy iteration
- MC Control
- On-Policy SARSA and Off-Policy Q-Learning
2주: DQN and Policy Gradient Methods
- DQN and Stabilization Techniques (Double DQN, Dueling DQN, PER)
- Theoretical Analysis of PG
- REINFORCE
3주: PG Algorithms
- DPG
- Actor-Critic
- DDPG
- PPO
4주: Advanced PG
- A3C, TD3, SAC
- Meta-RL
- IRL and GAIL
- 이전글2022년도 KAIST 대학원생 급여 상한액 조정에 따른 석박사과정 급여 조정 22.02.07
- 다음글한승태 연구원, 한국인공지능학술대회 2021년도 우수논문상 수상 21.11.18
댓글목록
등록된 댓글이 없습니다.