GAIL on LunarLander-v2

Intro PPO를 다뤘던 지난 포스팅에 이어 이번에는 GAIL을 알아보고 LunarLander-v2에 적용해보자. GAIL Generative Adversarial Imitation...

11 minute read

PPO on LunarLander-v2

Intro 올해 초부터 Inverse Reinforcement Learning을 공부하고 있다. Dodge3를 대상으로 GAIL을 실험하던 도중 학습이 제대로...

12 minute read

Adversarial Attack

Intro 이미지 분류 문제는 더이상 흥미로운 화젯거리가 되지 못하나보다. 2015년 ResNet이 나오면서 처음으로 사람의 인지...

9 minute read

Apprenticeship Learning

Intro 지난번 포스팅에서는 Behaviour Cloning(BC)을 이용해서 Dodge 게임을 플레이하는 에이전트를 학습했다. 일반적인 RL과 다르게 BC는...

8 minute read

Behavior Cloning

Intro 강화학습 에이전트는 문제를 푸는 방법을 스스로 학습한다. 이전 포스팅 Sokoban DQN + GradCAM에서 학습한...

10 minute read

Sokoban DQN + GradCAM

ML-Agents로 만든 Sokoban 요새 사내 머신러닝 동호회에서 대여한 “텐서플로와 유니티 ML-Agents로 배우는 강화학습” 책으로 강화학습을...

4 minute read

나이브 베이즈는 왜 나이브한가

Naive Bayes 나이브 베이즈는 무엇인가? 위키피디아 첫 줄을 보자. In machine learning, naïve Bayes classifiers...

5 minute read