Apprenticeship Learning

Intro 지난번 포스팅에서는 Behaviour Cloning(BC)을 이용해서 Dodge 게임을 플레이하는 에이전트를 학습했다. 일반적인 RL과 다르게 BC는...

8 minute read

Behavior Cloning

Intro 강화학습 에이전트는 문제를 푸는 방법을 스스로 학습한다. 이전 포스팅 Sokoban DQN + GradCAM에서 학습한...

10 minute read

Sokoban DQN + GradCAM

ML-Agents로 만든 Sokoban 요새 사내 머신러닝 동호회에서 대여한 “텐서플로와 유니티 ML-Agents로 배우는 강화학습” 책으로 강화학습을...

4 minute read

나이브 베이즈는 왜 나이브한가

Naive Bayes 나이브 베이즈는 무엇인가? 위키피디아 첫 줄을 보자. In machine learning, naïve Bayes classifiers...

5 minute read

Image Embedding with Triplet Loss

Image Embedding with Triplet Loss Embedding 딥러닝 논문이나 포스팅을 보다보면 Embedding이라는 표현이 많이 나온다. 이미지나...

8 minute read

SamplePairing on Small Dataset

Intro It’s hard to find image classifiers that do not employ Image Augmentation techniques. We...

8 minute read

matplotlib 플롯을 GIF로 찍어보자

celluloid 같은 팀에 똑똑한 동료로부터 오늘 신박한 파이썬 라이브러리를 하나 소개받았다. celluloid라는 녀석인데, matplotlib 플롯을...

5 minute read