Data에 따른 Learning 방법
- unsupervised learning, semi-supervised learning: data 없이 학습을 시켜보자
- online learning: 현재 가진 data로 학습, sequential하게 새로 들어온 input을 재학습
- active learning: 어떤 data를 labeling해야 좋을까 제안
- synthetic image, augmentation: data를 많이 만들자
Active Learning
번역은 능동 학습입니다.
반대로 제공받는 라벨링 데이터만을 가지고 모델을 학습시키는 방법을 passive learning이라고 표현합니다.
예를 들어, 레이블링이 되어있지 않은 두 클래스로 나누어진 데이터가 있다고 해봅시다. 모든 점을 레이블링하지 못한 상황일 때, 몇 개의 인스턴스를 뽑아 그 인스턴스만 레이블링을 진행하여 학습을 진행합니다.
학습 결과인 decision boundary(hyperplane)은 아마 두 클래스를 정확하게 분리하고 있지 못할 것입니다. 이 때에, decision boundary에 가까운 인스턴스들(->즉, 학습에 효율적인 인스턴스들)만을 레이블링하여 학습을 진행합니다.
이렇게 하면 잘못 검출된 클래스의 수가 적어집니다.
효율적인 데이터만을 레이블링하여 학습을 진행하면 보다 적은 레이블링으로 좋은 모델을 얻을 수 있게 되고, 이 방법을 active learning이라고 부릅니다.
즉, 신뢰도가 낮은 hard example을 찾아 레이블링해서 다시 넣어주면 학습의 결과가 개선될 것을 기대할 수 있다는 것입니다.
'Machine Learning & Deep Learning' 카테고리의 다른 글
머신러닝 Loss Function 이해하기 (0) | 2020.03.03 |
---|---|
AI(Artificial Intelligence), ML(Machine Learning), DL(Deep Learning) 차이점 알아보기 (0) | 2020.01.23 |
딥러닝 프레임워크 - Tensorflow vs PyTorch (0) | 2019.12.18 |