SVM
2개의 범주를 분류하는 이진분류기
# 이진분류란? 그렇다 / 아니다 2개로 분류하는 것
어느 카테고리에 속할 것인지 판단하는 비확률적 이진 선형 분류 모델을 만들게 된다.
EX) 텍스트, 이미지 분류
검은선 : Decision boundary(결정 경계)
파란선 : Magin(마진)
파란선을 잇는 도형 : Support Vector(서포터 백터)
SVM알고리즘은 Magin이 가장 큰 Decision boundary(결정 경계)를 긋는 알고리즘이다.
Kernel trick(커널 트릭)
선형으로 분리되지않는 비선형 데이터들을 분류할때 사용한다.
현재 데이터보다 고차원으로 차원을 옮겨서 선형분리가 가능한 데이터로 바꾼다.
위의 그림과 같이 2차원에서 선형적으로 분리되지 않는 데이터들을 3차원의 공간으로 옮겨서 선형분류가 가능하게 만든다.
장점
비선형 분리 데이터를 커널트릭을 사용하여 분류 모델링 가능
고차원 공간에서 원할하게 작동
텍스트, 이미지 분류에 효과적
단점
대용량 데이터셋 처리에는 많은 시간이 소요
확률 추정치를 직접적으로 반환하지 않음
구현
추가예정
'Emotion > 인공지능 기초' 카테고리의 다른 글
앙상블 학습법(Ensemble Learning) (0) | 2020.09.29 |
---|---|
로지스틱 회귀(Logistic Regression) (0) | 2020.09.29 |
선형회귀(linear regression) (0) | 2020.09.24 |
나이브 베이즈 (0) | 2020.09.24 |
랜덤 포레스트 (0) | 2020.09.16 |