의사결정트리 ID3 글을 먼저 읽고오는것을 추천한다.
의사결정트리 CART알고리즘의 불순도는 지니계수를 사용한다.
지니계수
불순도를 측정하는 지표, 정보의 기대값
지니계수가 높을수록 불순도가 높고, 지니계수가 낮을수록 불순도가 낮다.
S : 이미 사건의 모음
c : 사건의 개발생한수
특징
CART 알고리즘은 ID3 알고리즘과 달리 이진 분할 형태를 따른다.
숫자 및 범주 형 변수를 모두 처리 할 수 있으며 특이치를 쉽게 처리 가능
단점
하나의 변수에서만 나눌 수 있음
형성된 나무가 불안정 할 수 있음
'Emotion > 인공지능 기초' 카테고리의 다른 글
나이브 베이즈 (0) | 2020.09.24 |
---|---|
랜덤 포레스트 (0) | 2020.09.16 |
의사결정 트리 캐글 (0) | 2020.09.15 |
의사결정 트리 ID3 (1) | 2020.09.15 |
KNN_캐글 (0) | 2020.09.15 |