4. 머신러닝 데이터 분석(2)

Notice

C, C++, STL, openGL 코드작업

Recent Posts

Recent Comments

Link

« 2025/07 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

wisdiom 아니고 wisdom

4. 머신러닝 데이터 분석(2) - 3 본문

👩‍💻/pandas

4. 머신러닝 데이터 분석(2) - 3

글로랴 2021. 2. 15. 22:30

Decision Tree, 의사결정 나무

트리(Tree) 구조를 사용하며, 각 분기점(node)에는 분석대상의 속성(설명변수)들이 위치한다. 각 분기점마다 목표 값을 잘 분류할 수 있는 속성을 찾아서 배치하고, 해당 속성이 갖는 값을 이용하여 새로운 가지(branch)를 만든다. 각 분기점에서의 최적의 속성을 선택할 때는 해당 속성을 기준으로 분류한 값들이 구분되는 정도를 측정한다. Entropy가 낮을수록 분류가 잘 된 것이며, Entropy가 일정 수준 이하로 낮아질 때까지 앞의 과정을 반복한다.

*Entropy : 다른 종류의 값들이 섞여 있는 정도를 나타내는 것

📍 모형 학습 및 검증

# Decision Tree 분류 모형
from sklearn import tree

# 모형 객체 생성
tree_model = tree.DecisionTreeClassifier(criterion='entropy', max_depth=5)

# 모형 학습
tree_model.fit(x_train, y_train)

# 예측
y_hat = tree_model.predict(x_test)

print(y_hat[0:10])          # [4 4 4 4 4 4 2 2 4 4]
print(y_test.values[0:10])  # [4 4 4 4 4 4 2 2 4 4]

# 모형 성능 평가
# Cofusion Matrix 계산
from sklearn import metrics
tree_matrix = metrics.confusion_matrix(y_test, y_hat)
print(tree_matrix)

print('\n')

tree_report = metrics.classification_report(y_test, y_hat)
print(tree_report)

저작자표시 (새창열림)

'👩‍💻 > pandas' 카테고리의 다른 글

3. 데이터프레임 응용(7) (0)	2021.07.30
4. 머신러닝 데이터 분석 (3) (0)	2021.02.16
4. 머신러닝 데이터 분석(2) - 2 (0)	2021.02.15
4. 머신러닝 데이터 분석(2) - 1 (0)	2021.02.15
4. 머신러닝 데이터 분석(1) (0)	2021.02.05

'👩‍💻/pandas' Related Articles

Comments

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

wisdiom 아니고 wisdom

wisdiom 아니고 wisdom

4. 머신러닝 데이터 분석(2) - 3 본문

4. 머신러닝 데이터 분석(2) - 3

Decision Tree, 의사결정 나무

📍 모형 학습 및 검증

'👩‍💻 > pandas' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역