👩💻/pandas
4. 머신러닝 데이터 분석(0)
글로랴
2021. 2. 4. 17:10
Machine Learning (기계학습)
컴퓨터가 스스로 학습하여 인공지능의 성능을 향상 시키는 기술 방법
🎂 머신러닝 종류
- 🍒 Reinforcement Learning (강화 학습) : 어떤 환경에서 정의된 에이전트가 현재의 상태를 인식하여 선택 가능한 행동들 중 보상을 최대화 하는 행동 혹은 행동 순서를 선택하는 방법
- 🧊 Supervised Learning (지도 학습) : 정답 데이터(Label)가 포함된 데이터를 통해 컴퓨터를 학습시키는 방법
- Prediction(예측)
- Regression(회귀분석), ANN(신경망)
- Classification(분류)
- K-NN(k-최근접 이웃), Naive Bayes(나이브 베이즈), SVM(서포트 벡터 머신), Decision Tree(의사결정 나무)
- Prediction(예측)
- 🍰 Unsupervised Learning (비지도 학습) : 정답 데이터(Label) 없이 컴퓨터 스스로 데이터의 숨은 패턴을 찾아내는 방법
- Clustering(군집)
- Association Rules(연관 규칙), k-means Clustering(k-평균 군집화)
- Clustering(군집)
- 🍩Semi-Supervised Learning (준지도 학습)
📋 머신러닝 프로세스
- 데이터 정리 및 준비
- 결측치 확인 및 처리 / 제거 / 치환
- 범주형 데이터 → 수치형 데이터
- 정규화 / 표준화
- 데이터 분리 - 훈련(train) 데이터 / 검증(test) 데이터
- 알고리즘 준비 및 선택
- 모형 학습 - 훈련(train) 데이터
- 예측 - 검증(test) 데이터
- 모형 평가
- 모형 활용
반응형