반응형
머신 러닝이란?
단어 그대로 기계를 학습한다
머신이란?
인간이 제공한 데이터를 표현할 수 있는 모델(함수)
학습이란?
데이터를 가장 잘 표현할 수 있는 모델을 찾는 것 (모델의 파라미터 최적화)
어떤 형태의 데이터가 머신에게 주어지는지에 따라 다음의 세부 분야들로 분류됨
- 비지도 학습
- 지도 학습
- 강화 학습
Supervised Learning (지도 학습)
1. 회귀
- Linear and Nolinear Regression (선형 및 비선형 회귀)
- Gradient Descent (경사하강법)
- Bias and Variance Trade-off (편향 및 분산 트레이드 오프)
2. 분류
- Logistic and Softmax Regression
- Support Vector Machine
- Decision Tree
- Linear Discriminant Analysis (선형 판별 분석)
3. 앙상블 학습
- Bagging
- Boosting
Unsupervised Learning (비지도 학습)
1. 차원 축소 (전처리)
- Principal Component Analysis
- Singular Value Decomposition
2. 군집화
- K-Means
- Mean Shift
- Gaussian Micture Model
- DBSCAN
데이터의 구성
- 데이터는 피처와 라벨로 구성됨
- 이는 독립변수(피처)와 종속변수(라벨)로도 불림
- 라벨은 y로 표기하며, 라벨의 유무로 지도학습, 비지도 학습 구분
Feature
- 데이터 X의 특징, 혹은 항목을 의미
- N: 데이터 샘플 갯수
D: 피처의 갯수
ex) 혈압, 몸무게, 나이
Parameter(=weight, 파라미터, 가중치)
- 주어진 데이터(입력값)말고, 모델이 가지고 있는 학습 가능한 파라미터
Hyperparameter(하이퍼 파라미터)
- 모델 학습에 있어, 인간이 정해야하는 변수들
학습률, 배치 크기 등
Input(입력값)
- 모델에 입력되는 값으로 데이터의 피처 부분(x로 표기)
Output(출력값)
- 모델로부터 출력되는 예측값 (y로 표기)
선형 모델 vs. 비선형 모델
Linear regression(선형회귀)
- 파라미터를 선형 결합식으로 표현 가능한 모델
Nonlinear regression(비선형회귀)
- 선형 결합식으로 표현 불가능한 모델
[출처]
머신러닝 강의 1편 10시간 완성 - [카카오 추천팀 출신] - 카이스트 AI박사 - YouTube
반응형