본문 바로가기

ML

[머신러닝] 머신러닝이란?

반응형
머신 러닝이란?
단어 그대로 기계를 학습한다

 

머신이란?

인간이 제공한 데이터를 표현할 수 있는 모델(함수)

학습이란? 

데이터를 가장 잘 표현할 수 있는 모델을 찾는 것 (모델의 파라미터 최적화)

 

어떤 형태의 데이터가 머신에게 주어지는지에 따라 다음의 세부 분야들로 분류됨
  • 비지도 학습
  • 지도 학습
  • 강화 학습

 

Supervised Learning (지도 학습)

1. 회귀

  • Linear and Nolinear Regression (선형 및 비선형 회귀)
  • Gradient Descent (경사하강법)
  • Bias and Variance Trade-off (편향 및 분산 트레이드 오프)

2. 분류

  • Logistic and Softmax Regression 
  • Support Vector Machine
  • Decision Tree
  • Linear Discriminant Analysis (선형 판별 분석)

3. 앙상블 학습

  • Bagging
  • Boosting
Unsupervised Learning (비지도 학습)

 

1. 차원 축소 (전처리)

  • Principal Component Analysis
  • Singular Value Decomposition

2. 군집화

  • K-Means
  • Mean Shift
  • Gaussian Micture Model
  • DBSCAN

 

데이터의 구성
  • 데이터는 피처와 라벨로 구성됨
  • 이는 독립변수(피처)와 종속변수(라벨)로도 불림
  • 라벨은 y로 표기하며, 라벨의 유무로 지도학습, 비지도 학습 구분

Feature

  • 데이터 X의 특징, 혹은 항목을 의미
  • N: 데이터 샘플 갯수
    D: 피처의 갯수
    ex) 혈압, 몸무게, 나이

Parameter(=weight, 파라미터, 가중치)

  • 주어진 데이터(입력값)말고, 모델이 가지고 있는 학습 가능한 파라미터

Hyperparameter(하이퍼 파라미터)

  • 모델 학습에 있어, 인간이 정해야하는 변수들
    학습률, 배치 크기 등

Input(입력값)

  • 모델에 입력되는 값으로 데이터의 피처 부분(x로 표기)

Output(출력값)

  • 모델로부터 출력되는 예측값 (y로 표기)

 

선형 모델 vs. 비선형 모델

 

Linear regression(선형회귀)

  • 파라미터를 선형 결합식으로 표현 가능한 모델

Nonlinear regression(비선형회귀)

  • 선형 결합식으로 표현 불가능한 모델

 

 

 

 

 

 

[출처]

머신러닝 강의 1편 10시간 완성 - [카카오 추천팀 출신] - 카이스트 AI박사 - YouTube

 

반응형