Milky's note

Chap 1. 머신러닝 기초 본문

머신러닝/요약 정리

Chap 1. 머신러닝 기초

밀뿌 2022. 2. 14. 02:52

- 머신러닝과 딥러닝 차이점

- 인공지능: 사람의 지능을 모방하여, 사람이 하는 것과 같이 복잡한 일을 할 수 있게 기계를 만드는 것

- 머신러닝: 기본적으로 알고리즘을 이용하여 데이터를 분석 및 학습하며, 학습한 내용을 기반으로 판단 또는 예측

- 딥러닝: 인공신경망에서 발전한 형태의 인공지능. 머신러닝 중 하나의 방법론

 

즉, 머신러닝은 데이터를 기반으로 패턴을 학습하여 결과를 추론하는 것

- 머신러닝 종류

지도 학습(Supervised Learning)

  • 회귀(Regression)
    수치형 값을 예측하는 행위
    (ex. 집 값, 가격, 온도 등등)
  • 분류(Classification)
    분류형 값을 예측하는 행위
    (ex. 스팸메일, 종류 판별, 암 진단 등등)

비지도 학습(Unsupervised Learning)

  • 군집화(Clustering)
    그룹핑
    분류랑 다른 점은 데이터를 학습시키지 않아도 데이터가 알아서 그룹핑이 됨
  • 차원 축소(Dimentionality Redection)
    추후 정리 예정

- 머신러닝 용어 정리

가설함수(Hypothesis)

X와 Y의 값이 다음과 같을 때, 둘의 관계를 가설함수라는 수식으로 세워볼 수 있다.

가설함수는 다음처럼 H(x)로 나타낼 수 있다.

손실함수(Loss Function)

가설함수로 예측한 값과 실제 값이 얼마나 떨어져있는지 구하는 함수이다.(오차)

가설함수에서 실제 Y값을 뺀 값과 같다.

당연한 말이지만, 손실의 총 합이 0에 가까울 수록 정확도가 높은 값을 구할 수 있다.

 

손실함수로부터의 절대 값 거리를 구하기 위해서 손실함수에는 제곱을 해준다.

이를 제곱 오차라고 부른다.

 

또한, 데이터의 개수가 많아지면 손실이 커지므로, 전체 손실의 평균을 구한다.(제곱오차/데이터개수)

이를 평균 제곱 오차라고 부른다.

 

즉, 손실의 최소를 찾는 것이 알고리즘의 핵심!!

이러한 과정 중에 나온 것이 경사하강법(Gradient Descent)

최적의 해를 찾아서 경사를 타고 내려오는 방법

사이킷런 라이브러리에 구현이 되어 있음

 

'머신러닝 > 요약 정리' 카테고리의 다른 글

Chap 3. sklearn 전처리  (0) 2022.02.16
Chap 2. sklearn 개요  (0) 2022.02.16
Comments