일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- matplotlib
- 데이터분석
- SUM
- airflow.cfg
- hackerrank
- Oracle
- solvesql
- 파이썬
- pandas
- 데이터시각화
- SQL
- airflow 설치
- 데이터리안 웨비나
- PostgreSQL
- having
- Limit
- not in
- Round
- 그로스해킹
- 전처리
- GROUPBY
- 머신러닝
- 다중 JOIN
- TRUNCATE
- join
- 결측값
- 프로그래머스
- MySQL
- seaborn
- SQLite
Archives
- Today
- Total
Milky's note
Chap 1. 머신러닝 기초 본문
- 머신러닝과 딥러닝 차이점
- 인공지능: 사람의 지능을 모방하여, 사람이 하는 것과 같이 복잡한 일을 할 수 있게 기계를 만드는 것
- 머신러닝: 기본적으로 알고리즘을 이용하여 데이터를 분석 및 학습하며, 학습한 내용을 기반으로 판단 또는 예측
- 딥러닝: 인공신경망에서 발전한 형태의 인공지능. 머신러닝 중 하나의 방법론
즉, 머신러닝은 데이터를 기반으로 패턴을 학습하여 결과를 추론하는 것
- 머신러닝 종류
지도 학습(Supervised Learning)
- 회귀(Regression)
수치형 값을 예측하는 행위
(ex. 집 값, 가격, 온도 등등) - 분류(Classification)
분류형 값을 예측하는 행위
(ex. 스팸메일, 종류 판별, 암 진단 등등)
비지도 학습(Unsupervised Learning)
- 군집화(Clustering)
그룹핑
분류랑 다른 점은 데이터를 학습시키지 않아도 데이터가 알아서 그룹핑이 됨 - 차원 축소(Dimentionality Redection)
추후 정리 예정
- 머신러닝 용어 정리
가설함수(Hypothesis)
X와 Y의 값이 다음과 같을 때, 둘의 관계를 가설함수라는 수식으로 세워볼 수 있다.
가설함수는 다음처럼 H(x)로 나타낼 수 있다.
손실함수(Loss Function)
가설함수로 예측한 값과 실제 값이 얼마나 떨어져있는지 구하는 함수이다.(오차)
가설함수에서 실제 Y값을 뺀 값과 같다.
당연한 말이지만, 손실의 총 합이 0에 가까울 수록 정확도가 높은 값을 구할 수 있다.
손실함수로부터의 절대 값 거리를 구하기 위해서 손실함수에는 제곱을 해준다.
이를 제곱 오차라고 부른다.
또한, 데이터의 개수가 많아지면 손실이 커지므로, 전체 손실의 평균을 구한다.(제곱오차/데이터개수)
이를 평균 제곱 오차라고 부른다.
즉, 손실의 최소를 찾는 것이 알고리즘의 핵심!!
이러한 과정 중에 나온 것이 경사하강법(Gradient Descent)
최적의 해를 찾아서 경사를 타고 내려오는 방법
사이킷런 라이브러리에 구현이 되어 있음
'머신러닝 > 요약 정리' 카테고리의 다른 글
Chap 3. sklearn 전처리 (0) | 2022.02.16 |
---|---|
Chap 2. sklearn 개요 (0) | 2022.02.16 |
Comments