일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- seaborn
- 머신러닝
- having
- 파이썬
- MySQL
- TRUNCATE
- matplotlib
- Oracle
- Round
- SQLite
- pandas
- 다중 JOIN
- PostgreSQL
- join
- airflow.cfg
- airflow 설치
- 데이터분석
- 프로그래머스
- Limit
- SUM
- solvesql
- SQL
- 데이터리안 웨비나
- GROUPBY
- 결측값
- 데이터시각화
- not in
- 그로스해킹
- hackerrank
- 전처리
- Today
- Total
목록머신러닝 (3)
Milky's note
전처리 : 데이터 분석에 적합하게 데이터를 가공/변형/처리/정리 해주는 과정 1. 결측치 - 데이터 중에 빠져있는 값들을 어떻게 처리할 것인지? - pandas의 fillna()를 사용해도 되지만, 2개 이상의 컬럼에 대해서는 SimpleImputer 를 사용한다. from sklearn.impute import SimpleImputer #median 값을 이용해서 결측값 처리 impute = SimpleImputer(strategy='median') result = impute.fit_transform(train[['Age']]) fit_transform는 결측치에 학습한 내용을 적용하는 함수이다. train[['Age']] = result 2. 이상치 - 데이터의 이상치가 있을 때 어떻게 처리할 것인..
- 학습(fit), 예측(predict) LinearRegression 모델로 간단하게 학습과 예측을 구현해보려고 한다. 기본 사용 방법은 다음과 같다. # 라이브러리 불러오기 from sklearn.linear_model import LinearRegression # 모델 선언 model = LinearRegression() # 모델에 데이터 학습 model.fit(x, y) # 모델이 학습이 얼마나 되었는 지 검증 (=예측) prediction = model.predict(x2) 다음의 데이터로 LinearRegression 모델의 간단한 학습과 예측을 수행하였다. import numpy as np from sklearn.linear_model import LinearRegression # 샘플 데이..
- 머신러닝과 딥러닝 차이점 - 인공지능: 사람의 지능을 모방하여, 사람이 하는 것과 같이 복잡한 일을 할 수 있게 기계를 만드는 것 - 머신러닝: 기본적으로 알고리즘을 이용하여 데이터를 분석 및 학습하며, 학습한 내용을 기반으로 판단 또는 예측 - 딥러닝: 인공신경망에서 발전한 형태의 인공지능. 머신러닝 중 하나의 방법론 즉, 머신러닝은 데이터를 기반으로 패턴을 학습하여 결과를 추론하는 것 - 머신러닝 종류 지도 학습(Supervised Learning) 회귀(Regression) 수치형 값을 예측하는 행위 (ex. 집 값, 가격, 온도 등등) 분류(Classification) 분류형 값을 예측하는 행위 (ex. 스팸메일, 종류 판별, 암 진단 등등) 비지도 학습(Unsupervised Learning..