일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 그로스해킹
- GROUPBY
- hackerrank
- pandas
- 머신러닝
- seaborn
- 결측값
- 프로그래머스
- 파이썬
- SQLite
- airflow 설치
- 전처리
- 다중 JOIN
- 데이터리안 웨비나
- SUM
- TRUNCATE
- matplotlib
- not in
- join
- Limit
- PostgreSQL
- 데이터시각화
- having
- mysql :=
- Oracle
- solvesql
- Round
- MySQL
- SQL
- 데이터분석
- Today
- Total
목록머신러닝 (3)
Milky's note
전처리 : 데이터 분석에 적합하게 데이터를 가공/변형/처리/정리 해주는 과정 1. 결측치 - 데이터 중에 빠져있는 값들을 어떻게 처리할 것인지? - pandas의 fillna()를 사용해도 되지만, 2개 이상의 컬럼에 대해서는 SimpleImputer 를 사용한다. from sklearn.impute import SimpleImputer #median 값을 이용해서 결측값 처리 impute = SimpleImputer(strategy='median') result = impute.fit_transform(train[['Age']]) fit_transform는 결측치에 학습한 내용을 적용하는 함수이다. train[['Age']] = result 2. 이상치 - 데이터의 이상치가 있을 때 어떻게 처리할 것인..
- 학습(fit), 예측(predict) LinearRegression 모델로 간단하게 학습과 예측을 구현해보려고 한다. 기본 사용 방법은 다음과 같다. # 라이브러리 불러오기 from sklearn.linear_model import LinearRegression # 모델 선언 model = LinearRegression() # 모델에 데이터 학습 model.fit(x, y) # 모델이 학습이 얼마나 되었는 지 검증 (=예측) prediction = model.predict(x2) 다음의 데이터로 LinearRegression 모델의 간단한 학습과 예측을 수행하였다. import numpy as np from sklearn.linear_model import LinearRegression # 샘플 데이..
- 머신러닝과 딥러닝 차이점 - 인공지능: 사람의 지능을 모방하여, 사람이 하는 것과 같이 복잡한 일을 할 수 있게 기계를 만드는 것 - 머신러닝: 기본적으로 알고리즘을 이용하여 데이터를 분석 및 학습하며, 학습한 내용을 기반으로 판단 또는 예측 - 딥러닝: 인공신경망에서 발전한 형태의 인공지능. 머신러닝 중 하나의 방법론 즉, 머신러닝은 데이터를 기반으로 패턴을 학습하여 결과를 추론하는 것 - 머신러닝 종류 지도 학습(Supervised Learning) 회귀(Regression) 수치형 값을 예측하는 행위 (ex. 집 값, 가격, 온도 등등) 분류(Classification) 분류형 값을 예측하는 행위 (ex. 스팸메일, 종류 판별, 암 진단 등등) 비지도 학습(Unsupervised Learning..