일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- seaborn
- 데이터분석
- TRUNCATE
- 다중 JOIN
- airflow 설치
- hackerrank
- Oracle
- 그로스해킹
- SQLite
- 파이썬
- 프로그래머스
- pandas
- 결측값
- 데이터시각화
- having
- PostgreSQL
- MySQL
- SQL
- 전처리
- airflow.cfg
- join
- matplotlib
- SUM
- 머신러닝
- GROUPBY
- 데이터리안 웨비나
- not in
- Round
- Limit
- solvesql
- Today
- Total
목록Python/요약 정리 (22)
Milky's note

Seaborn이란? matplotlib을 기본으로 다양한 시각화 기법을 제공하는 라이브러리. pandas DataFrame과 매우 호환성이 높음 e.g. sns.xxxplot(data=df)
· 연속형 데이터 연속형 데이터란, 하나의 변수가 하나의 데이터를 가지고 있던 숫자형 데이터와 달리, 여러개의 데이터를 하나의 변수에 가지고 있는 데이터 타입이다. 연속형 데이터의 크기 제한은 없다. 하지만, 사용하는 컴퓨터의 가용 메모리 용량을 인지하며 사용해야 한다. 각 연속형 데이터 타입마다 특징이 다르다. 그 특징을 파악하여 용도에 맞는 데이터 타입을 사용하는 것이 중요하다. 사전(dictionary) 타입은 associative array라고 불리며, 흔히 알고있는 Hash table 구조이다. 1) 리스트 (List) [ ] 가장 많이 사용되는 연속형 데이터 타입이자, 굉장히 유연한 구조를 가지고 있어 대부분의 데이터를 편하게 다룰 수 있다. 리스트의 원소는 쉼표로 구분되며, 리스트의 원소는 ..
산점도 그래프(Scatter)¶ 두 변수의 상관 관계를 직교 좌표계의 평면에 점으로 표현하는 그래프 점으로 데이터를 표기해 줍니 x, y 값을 넣어주어야함 (hexbin과 유사) numeric 한 column 만 지정 가능 In [1]: import pandas as pd #우선 판다스 라이브러리를 import import matplotlib.pyplot as plt #다음으로 그래프를 그리기 위한 matplotlib.pyplot 라이브러리를 import 한다. # 한글 입력이 되지 않을 때는 다음 줄을 입력해주면 된다. # 맥에는 나눔 고딕이 아닌 애플고딕을 사용해야한다. from matplotlib import rc rc('font', family='AppleGothic'..
area plot, pie plot¶ In [1]: import pandas as pd #우선 판다스 라이브러리를 import import matplotlib.pyplot as plt #다음으로 그래프를 그리기 위한 matplotlib.pyplot 라이브러리를 import 한다. # 한글 입력이 되지 않을 때는 다음 줄을 입력해주면 된다. # 맥에는 나눔 고딕이 아닌 애플고딕을 사용해야한다. from matplotlib import rc rc('font', family='AppleGothic') plt.rcParams['axes.unicode_minus'] = False 샘플 데이터¶ 데이터프레임 로드¶ In [2]: df = pd.read_csv('ht..