일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 결측값
- 프로그래머스
- not in
- 그로스해킹
- Round
- SUM
- 전처리
- 데이터리안 웨비나
- MySQL
- Limit
- airflow 설치
- 데이터시각화
- PostgreSQL
- pandas
- SQL
- 파이썬
- SQLite
- seaborn
- join
- TRUNCATE
- matplotlib
- airflow.cfg
- hackerrank
- solvesql
- 머신러닝
- GROUPBY
- having
- 다중 JOIN
- 데이터분석
- Oracle
- Today
- Total
목록Python (25)
Milky's note
· 연속형 데이터 연속형 데이터란, 하나의 변수가 하나의 데이터를 가지고 있던 숫자형 데이터와 달리, 여러개의 데이터를 하나의 변수에 가지고 있는 데이터 타입이다. 연속형 데이터의 크기 제한은 없다. 하지만, 사용하는 컴퓨터의 가용 메모리 용량을 인지하며 사용해야 한다. 각 연속형 데이터 타입마다 특징이 다르다. 그 특징을 파악하여 용도에 맞는 데이터 타입을 사용하는 것이 중요하다. 사전(dictionary) 타입은 associative array라고 불리며, 흔히 알고있는 Hash table 구조이다. 1) 리스트 (List) [ ] 가장 많이 사용되는 연속형 데이터 타입이자, 굉장히 유연한 구조를 가지고 있어 대부분의 데이터를 편하게 다룰 수 있다. 리스트의 원소는 쉼표로 구분되며, 리스트의 원소는 ..
산점도 그래프(Scatter)¶ 두 변수의 상관 관계를 직교 좌표계의 평면에 점으로 표현하는 그래프 점으로 데이터를 표기해 줍니 x, y 값을 넣어주어야함 (hexbin과 유사) numeric 한 column 만 지정 가능 In [1]: import pandas as pd #우선 판다스 라이브러리를 import import matplotlib.pyplot as plt #다음으로 그래프를 그리기 위한 matplotlib.pyplot 라이브러리를 import 한다. # 한글 입력이 되지 않을 때는 다음 줄을 입력해주면 된다. # 맥에는 나눔 고딕이 아닌 애플고딕을 사용해야한다. from matplotlib import rc rc('font', family='AppleGothic'..
area plot, pie plot¶ In [1]: import pandas as pd #우선 판다스 라이브러리를 import import matplotlib.pyplot as plt #다음으로 그래프를 그리기 위한 matplotlib.pyplot 라이브러리를 import 한다. # 한글 입력이 되지 않을 때는 다음 줄을 입력해주면 된다. # 맥에는 나눔 고딕이 아닌 애플고딕을 사용해야한다. from matplotlib import rc rc('font', family='AppleGothic') plt.rcParams['axes.unicode_minus'] = False 샘플 데이터¶ 데이터프레임 로드¶ In [2]: df = pd.read_csv('ht..
BOX Plot¶ 일반적으로 박스 플롯은 전체 데이터로부터 얻어진 아래의 다섯 가지 요약 수치를 사용해서 그려진다. 최소값 제 1사분위 수 (Q1) 제 2사분위 수 또는 중위수 (Q2) 제 3사분위 수 (Q3) 최대값 사분위 수는 데이터를 4등분한 지점을 의미한다. 예를 들어, 제 1사분위 수는 전체 데이터 중 하위 25%에 해당하는 값이고, 제 3사분위 수는 전체 데이터 중 상위 25%에 해당하는 값이다. In [1]: import pandas as pd #우선 판다스 라이브러리를 import import matplotlib.pyplot as plt #다음으로 그래프를 그리기 위한 matplotlib.pyplot 라이브러리를 import 한다. # 한글 입력이 되지 않을 때는 다음 줄을 입력해주면 된다..