일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- airflow 설치
- 데이터시각화
- 다중 JOIN
- SUM
- GROUPBY
- join
- Limit
- solvesql
- mysql :=
- SQL
- matplotlib
- TRUNCATE
- 그로스해킹
- 데이터분석
- 프로그래머스
- 전처리
- not in
- SQLite
- 결측값
- pandas
- having
- 파이썬
- PostgreSQL
- hackerrank
- seaborn
- 머신러닝
- MySQL
- Round
- Oracle
- 데이터리안 웨비나
Archives
- Today
- Total
Milky's note
[Part 2] 시각화-바그래프 본문
bar 그래프¶
bar 그래프는 그룹별로 비교할 때 유용하다.
먼저 pandas를 이용하여 데이터 셋을 가져와서 그래프를 그리고, matplotlib.plot 라이브러리를 이용해서 파라미터 값을 하나씩 구성할 예정이다.
pandas 활용¶
In [1]:
import pandas as pd
#우선 판다스 라이브러리를 import
import matplotlib.pyplot as plt
#다음으로 그래프를 그리기 위한 matplotlib.pyplot 라이브러리를 import 한다.
# 한글 입력이 되지 않을 때는 다음 줄을 입력해주면 된다.
# 맥에는 나눔 고딕이 아닌 애플고딕을 사용해야한다.
from matplotlib import rc
rc('font', family='AppleGothic')
plt.rcParams['axes.unicode_minus'] = False
In [ ]:
plt.rcParams["figure.figsize"] = (12, 9)
In [ ]:
df.plot()
Plot 그래프¶
plot의 kind 옵션을 통해 원하는 그래프를 그릴 수 있다.
In [2]:
df = pd.read_csv('https://bit.ly/ds-house-price-clean')
In [3]:
df.groupby('지역')['분양가'].mean()
Out[3]:
지역 강원 2448.156863 경기 4133.952830 경남 2858.932367 경북 2570.465000 광주 3055.043750 대구 3679.620690 대전 3176.127389 부산 3691.981132 서울 7308.943396 세종 2983.543147 울산 2990.373913 인천 3684.302885 전남 2326.250000 전북 2381.416268 제주 3472.677966 충남 2534.950000 충북 2348.183962 Name: 분양가, dtype: float64
In [4]:
df.groupby('지역')['분양가'].mean().plot(kind='bar')
Out[4]:
<AxesSubplot:xlabel='지역'>
In [5]:
df.groupby('지역')['분양가'].mean().plot(kind='barh')
# kind에 barh를 사용하면 가로형 그래프로 사용할 수 있다.
Out[5]:
<AxesSubplot:ylabel='지역'>
In [21]:
df.groupby('지역')['분양가'].mean().plot(kind='bar', color='r', width=0.9)
Out[21]:
<AxesSubplot:xlabel='지역'>
In [22]:
df.groupby('지역')['분양가'].mean().plot(kind='barh', color='y', width=0.9)
# kind에 barh를 사용하면 가로형 그래프로 사용할 수 있다.
Out[22]:
<AxesSubplot:ylabel='지역'>
matplotlib.plot 라이브러리 활용¶
In [15]:
import numpy as np
subject = ['math', 'science', 'history']
score = [100, 50, 70]
x = np.arange(len(subject))
#주어진 범위와 간격에 따라 균일한 값을 갖는 배열을 리턴
plt.bar(x, score)
plt.xticks(x, subject)
plt.xlabel('exam subject', fontsize=14)
plt.ylabel('exam score', fontsize=14)
plt.show()
In [16]:
import numpy as np
subject = ['math', 'science', 'history']
score = [100, 50, 70]
x = np.arange(len(subject))
#주어진 범위와 간격에 따라 균일한 값을 갖는 배열을 리턴
plt.bar(x, score, color="y")
plt.xticks(x, subject)
plt.xlabel('exam subject', fontsize=14)
plt.ylabel('exam score', fontsize=14)
plt.show()
In [17]:
import numpy as np
subject = ['math', 'science', 'history']
score = [100, 50, 70]
x = np.arange(len(subject))
#주어진 범위와 간격에 따라 균일한 값을 갖는 배열을 리턴
plt.bar(x, score, color="y", width=0.4)
plt.xticks(x, subject)
plt.xlabel('exam subject', fontsize=14)
plt.ylabel('exam score', fontsize=14)
plt.show()
In [27]:
import numpy as np
subject = ['math', 'science', 'history']
score = [100, 50, 70]
x = np.arange(len(subject))
#주어진 범위와 간격에 따라 균일한 값을 갖는 배열을 리턴
#plt.bar(x, score, color="y", width=0.4)
plt.barh(x, score, color="y", height=0.4)
#plt.xticks(x, subject)
plt.yticks(x, subject)
plt.xlabel('exam score', fontsize=14)
plt.ylabel('exam subject', fontsize=14)
plt.show()
'Python > 요약 정리' 카테고리의 다른 글
[Part 2] 시각화-고밀도 산점 그래프 (0) | 2022.02.13 |
---|---|
[Part 2] 시각화-히스토그램 (0) | 2022.01.19 |
[Part 2] 시각화-라인그래프 (0) | 2022.01.10 |
[Part 1] Pandas(전처리) (0) | 2021.12.13 |
[Part 1] Pandas(기본 설명) (0) | 2021.12.12 |
Comments