일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- PostgreSQL
- matplotlib
- MySQL
- 결측값
- 전처리
- SQL
- not in
- seaborn
- SUM
- Limit
- solvesql
- having
- 파이썬
- SQLite
- 데이터분석
- hackerrank
- 프로그래머스
- Oracle
- Round
- 다중 JOIN
- airflow.cfg
- 데이터시각화
- TRUNCATE
- GROUPBY
- airflow 설치
- join
- 그로스해킹
- 머신러닝
- 데이터리안 웨비나
- pandas
Archives
- Today
- Total
Milky's note
[Part 2] 시각화-라인그래프 본문
line 그래프¶
- line 그래프는 데이터가 연속적인 경우 사용하기 적절하다. (예를 들면, 주가 데이터)
먼저 pandas를 이용하여 데이터 셋을 가져와서 그래프를 그리고, matplotlib.plot 라이브러리를 이용해서 파라미터 값을 하나씩 구성할 예정이다.
pandas 활용¶
In [6]:
import pandas as pd
#우선 판다스 라이브러리를 import
import matplotlib.pyplot as plt
#다음으로 그래프를 그리기 위한 matplotlib.pyplot 라이브러리를 import 한다.
# 한글 입력이 되지 않을 때는 다음 줄을 입력해주면 된다.
# 맥에는 나눔 고딕이 아닌 애플고딕을 사용해야한다.
from matplotlib import rc
rc('font', family='AppleGothic')
plt.rcParams['axes.unicode_minus'] = False
In [ ]:
plt.rcParams["figure.figsize"] = (12, 9)
In [ ]:
df.plot()
Plot 그래프¶
plot은 일반 선그래프를 나타낸다.
In [7]:
df = pd.read_csv('https://bit.ly/ds-house-price-clean')
In [11]:
df['분양가'].plot()
#plot가 안될때에는 pip3 install matplotlib로 설치한다
Out[11]:
<AxesSubplot:>
kind 옵션을 통해 원하는 그래프를 그릴 수 있다. 디폴트는 선 그래프이다.
kind 옵션:
* line: 선그래프¶
- bar: 바 그래프
- barh: 수평 바 그래프
- hist: 히스토그램
- kde: 커널 밀도 그래프
- hexbin: 고밀도 산점도 그래프
- box: 박스 플롯
- area: 면적 그래프
- pie: 파이 그래프
- scatter: 산점도 그래프
In [13]:
df['분양가'].plot(kind='line')
Out[13]:
<AxesSubplot:>
In [12]:
df['분양가'].plot(linestyle='dashed')
#선 스타일은 다음과 같이 수정할 수 있다.
#Solid
#dashed
#Dotted
#Dash-dot
Out[12]:
<AxesSubplot:>
In [26]:
df['분양가'].plot(linestyle='dashed', color="r", marker="o")
Out[26]:
<AxesSubplot:>
matplotlib.plot 라이브러리 활용¶
기본 선 그래프는 plot를 사용하여 그린다.
In [2]:
import matplotlib.pyplot as plt
plt.plot([1, 2, 3], [1, 2, 3])
plt.show()
다음은 선 그래프의 선 모양을 나타낼 수 있는 방법이다. 위에 판다스에서 소개한 방법처럼 linestyle='' 의 방법으로 사용해도 되지만 plot 에서 다음과 같이 간단하게 사용할 수 있다.
비교를 하기 쉽게 한 그래프에 4종류의 선을 나타내었다. 디폴트는 역시 solid의 선이다.
In [3]:
plt.plot([1, 2, 3], [4, 4, 4], '-', label='Solid')
plt.plot([1, 2, 3], [3, 3, 3], '--', label='Dashed')
plt.plot([1, 2, 3], [2, 2, 2], ':', label='Dotted')
plt.plot([1, 2, 3], [1, 1, 1], '-.', label='Dash-dot')
plt.axis([0.8, 3.2, 0.5, 5.0])
plt.legend(loc='upper right', ncol=4)
plt.show()
다음은 마커를 표시할 수 있는 방법이다. 두가지 방법이 있다.
먼저, 기본 사용방법이다. 다음 링크에 마커 표에 대한 설명이 있다. 참조해서 여러가지로 사용이 가능하다. https://matplotlib.org/stable/api/_as_gen/matplotlib.pyplot.plot.html
In [16]:
# plt.plot([1, 2, 3, 4], [2, 3, 5, 10], 'bo') # 파란색 + 마커
plt.plot([1, 2, 3, 4], [2, 3, 5, 10], 'ro') # 빨간색 + 마커
plt.show()
선과 마커 동시에 나타낼 수도 있다.
In [17]:
# plt.plot([1, 2, 3, 4], [2, 3, 5, 10], 'bo-') # 파란색 + 마커 + 실선
plt.plot([1, 2, 3, 4], [2, 3, 5, 10], 'ro--') # 빨간색 + 마커 + 점선
plt.show()
다음으로 markers 파라미터를 사용하는 방법이다. 이 파라미터 역시 위에 참조한 링크에서 마커를 골라서 사용할 수 있다.
In [18]:
plt.plot([4, 5, 6], marker="H")
plt.plot([3, 4, 5], marker="d")
plt.plot([2, 3, 4], marker="x")
plt.show()
이들의 색도 변경이 가능하다. 파라미터 값으로 조절하면 된다.
In [20]:
plt.plot([4, 5, 6], marker="H", color="g")
plt.plot([3, 4, 5], marker="d", color="r")
plt.plot([2, 3, 4], marker="x", color="b")
plt.show()
'Python > 요약 정리' 카테고리의 다른 글
[Part 2] 시각화-히스토그램 (0) | 2022.01.19 |
---|---|
[Part 2] 시각화-바그래프 (0) | 2022.01.19 |
[Part 1] Pandas(전처리) (0) | 2021.12.13 |
[Part 1] Pandas(기본 설명) (0) | 2021.12.12 |
[참고 링크] (0) | 2021.12.02 |
Comments