일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- PostgreSQL
- pandas
- SQLite
- Oracle
- seaborn
- SUM
- 파이썬
- 결측값
- airflow 설치
- Round
- 데이터분석
- 데이터리안 웨비나
- Limit
- join
- 프로그래머스
- not in
- solvesql
- 데이터시각화
- 다중 JOIN
- having
- 머신러닝
- TRUNCATE
- airflow.cfg
- 전처리
- 그로스해킹
- GROUPBY
- MySQL
- SQL
- matplotlib
- hackerrank
- Today
- Total
목록데이터 시각화 (2)
Milky's note

Part 1. “데이터 시각화 이야기” 도구의 사용법이 아닌, 시각화를 하는 원리와 사례에 대한 이야기 잘못된 시각화 사례 -> 첫번째 후보와 두번째 후보의 지지도가 61과 24로 3배의 차이가 나는데 차트의 크기는 별 차이가 없어 보인다. 시각화 원칙 목적에 맞는 표현 방법 찾기 존 스노우의 콜레라 시각화 주장하고 싶었던 것 : 콜레라는 물로 감염이 된다. 표현 방식 : 지리정보 시각화- 물을 기르는 펌프가 어디있는지 지도에 표시 논리적 사고를 기반으로 그리기 존 스노우의 콜레라 시각화 존 스노우 주장에 대한 반박 의견 : 번화가이고 인구 밀도가 많아서 당연히 감염이 쉽고 치사율이 높다. 존 스노우의 근거 : 노역장, 양조장에서는 밀집도에 비해 사람이 적게 죽었다. -> 펌프물을 쓰지 않기 때문에 왜곡..
히스토그램 (hist)¶ 히스토그램은 도수분포표를 그래프로 나타낸 것으로서, 가로축은 계급, 세로축은 도수 (횟수나 개수 등) 을 나타낸다. 먼저 pandas를 이용하여 데이터 셋을 가져와서 그래프를 그리고, matplotlib.plot 라이브러리를 이용해서 파라미터 값을 하나씩 구성할 예정이다. pandas 활용¶ In [1]: import pandas as pd #우선 판다스 라이브러리를 import import matplotlib.pyplot as plt #다음으로 그래프를 그리기 위한 matplotlib.pyplot 라이브러리를 import 한다. # 한글 입력이 되지 않을 때는 다음 줄을 입력해주면 된다. # 맥에는 나눔 고딕이 아닌 애플고딕을 사용해야한다. from matplotlib impo..