일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- airflow 설치
- 데이터리안 웨비나
- seaborn
- MySQL
- 데이터시각화
- SUM
- GROUPBY
- hackerrank
- TRUNCATE
- pandas
- join
- 그로스해킹
- not in
- having
- 전처리
- airflow.cfg
- matplotlib
- 데이터분석
- Limit
- solvesql
- Oracle
- PostgreSQL
- Round
- SQL
- 머신러닝
- 결측값
- 프로그래머스
- 다중 JOIN
- SQLite
- 파이썬
- Today
- Total
Milky's note
[Webinar Review] 5월 데이터리안 웨비나 - 설득의 시작, 데이터 제대로 보여주는 법 본문
Part 1. “데이터 시각화 이야기”
도구의 사용법이 아닌, 시각화를 하는 원리와 사례에 대한 이야기
잘못된 시각화 사례
-> 첫번째 후보와 두번째 후보의 지지도가 61과 24로 3배의 차이가 나는데 차트의 크기는 별 차이가 없어 보인다.
시각화 원칙
목적에 맞는 표현 방법 찾기
존 스노우의 콜레라 시각화
- 주장하고 싶었던 것 : 콜레라는 물로 감염이 된다.
- 표현 방식 : 지리정보 시각화- 물을 기르는 펌프가 어디있는지 지도에 표시
논리적 사고를 기반으로 그리기
존 스노우의 콜레라 시각화
- 존 스노우 주장에 대한 반박 의견 : 번화가이고 인구 밀도가 많아서 당연히 감염이 쉽고 치사율이 높다.
- 존 스노우의 근거 : 노역장, 양조장에서는 밀집도에 비해 사람이 적게 죽었다. -> 펌프물을 쓰지 않기 때문에
왜곡하지 않기
어떤 왜곡이 일어나는가
- 길이와 면적에서 일어나는 왜곡
- 데이터를 묶어서(aggregation) 표현 할 때 일어나는 왜곡
- 입체를 평면으로 옮길 때 일어나는 왜곡
때로는 의도적으로 왜곡 하기
나이팅 게일 로즈 다이어그램
- 주장하고 싶었던 것 : 병원의 위생 상태를 신경쓰면 병원내 감염으로 인한 사망자를 줄일 수 있다.
- 표현 방식 : 로즈 다이어그램
- 왜곡 해야했던 이유 : 대비되는 효과를 강조하기 위해 -> 주장을 강조하기 위해
빅토리아 시대의 사회상이 여자가 공부를 많이 하면 생식기능을 잃는다고 믿었다...
그래서 여성들이 높은 교육 받는 것을 꺼려하여서 나이팅게일도 남자인 군대 장교에게 뒷받침할 주장을 강조하기 위해 그랬다고 한다.
색 활용하기
우리 눈은 같은 빛의 양이 있는 노란색과 파란색을 볼 때 노란색이 더 밝다고 느낀다.
BI 솔루션들은 우리 눈에 최적화 되어있는 컬러 팔레트를 사용하고 있다.
숫자의 시각화
숫자 데이터의 종류
- Nominal : 생긴 건 숫자인데 숫자의 역할을 하지 않음, 숫자가 같은 지 다른지만 확인 (ex.버스 번호)
- Ordinal : 같다 다르다 크다 작다를 얘기할 수 있는 숫자 (ex.등수)
- Interval : 앞의 2개 특성은 물론, 간격에 대해서도 얘기할 수 있는 숫자
- Ratio : 앞의 3개 특성은 물론, 비율도 얘기할 수 있는 숫자
숫자를 시각화 할 때 주의할 점
- 비율을 0부터 표현하지 않으면 한 눈에 알아보기가 어렵다.
시각화에 지향하는 방법
1. 자연스러운 대응(Natural Mapping)
배경이 검정이면 흰색에 큰 숫자를 매핑하는 것이 좋음
큰 변화를 큰 기울기, 큰 모양 등에 매핑하는 것이 자연스러운 매핑이 가능
2. 데이터가 아닌 것을 제거하기
데이터가 아닌 배경에 색칠하는 것, 그리드를 진하게 표현하는 것은 제거하는 것이 가독성이 높음
데이터를 나타내는 픽셀의 비율을 높이기
3. 최소-효과 차이
시간 상 멀리 떨어져있으면 공간이 멀리 떨어져있는 것처럼 표현하는 것이 좋다.
즉 먼 과거를 흐린색으로 표현하는 것이 자연스럽게 인식이 가능하다.
시간은 공간과 같이 작용한다.
4. 꾸밈과 기능에 대해 고민하기
function인지 foam인지를 고민하는 것이 필요하다.
꾸미면서 데이터도 잘 드러낼 수 있는 시각화를 해야한다 !!
위에 그린 그래프가 기능과 꾸밈 동시에 잡았다고 제안되는 방법이다.
하지만 머리가 길고 치마를 입은 게 당연히 여자이고 머리가 짧고 바지를 입고 있는 게 당연히 남자라는 사회적 편견을 더 강화시킬 수 있다.
Part 2. “데이터로 보고서 만들기 with 구글 스프레드시트”
좋은 보고서를 위해 생각해야 할 3가지
Step 1. 해결해야 하는 문제가 무엇인가? (문제정의)
자주하는 실수
- 분석을 하였는데 보고서를 작성해야하는 방향이 너무 헷갈려요
-> 해결해야하는 문제를 명확하게 문제 정의부터 다시 해야한다.
Step 2. 보고서를 왜 쓰나? (다음 중 1개만 골라서 초점을 맞춰서 작성)
3가지 목적
1. 정보 제공 : 상대방을 이해시키기 위함 -> 현황 보고서
2. 설득 : 상대방을 행동하게 하기 위함 -> 기획서, 제안서
3. 메세지 전달 : 상대방에게 의견, 공감을 이끌어내기 위함 -> 강연, 연설문
자주하는 실수
- 제안서인데 현황 보고만하는 경우 (현황분석 + 제안까지 같이 넣어주어야함)
- 현황 보고서인데 기획이나 제안을 하는 경우 (심플하게 현황을 바로 보고 싶은데 오랜 기간 뒤에 제안서가 오면 찾기 어려움)
Step 3. 보고서의 4요소
보고서의 4요소
1. 목적
예> 일주일에 한 번 발간하는 뉴스레터를 언제 발송하면 좋을까요?
2.결과
예> 과거 뉴스레터 오픈율, 클릭률 요약
3. (제안)
예> 뉴스레터 내에 컨텐츠 클릭률이 높았던 목요일 10시에 합시다!
4. 근거
예> 뉴스레터 데이터 분석
자주하는 실수
- 서론, 본론, 결론 순으로 구성된 보고서
-> 보고서를 읽는 사람이 빠르게 핵심을 파악하게 하는 것이 좋음 (즉, 결론부터 기재) - 목적, 결과와 제안부터 작성하고 나중에 근거를 통해 결과를 뒷받침하게 작성
데이터 보고서의 5요소
1. 목적
예> 일주일에 한 번 발간하는 뉴스레터를 언제 발송하면 좋을까요?
2.결과
예> 과거 뉴스레터 오픈율, 클릭률 요약
3. (제안)
예> 뉴스레터 내에 컨텐츠 클릭률이 높았던 목요일 10시에 합시다!
4. 데이터 설명
예> 분석에 사용한 뉴스레터 데이터, 데이터 특이사항, 보고서에 사용한 용어의 정의
통용적으로 사용되지 않는 단어는 보고서 작성에 지양
5. 근거(그래프)
예> 뉴스레터 데이터 분석 + 차트
데이터 보고서에 구글 스프레드 시트를 추천하는 5가지 이유
1. 클릭 몇 번만 해도 기본은 하는 시각화
(제대로된 차트를 그리는 것보다 실패하는 방법이 더 많다..ㅜ)
2. 피벗 테이블을 쉽게 그릴 수 있음
(엑셀이나 구글 스프레드 시트들이 직관적인 피벗 테이블을 만들 수 있다)
3. 사용의 편리성
4. 간단한 추가 분석을 바로 할 수 있음
5. 동시 편집 가능 & 외부 공유 편리성
데이터 분석은 혼자서도 할 수 있지만 적절한 피드백과 현업이 들어갈 때 더 멋진 분석이 나온다.
==> 구글 스프레드 시트가 최고의 도구는 아닐지 몰라도 다양한 상황에서 편리하게 사용이 가능하다!!
5월 웨비나는 여기서 마무리 되었다.
오늘은 특별히 외부 강사님이 오셔서 발표해주셨는데 진짜 시각화가 뭔지 알려주시는 강연이었다.
시각화하는 기술적인 방법이 아니고 비즈니스적인, 보는 사람 입장에서 자세하게 설명해주시고 예전 그래프를 보여주시면서 그에 맞는 시대상의 설명도 같이 해주셔서 분석이 더 잘 들어왔다.
이 방법들은 잘 숙지하고 있다가 최고의 보고서를 만들 때 사용해야겠다.
모든 출처는 데이터리안에 있습니다.
'리뷰' 카테고리의 다른 글
[Webinar Review] 4월 핵클 웨비나 - 데이터 잘 보기, 활용 (0) | 2022.05.03 |
---|---|
[Webinar Review] 3월 핵클 웨비나 - 데이터 잘 보기, 첫 걸음 (0) | 2022.05.02 |
[Webinar Review] 4월 데이터리안 웨비나 - 실무에서 바로 써먹는 데이터 분석 스킬 (0) | 2022.04.26 |
[Webinar Review] 3월 데이터리안 웨비나 - 데이터 분석가는 어떤 일을 하나요? (0) | 2022.04.06 |
[Article Review] 10배 이상 뛰어난 개발자가 되는 법 (0) | 2022.03.25 |