일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- hackerrank
- Round
- 머신러닝
- not in
- SQL
- SUM
- 프로그래머스
- TRUNCATE
- having
- Limit
- Oracle
- 그로스해킹
- join
- 파이썬
- PostgreSQL
- solvesql
- matplotlib
- 데이터리안 웨비나
- airflow 설치
- 데이터시각화
- 결측값
- 다중 JOIN
- pandas
- 데이터분석
- seaborn
- MySQL
- airflow.cfg
- GROUPBY
- 전처리
- SQLite
- Today
- Total
목록데이터분석 (3)
Milky's note
공공데이터를 이용한 카페 상권분석(2020 Ver.) 공공 데이터 중 카페(라는 업종분류)들에 대해서 현황을 조사하려고 한다. 다음 사항을 할 예정이다. 전국 카페 데이터를 모두 수집 지역별 or 브랜드별 점포 현황을 확인 분석 결과를 시각화 [데이터] https://www.data.go.kr/data/15012005/fileData.do 이 데이터는 지금은 폐기되었지만 미리 받아둔 csv 파일로 열어서 분석을 진행하였다. 2019년 데이터라서 결과가 현재와는 다를 수 있다. 내가 생성할 데이터셋은 다음과 같다. 전국의 카페, 서울시 카페 비율 주요 브랜드 카페 별 전국, 서울시 비율 전국 카페 데이터 시각화 서울시 카페 데이터 시각화 서울시 주요 브랜드 카페 데이터 시각화 1. 전처리 카페 데이터를 확..
전국 주차장 데이터를 통하여 다음을 분석하려고 한다. 지역 별 주차장에 대한 분석 seaborn을 통한 주차장 시각화 데이터는 공공데이터 포털에서 받았고 위도와 경도를 이용한 데이터 시각화를 하기 위해 주차장 데이터를 찾아서 데이터 분석을 진행하였다. 데이터 출처 : https://www.data.go.kr/data/15050093/fileData.do 한국교통안전공단_전국공영주차장정보_20191224 주정차문화지킴이 시스템에 등록된 전국공영주차장정보(위경도, 주차장 유형, 주소 등) www.data.go.kr 1. 전처리 # null 값 데이터 삭제 park = park.dropna() park.info() 없는 데이터를 삭제해주어서 모두 not null인 걸 확인하였다. Int64Index: 9626..
- A/B 테스트란? 기존 서비스(A)와 새로 반영하고 싶은 서비스(B)를 통계적인 방법으로 비교하여, 새로 적용할 서비스가 기존 서비스 보다 실제 효과가 있는지 확인하는 테스트 주로 마케팅이나 웹 페이지 개선 작업 시에 많이 사용된다. 사용자의 행동에 영향을 미치는요소 하나만을 다르게 설정하고, 나머지 환경은 동일하게 설정한다. 당연한 말이지만 이 테스트가 효과적으로 이루어지면 새로운 서비스를 반영하여, 운영 서비스에 적용한다. - A/B 테스트 단계 1. 가설 설정 먼저 대조군 서비스를 만들기 위하여 기존 서비스보다 효과가 좋을 것이라고 생각되는 가설을 설립한다. 주로, 과학적이고 통계적인 방법을 사용해서 참과 거짓으로 나눌 수 있는 가설을 설립한다. 가설은 구체적이고 정확한 문장형으로 설립하는 것이..