일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- airflow.cfg
- 전처리
- pandas
- not in
- GROUPBY
- TRUNCATE
- solvesql
- 그로스해킹
- 데이터분석
- SUM
- airflow 설치
- having
- SQLite
- 데이터시각화
- SQL
- 머신러닝
- hackerrank
- Oracle
- 데이터리안 웨비나
- matplotlib
- seaborn
- PostgreSQL
- MySQL
- Limit
- Round
- 파이썬
- 결측값
- join
- 프로그래머스
- 다중 JOIN
Archives
- Today
- Total
목록transform (1)
Milky's note

요즘에 지하철 데이터를 가지고 토이 프로젝트를 진행해보려고 서울시에서 제공하는 오픈 API를 써서 데이터를 수집하고 있다. daily로 역, 호선 별 지하철 승하차 인구 데이터를 불러왔는데 이 데이터를 일간 말고 월간으로 인구를 sum을 해서 dataframe에 컬럼을 추가해주고 싶었다. 그럴 때 groupby와 transform 함수를 사용해주면 아주아주 편리하게 추가할 수 있다. 먼저 API를 통해서 데이터를 호출하고 아주 약간의 클렌징을 한 데이터이다.데이터를 보면 USE_DT라는 컬럼이 daily로 수집되고 있다. 이 데이터를 groupby를 해서 month 기준으로 sum한 컬럼을 추가하려고 한다.먼저 그냥 groupby를 해서 sum을 구해보면 아래와 같은 형태로 나온다.날짜(연도월), 지하..
Python/요약 정리
2023. 11. 13. 20:33