일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
Tags
- mysql :=
- 프로그래머스
- SUM
- airflow 설치
- solvesql
- join
- 데이터리안 웨비나
- having
- PostgreSQL
- 데이터시각화
- Round
- MySQL
- SQL
- 머신러닝
- pandas
- 결측값
- 그로스해킹
- not in
- 파이썬
- GROUPBY
- hackerrank
- 데이터분석
- Oracle
- Limit
- 다중 JOIN
- matplotlib
- seaborn
- 전처리
- SQLite
- TRUNCATE
Archives
- Today
- Total
목록transform (1)
Milky's note
[Pandas] 데이터프레임 groupby로 연산된 컬럼 추가 (transform)
요즘에 지하철 데이터를 가지고 토이 프로젝트를 진행해보려고 서울시에서 제공하는 오픈 API를 써서 데이터를 수집하고 있다. daily로 역, 호선 별 지하철 승하차 인구 데이터를 불러왔는데 이 데이터를 일간 말고 월간으로 인구를 sum을 해서 dataframe에 컬럼을 추가해주고 싶었다. 그럴 때 groupby와 transform 함수를 사용해주면 아주아주 편리하게 추가할 수 있다. 먼저 API를 통해서 데이터를 호출하고 아주 약간의 클렌징을 한 데이터이다. 데이터를 보면 USE_DT라는 컬럼이 daily로 수집되고 있다. 이 데이터를 groupby를 해서 month 기준으로 sum한 컬럼을 추가하려고 한다. 먼저 그냥 groupby를 해서 sum을 구해보면 아래와 같은 형태로 나온다. 날짜(연도월), ..
Python/요약 정리
2023. 11. 13. 20:33