일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- airflow.cfg
- PostgreSQL
- GROUPBY
- Oracle
- not in
- SQL
- having
- 머신러닝
- 전처리
- hackerrank
- 프로그래머스
- 결측값
- 데이터리안 웨비나
- 데이터분석
- 데이터시각화
- SQLite
- matplotlib
- 다중 JOIN
- Limit
- TRUNCATE
- airflow 설치
- MySQL
- seaborn
- solvesql
- 파이썬
- pandas
- SUM
- join
- 그로스해킹
- Round
- Today
- Total
목록분류 전체보기 (129)
Milky's note
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/tVWCw/btsDxzRBYlU/j18LcMwsMxNPI27DKrz0k1/img.png)
티스토리에 쓴 블로그 글을 GSC(Google Search Console)에 등록하려고 봤더니다음과 같은 리디렉션 오류가 떠서 페이지 색인이 생성되지 않았다. 이러한 이유는 별도의 모바일 URL이 있는 경우각 데스크톱 URL의 모바일 사용자를 적절한 모바일 URL로 리디렉션 해줘야하는데티스토리에서는 모바일 접속 시 자동으로 모바일 웹으로 전환되기 때문이다. 그래서 해결 방법은 티스토리의 모바일 웹 자동 연결을 해제하는 것이다.방법은 다음과 같다. 먼저 티스토리에 로그인 하여 [블로그 관리 홈] -> [꾸미기] -> [모바일] 으로 가서모바일웹 설정을 변경해준다. 변경을 하고 다시 GSC로 와서 실시간 테스트를 클릭하면이전과는 다르게 URL을 Google에 등록할 수 있음 표시로 변경이 되게 된다.그리고..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/d7boGF/btsDfptMhDN/FtkNxxwgPPywqgFR99GTa1/img.png)
● SHA-256이란SHA는 Secure Hash Algorithm를 의미하고 SHA-256은 메시지, 파일, 혹은 데이터 무결성 검증에 널리 사용되는 암호화 해싱 알고리즘(함수)이다.변환하기를 원하는 문자들을 256 bit 길이의 key로 변환하며 SHA-256을 사용하면 문자가 조금만 바뀌어도 해시값이 완전히 변한다. 공백 하나 느낌표 하나 등만 들어가도 완전히 다른 값으로 암호화되기 때문에 원본 데이터가 중요하다. ● 사용법import hashlibimport pandas as pddf = pd.read_excel('hash.xlsx')df['8digit'] = df['8digit'].astype('str').str.zfill(10)df 우선 해시할 데이터를 불러온다.나는 판다스를 사용해서 데이터프..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/suQKb/btsAeBkB1rF/SlPNzqxEdjyRad73z9Qgkk/img.png)
[Pandas] 데이터프레임 groupby로 연산된 컬럼 추가 (transform)요즘에 지하철 데이터를 가지고 토이 프로젝트를 진행해보려고 서울시에서 제공하는 오픈 API를 써서 데이터를 수집하고 있다. daily로 역, 호선 별 지하철 승하차 인구 데이터를 불러왔는데 이milkyspace.tistory.com 이전 글에서 groupby, transform으로 연산된 컬럼을 추가하였다.그 컬럼은 데이터프레임의 가장 뒤로 추가가 되었는데 데이터프레임의 가독성을 높이기 위해서컬럼의 순서를 재배치하는 방법을 설명하려고 한다. 1. 컬럼 순서를 직접 입력가장 직관적이고 컬럼이 적을 때 사용할 수 있는 방법이다.df = df[['USE_MON', 'LINE_NUM', 'SUB_STA_NM', 'FOUR_RID..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bjngQS/btsAaGtbI2S/KRMP7EjEClVnqBF8Wi9Pt0/img.png)
요즘에 지하철 데이터를 가지고 토이 프로젝트를 진행해보려고 서울시에서 제공하는 오픈 API를 써서 데이터를 수집하고 있다. daily로 역, 호선 별 지하철 승하차 인구 데이터를 불러왔는데 이 데이터를 일간 말고 월간으로 인구를 sum을 해서 dataframe에 컬럼을 추가해주고 싶었다. 그럴 때 groupby와 transform 함수를 사용해주면 아주아주 편리하게 추가할 수 있다. 먼저 API를 통해서 데이터를 호출하고 아주 약간의 클렌징을 한 데이터이다.데이터를 보면 USE_DT라는 컬럼이 daily로 수집되고 있다. 이 데이터를 groupby를 해서 month 기준으로 sum한 컬럼을 추가하려고 한다.먼저 그냥 groupby를 해서 sum을 구해보면 아래와 같은 형태로 나온다.날짜(연도월), 지하..