일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- SQL
- GROUPBY
- Oracle
- PostgreSQL
- 데이터리안 웨비나
- 결측값
- airflow.cfg
- join
- 전처리
- hackerrank
- Round
- 데이터분석
- seaborn
- MySQL
- SQLite
- 머신러닝
- Limit
- SUM
- matplotlib
- 그로스해킹
- TRUNCATE
- airflow 설치
- not in
- solvesql
- 데이터시각화
- having
- 파이썬
- pandas
- 프로그래머스
- 다중 JOIN
- Today
- Total
목록Lambda (2)
Milky's note

● SHA-256이란SHA는 Secure Hash Algorithm를 의미하고 SHA-256은 메시지, 파일, 혹은 데이터 무결성 검증에 널리 사용되는 암호화 해싱 알고리즘(함수)이다.변환하기를 원하는 문자들을 256 bit 길이의 key로 변환하며 SHA-256을 사용하면 문자가 조금만 바뀌어도 해시값이 완전히 변한다. 공백 하나 느낌표 하나 등만 들어가도 완전히 다른 값으로 암호화되기 때문에 원본 데이터가 중요하다. ● 사용법import hashlibimport pandas as pddf = pd.read_excel('hash.xlsx')df['8digit'] = df['8digit'].astype('str').str.zfill(10)df 우선 해시할 데이터를 불러온다.나는 판다스를 사용해서 데이터프..
1. 결측값 처리 #결측값 채우기(fillna) df['키'].fillna(-1) df2['키'].fillna(-1, inplace=True) #값을 바로 대입 #결측값 삭제(dropna) df.dropna() df.dropna(axis=0) #axis를 사용하여 행 또는 열을 제거 df.dropna(axis=0, how='any') #한개라도 있는 경우 df.dropna(axis=0, how='all') #모두 NaN인 경우 #중복된 값 제거 (drop_duplicates) df['키'].drop_duplicates() df['키'].drop_duplicates(keep='last') #맨마지막 항목 유지 df['키'].drop_duplicates(keep='first') #맨처음 항목 유지 #행 전체..