일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- join
- not in
- PostgreSQL
- 그로스해킹
- mysql :=
- matplotlib
- 프로그래머스
- 머신러닝
- having
- 데이터리안 웨비나
- SUM
- SQL
- seaborn
- MySQL
- Oracle
- hackerrank
- 다중 JOIN
- 파이썬
- solvesql
- airflow 설치
- 전처리
- TRUNCATE
- Round
- 결측값
- 데이터분석
- Limit
- 데이터시각화
- pandas
- SQLite
- GROUPBY
- Today
- Total
목록Lambda (2)
Milky's note
● SHA-256이란 SHA는 Secure Hash Algorithm를 의미하고 SHA-256은 메시지, 파일, 혹은 데이터 무결성 검증에 널리 사용되는 암호화 해싱 알고리즘(함수)이다. 변환하기를 원하는 문자들을 256 bit 길이의 key로 변환하며 SHA-256을 사용하면 문자가 조금만 바뀌어도 해시값이 완전히 변한다. 공백 하나 느낌표 하나 등만 들어가도 완전히 다른 값으로 암호화되기 때문에 원본 데이터가 중요하다. ● 사용법 import hashlib import pandas as pd df = pd.read_excel('hash.xlsx') df['8digit'] = df['8digit'].astype('str').str.zfill(10) df 우선 해시할 데이터를 불러온다. 나는 판다스를 사..
1. 결측값 처리 #결측값 채우기(fillna) df['키'].fillna(-1) df2['키'].fillna(-1, inplace=True) #값을 바로 대입 #결측값 삭제(dropna) df.dropna() df.dropna(axis=0) #axis를 사용하여 행 또는 열을 제거 df.dropna(axis=0, how='any') #한개라도 있는 경우 df.dropna(axis=0, how='all') #모두 NaN인 경우 #중복된 값 제거 (drop_duplicates) df['키'].drop_duplicates() df['키'].drop_duplicates(keep='last') #맨마지막 항목 유지 df['키'].drop_duplicates(keep='first') #맨처음 항목 유지 #행 전체..