일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- TRUNCATE
- Round
- Limit
- SUM
- 다중 JOIN
- 데이터리안 웨비나
- airflow 설치
- seaborn
- not in
- matplotlib
- 그로스해킹
- Oracle
- 프로그래머스
- hackerrank
- airflow.cfg
- PostgreSQL
- 머신러닝
- pandas
- solvesql
- 파이썬
- having
- 데이터분석
- SQLite
- GROUPBY
- join
- 데이터시각화
- SQL
- 전처리
- 결측값
- MySQL
- Today
- Total
목록분류 전체보기 (130)
Milky's note
1. 결측값 처리 #결측값 채우기(fillna) df['키'].fillna(-1) df2['키'].fillna(-1, inplace=True) #값을 바로 대입 #결측값 삭제(dropna) df.dropna() df.dropna(axis=0) #axis를 사용하여 행 또는 열을 제거 df.dropna(axis=0, how='any') #한개라도 있는 경우 df.dropna(axis=0, how='all') #모두 NaN인 경우 #중복된 값 제거 (drop_duplicates) df['키'].drop_duplicates() df['키'].drop_duplicates(keep='last') #맨마지막 항목 유지 df['키'].drop_duplicates(keep='first') #맨처음 항목 유지 #행 전체..
1. pandas 의 Series 와 DataFrame 1.1 Series 1차원, 1개의 column은 Series라고 한다. mylist = [1, 2, 3, 4] pd.Series(mylist) #실행결과 0 1 1 2 2 3 3 4 dtype: int64 1.2 DataFrame 방법 1. list로 만들기 company1 = [['삼성', 2000, '스마트폰'], ['현대', 1000, '자동차'], ['네이버', 500, '포털']] df1.columns = ['기업명', '매출액', '업종'] #컬럼 이름 수정 df1=pd.DataFrame(company1) # 실행 결과 방법 2. dict로 만들기 company2 = {'기업명':['삼성', '현대', '네이버'], '매출액': [200..
Pandas 위주로 공부하고 있는데 인강이랑 책만 보기에는 실력을 도저히 알 수가 없어서 열심히 구글링을 해서 !! 관련 문제를 풀어볼 수 있는 사이트를 정리하였다. 튜토리얼들을 위주로 먼저 풀어보고, 데이콘에서 하는 Basic 단계 분석부터 도전해봐야겠다!! https://dacon.io/hackathon 교육 - DACON 4만 AI팀이 협업하는 인공지능 플랫폼 dacon.io 일단 데이콘 사이트이다. 교육에 들어가니까 튜토리얼부터 1일1오파 등등 하루마다 꾸준히 연습을 하고 싶은 문제들이 많당 열심히 풀어야징 튜토리얼 빠르게 끝내고, 하루 마다 1일1오파 진행하고, 주제가 뭔가 끌리는 Basic 부터 해보장
1. Alias 지정 import numpy as np 2. ndarray 생성하기 arr = np.array([1, 2, 3, 4], dtype=int) arr.shape - shape 확인 가능 2-1. index로 설정하여 나누기 arr[0] - index로 지정하여 확인 , 배열을 필요한 부분만 가지고 와서 slicing이라고도 함 arr[1:], arr[:4] - 범위를 지정해서 가지고 올 수도 있음 2-2. fancy indexing fancy 인덱싱은 범위가 아닌 특정 index의 집합의 값을 선택하여 추출하고 싶을 때 활용 반드시 [추출하고 싶은 인덱스] 꺾쇠 괄호로 묶음 idx = [1, 3, 5] arr[idx] 3. range 생성 3-1. arange를 사용해서 쉽게 생성하기 첫번째..