일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- SQL
- solvesql
- 데이터시각화
- SUM
- not in
- 다중 JOIN
- SQLite
- 그로스해킹
- seaborn
- PostgreSQL
- matplotlib
- Round
- MySQL
- airflow.cfg
- Oracle
- 결측값
- Limit
- 머신러닝
- 전처리
- GROUPBY
- 프로그래머스
- having
- airflow 설치
- pandas
- hackerrank
- 데이터리안 웨비나
- join
- TRUNCATE
- 데이터분석
- 파이썬
- Today
- Total
목록전체 글 (128)
Milky's note
Seaborn이란? matplotlib을 기본으로 다양한 시각화 기법을 제공하는 라이브러리. pandas DataFrame과 매우 호환성이 높음 e.g. sns.xxxplot(data=df)
· 연속형 데이터 연속형 데이터란, 하나의 변수가 하나의 데이터를 가지고 있던 숫자형 데이터와 달리, 여러개의 데이터를 하나의 변수에 가지고 있는 데이터 타입이다. 연속형 데이터의 크기 제한은 없다. 하지만, 사용하는 컴퓨터의 가용 메모리 용량을 인지하며 사용해야 한다. 각 연속형 데이터 타입마다 특징이 다르다. 그 특징을 파악하여 용도에 맞는 데이터 타입을 사용하는 것이 중요하다. 사전(dictionary) 타입은 associative array라고 불리며, 흔히 알고있는 Hash table 구조이다. 1) 리스트 (List) [ ] 가장 많이 사용되는 연속형 데이터 타입이자, 굉장히 유연한 구조를 가지고 있어 대부분의 데이터를 편하게 다룰 수 있다. 리스트의 원소는 쉼표로 구분되며, 리스트의 원소는 ..
https://solvesql.com/problems/day-of-furniture/ solvesql © Copyright 2021-2022 solvesql.com solvesql.com 문제는 위와 같다. 가구가 팔린 수와 비율을 구해주면되는데 sqlite를 많이 안써봐서 몰랐다. 나누기를 하면 정수부만 나온다는 사실을.... 그래서 해결법은 다음처럼 float형으로 만들어서 진행해주면 된다. select (a+0.00)/(b+0.00) from table; 새롭게 알게된 사실이다. 그래서 문제를 푼 쿼리는 다음과 같다. select order_date, count(distinct(case when category='Furniture' then order_id end)) as furniture, rou..
https://solvesql.com/problems/characteristics-of-orders/ solvesql © Copyright 2021-2022 solvesql.com solvesql.com 문제는 위와 같다. 지역별 각 카테고리 별로 얼마나 많은 양의 상품이 팔렸는 지 조회하느 쿼리인데 계속 오류가 나서 뭐지 했는데 알고보니 출력해야하는 컬럼 이름이 region이 아니고 Region으로 해주어야해서 이다 . 컬럼 명 출력시에 주의를 더 기울여야겠다. 그리고 주의해야할 점은 물건을 사는데 똑같은 사람이 몇 번 사는 경우가 있어서 중복 제거를 해준 값을 count 해주어야한다. select region as Region, count(distinct(case when category='Furni..