일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- SQL
- PostgreSQL
- SQLite
- 파이썬
- Round
- Oracle
- solvesql
- 머신러닝
- seaborn
- SUM
- 전처리
- pandas
- matplotlib
- 데이터리안 웨비나
- join
- 다중 JOIN
- 프로그래머스
- having
- 결측값
- airflow 설치
- Limit
- 데이터분석
- TRUNCATE
- 그로스해킹
- hackerrank
- GROUPBY
- airflow.cfg
- 데이터시각화
- not in
- MySQL
Archives
- Today
- Total
목록Vacuum (1)
Milky's note

1. 성능저하의 원인 지금 운영 중인 시스템에서 로그 쌓는 DB를 AWS RDS PostgreSQL을 사용하고 있다. 모니터링하는 시스템이다보니 인터페이스가 될 때마다 많은 양의 로그가 테이블에 Insert, Update 되고 있다. PostgreSQL은 Update 과정이 생겨도, 디스크 상의 해당 Row를 물리적으로 업데이트하지 않고, 새로운 영역을 할당해서 사용하고 있다. 그래서 이런 과정(테이블에 Update)을 거치면서, 기존에 있던 영역들은 Dead Tuple로 발생하게 된다. PostgreSQL에서 모든 데이터는 Tuple로 저장되는데, 모든 Tuple은 live Tuple와 dead Tuple로 나뉘어진다. Dead Tuple은 더 이상 사용되지 않는 Tuple이다. Dead Tuple이 ..
SQL/요약 정리
2022. 1. 5. 17:52