ETL, ELT
> 데이터 파이프라인
> 각 알파벳은 추출(Extract), 적재(Load), 변환(Transform)의 약자
추출의 대상
- 관계형 데이터베이스 (RDBMS)
- NoSQL
- 텍스트 파일 (JSON, log, txt 등)
- SaaS로부터 생성되는 데이터 (Google Ads와 같은 광고 데이터)
- 데이터 레이크 (비정형 데이터를 포함해 원시 데이터를 저장하는 공간)
적재의 대상
- 데이터 웨어하우스
ELT와 ETL의 차이점은 순서의 차이
● ETL(추출→변환→적재), 적재하는 과정에서 변환(Schema-on-Write)
● ELT(추출→적재→변환), 적재하고 나서 분석을 시작할 때 변환(Schema-on-Read)
비정형 데이터를 분석할 경우 ELT 작업, 상대적으로 정형화된 데이터 분석보다는 훨씬 느린 비정형 데이터 분석
'DevOps BootCamp > 데이터베이스' 카테고리의 다른 글
Mariadb (0) | 2024.04.29 |
---|---|
MLOps (0) | 2023.03.29 |
정형 데이터와 비정형 데이터 (0) | 2023.03.29 |
데이터 파이프라인 (0) | 2023.03.29 |
수평 확장된 데이터베이스와 중복 처리 (Advanced) (0) | 2023.03.29 |