DevOps BootCamp/데이터베이스
ETL과 ELT
cloudmaster
2023. 3. 29. 14:58
ETL, ELT
> 데이터 파이프라인
> 각 알파벳은 추출(Extract), 적재(Load), 변환(Transform)의 약자
추출의 대상
- 관계형 데이터베이스 (RDBMS)
- NoSQL
- 텍스트 파일 (JSON, log, txt 등)
- SaaS로부터 생성되는 데이터 (Google Ads와 같은 광고 데이터)
- 데이터 레이크 (비정형 데이터를 포함해 원시 데이터를 저장하는 공간)
적재의 대상
- 데이터 웨어하우스
ELT와 ETL의 차이점은 순서의 차이
● ETL(추출→변환→적재), 적재하는 과정에서 변환(Schema-on-Write)
● ELT(추출→적재→변환), 적재하고 나서 분석을 시작할 때 변환(Schema-on-Read)
비정형 데이터를 분석할 경우 ELT 작업, 상대적으로 정형화된 데이터 분석보다는 훨씬 느린 비정형 데이터 분석