정형 데이터와 비정형 데이터
정형 데이터 : 정해진 규칙에 따라 구조화된 데이터
> 날짜, 이름, 주소, 신용 카드 숫자 등과 같이 해당 칼럼에 들어갈 값이 예측 가능하고 의미 파악이 쉬운 데이터
> 사용자들이 사용하기 쉽고, 머신러닝 알고리즘이 가공/분석하기에 용이
> 적재한 데이터가 많은 상황에서 구조 그 자체가 바뀌는 경우, 모든 정형 데이터를 업데이트해야 하므로 많은 시간과 자 원이 소모
비정형 데이터 : 문서(JSON, 텍스트)의 형태를 띄거나, 아예 음성이나 영상과 같은 바이너리 형식의 데이터
> 있는 그대로 저장하기에 유용하나, 가공하거나 분석하기에는 어려울 수 있음
> 최근에는 모든 데이터를 있는 그대로 저장하고 고도화된 빅데이터 도구를 이용해 보다 쉽게 가공/분석할 수 있게 만드는 것이 추세
> 비즈니스 인사이트는 데이터를 어떻게 분석하느냐에 따라서 발견될 수 있기 때문
※ 비즈니스 인사이트 : 비즈니스 환경에서의 이해와 통찰력
'DevOps BootCamp > 데이터베이스' 카테고리의 다른 글
MLOps (0) | 2023.03.29 |
---|---|
ETL과 ELT (0) | 2023.03.29 |
데이터 파이프라인 (0) | 2023.03.29 |
수평 확장된 데이터베이스와 중복 처리 (Advanced) (0) | 2023.03.29 |
스트림 처리 (0) | 2023.03.29 |