데이터레이크는 오브젝트, 블럽(Blob), 파일 등의데이터를 원시형상 그대로 저장하는 시스템 혹은 저장소를 말한다. 데이터레이크는 일반적으로 소스 시스템 데이터, 센서데이터, 소셜데이터 등의 원시데이터 복제본이나, 보고서, 시각화, 고급분석 및 기계학습과 같은 작업을 목적으로 변환된 데이터 등을 저장하기 위한 단일의 저장소로서 아래와 같은 데이터 유형을 포함할 수 있다. 정형데이터 - 관계형데이터베이스(RDB) 반정형데이터 - CSV, Logs, XML, JSON 비정형데이터 - 이메일, 문서, PDF 바이너리데이터 - 이미지, 오디오, 비디오 (원문출처 : https://en.wikipedia.org/wiki/Data_lake) 데이터레이크의 개념을 이해하기 전에 데이터웨어하우스에 대해서 먼저 이해할 ..