一、数仓和数据湖的区别

1. 数据内容区别

数据仓库:处理结构化数据;
数据湖:处理结构化、半结构化、非结构化和原始二进制数据。

2. 成本

数据仓库利用数据库来存储结构化数据层,这可能很昂贵。
数据湖将数据存储在低成本设备中。

3. 数据处理过程

数据仓库对数据执行提取-转换-加载 (ETL Extract-Transform-Load)。
数据湖执行提取-加载-转换 (ELT Extract-Load-Transform)。

4. 写入读取模式

数据仓库是写入时模式,这意味着数据在写入数据仓库时就已经准备好了。
数据湖是读取模式,因此数据按原样存储。然后可以转换数据并将其存储在数据仓库中以供使用。

datawarehouse vs datalake
datawarehouse vs datalake

二、常见解决方案

1. Database Data Warehousing

2. Data Lake

Big Data & Advanced Analytics Big Data Query as a Service

Big Data & Advanced Analytics Big Data Managed Cluster as a Service