数据仓库和数据湖的区别
一、数仓和数据湖的区别
1. 数据内容区别
数据仓库:处理结构化数据;
数据湖:处理结构化、半结构化、非结构化和原始二进制数据。
2. 成本
数据仓库利用数据库来存储结构化数据层,这可能很昂贵。
数据湖将数据存储在低成本设备中。
3. 数据处理过程
数据仓库对数据执行提取-转换-加载 (ETL Extract-Transform-Load)。
数据湖执行提取-加载-转换 (ELT Extract-Load-Transform)。
4. 写入读取模式
数据仓库是写入时模式,这意味着数据在写入数据仓库时就已经准备好了。
数据湖是读取模式,因此数据按原样存储。然后可以转换数据并将其存储在数据仓库中以供使用。
二、常见解决方案
1. Database Data Warehousing
- Amazon Redshift
- Azure Synapse Analytics
- GCP BigQuery
- IBM Db2 Warehouse
- Alibaba MaxCompute ODPS
- Huaweicloud Data Warehouse Service
2. Data Lake
Big Data & Advanced Analytics Big Data Query as a Service
- Amazon Athena
- AWS Lake Formation
- Amazon HealthLake
- Azure Data Lake Analytics
- GCP BigQuery
- IBM SQL Query
- Oracle Big Data SQL Cloud Service
- Aliyun E-MapReduce Service
- Huaweicloud Data Lake Insight
Big Data & Advanced Analytics Big Data Managed Cluster as a Service
捐赠本站(Donate)
如您感觉文章有用,可扫码捐赠本站!(If the article useful, you can scan the QR code to donate))
- Author: shisekong
- Link: https://blog.361way.com/datawarehouse-datalake/8530.html
- License: This work is under a 知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议. Kindly fulfill the requirements of the aforementioned License when adapting or creating a derivative of this work.