100字范文,内容丰富有趣,生活中的好帮手!
100字范文 > 基于大数据平台的数据仓库

基于大数据平台的数据仓库

时间:2019-08-08 07:49:38

相关推荐

基于大数据平台的数据仓库

1、数据库(Database)

数据库是指将数据以一定的数据模型组织、描述和储存在一起的数据集合,具有尽可能小的冗余度、较高的数据独立性和易扩展性,且在一定范围内为多个用户共享

2、数据仓库(DataWarehouse)

数据仓库用于实现集成、稳定、反应历史变化、有组织有结构的数据集合,具有以下4个特点:

(1)面向主题

将企业各业务系统的数据进行综合归并,针对公司不同业务领域建立对应的主题。

比如在仓储系统中,计算货物的周转率,就需要统计货物进、出仓库的时间周期,此时就可以根据这一主题进行建模分析。

而在数据库里面强调的是一个完整的业务体系的数据整合,是面向事务处理不是面向分析

(2)集成的

企业有各种业务系统,比如OA系统、财务系统、人事系统、订单系统等,这些系统之间通常是独立的,如果站在公司层面,想看到公司的数据全貌,就需要对公司数据进行集成,同时保证数据的一致性、完整性、有效性、精确性

(3)稳定的

通常情况下数据库中是面向业务处理的,无法得到过去的状态信息,而数仓通常情况下要追踪历史、某一时刻的用户状态,从某个时间段来看是保持不变的,没有更新、删除操作,以查询分析为主

(4)变化的

数据仓库反映了数据的历史变化

3、数据仓库和数据库区别

OLTP (on-line transaction processing):

联机事务处理,主要是数据库中的业务数据,数据状态更新频繁,并发较高

OLAP (on-line analytical processing):

联机分析处理,主要是对数据仓库中的数据进行查询分析,很少涉及更新和删除

4、基于大数据平台的数据仓库技术栈

5、数据仓库的应用场景

数据仓库为以下场景提供了坚实的数据管理基础:

数据分析、数据挖掘

人工智能、机器学习

风险控制、无人驾驶

数据化运营、精准运营

广告精准、智能投放

6、数据仓库建设的意义

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。