数据仓库研究和解决从数据库中获取信息的问题。数据仓库的特征在于面向主题、集成性、稳定性和时变性。数据集市Data Mark是一个从集合数据中为企业及其它政府和科研组织提供数据挖掘技术应用的平台。从范围上来说,数据是从企业范围的客户数据库、消费者数据仓库,或者是更加专业的数据仓库中抽取出来的。数据中心的重点就在于它迎合了专业用户群体的特殊需求,在分析、内容、表现,以及易用方面。在实践中,EC data market service(ECdms)客户数据中心和数据仓库这两个词可以在某种形式下互相表现。数据仓库是企业客户数据的中心集合(在地理上可以分布);数据中心是从数据仓库或者不是数据仓库中抽取出来的数据,它着重在服务于特殊设计目标的易访问性和可用性。一般来说,数据仓库更倾向于是一个战略,但不是一个未完成的概念;而数据集市更倾向于战术,它的目标在于满足企业客户营销即时的需求。
数据库:传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。
数据仓库:数据仓库系统的主要应用主要是OLAP(On-Line Analytical Processing),支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。
1.数据仓库是面向存储,数据集市面向应用
2.数据集市是数据仓库的上层,从数据仓库中抽取数据
比如一个app,我会在数据仓库中存上每个用户的在线时长,数据集市中从数据仓库中抽取出在线时长大于一个小时的用户,就是从原始数据中抽取出偏向应用的数据。这样很多应用都可以从数仓中抽取,数据来源一致就会避免很多数据偏差,方便管理。