|
主动、实时数据仓库及应用摘要:本文主要描述了数据仓库的演进过程,介绍主动数据仓库、实时数据仓库、以及ODS等概念。希望各位读者能够从本文了解到数据仓库技术在国外应用的新趋势。 1、主动数据仓库
1.1、问题的提出
客户拨打呼叫中心,对某个产品或服务表现出关心,你的客户代表能否主动的和客户沟通,提高客户保持率? 如果你的网站能够及时的给客户返回信息,并且客户每访问3次后就给10%的折扣,将能增加多少的客户忠诚度? 如果供应商能够预测到假期每个商品会增加多少的销售量,并及时补充商品,将会增加多少的销售额? 今天,成功的商业关系,无论是客户、合作伙伴或者供应商,都越来越依靠集成了企业所有数据的数据仓库,分析出有价值的信息,并把信息分发给每天做决策的人员。主动数据仓库转变传统数据仓库解决方法的策略,使企业在维系客户上变得更加主动和有效。 1.2、变革经济环境下的全新解决方案
新经济环境下,有着新的客户期望值、新的客户关系和新的商业机会,企业需要具有主动的决策支持能力。今天,数据仓库的数据正在发生演变,数据仓库负担着客户关系管理、一对一营销和及时制定决策等效用,进而成为具有控制和影响市场能力的工具。 数据仓库的初始阶段,是面向查询批处理的决策支持应用。数据仓库的初始目的是收集、清理和集成组织内的数据,这些数据用来产生报表和查询,以支持决策的制定。 随着数据仓库技术的成熟和应用普及,越来越多的企业利用数据仓库技术的特性,以支持预测分析以驱动商业决策。数据仓库技术在更大范围内得到应用,从分析市场将要发生什么变化,到分析市场正在发生什么变化,到基于事件触发、控制市场朝着自己想要的方向去发展。
1.3、主动数据仓库的优势
主动数据仓库在市场快速变化和实时企业管理决策要求下出现的,是数据仓库技术的新的分支。利用主动数据仓库建立应用,企业可以改进与客户的及时沟通能力,使分支机构或者呼叫中心更好的与客户进行联络。下面的这些应用在传统数据仓库中是难以实现的,但主动数据仓库提供了可能: 利用呼叫中心,进行自动的、直接的客户营销; 在信用卡业务处理过程中,及时进行欺诈检测; 飞机满座率低时,可以在飞机起飞前,让更多的乘客坐上飞机; 基于当前的客户贡献度和价值度,给客户灵活的综合定价和折扣; 及时决定运行中卡车的最优线路,降低货物运送时延,并实现对不同客户的不同服务承诺; 基于客户近期的信用卡交易情况、结合他们长期的购买行为,优化即将要送给客户的交叉销售购物券;
表1:传统数据仓库与主动数据仓库的能力比较 显然,主动数据仓库扩展了传统数据仓库的能力: 外部人员可以访问数据仓库,如合作伙伴、供应商和客户。 企业的所有成员都可以直接的访问数据仓库,包括普通的雇员、呼叫中心的客户代表等等。 集成、多主题,交叉渠道的执行可以帮助企业更快更有效的行动,拓展商业机会。 主动数据仓库支持战略和战术的市场决策。意味着企业的战略分析结果可以转化为具体、详细的条件约束和操作事务下的行动。这样,发挥了日常战术决策的效用,提高了数据仓库信息的效率。最终,对于企业来说,一致性的数据使职员和合作伙伴更好做出符合事实的、精确的和有见地的决策。 建立主动数据仓库帮助你更接近你的客户、优化供应链、提高制造质量和精准地跟踪商品流动,计划和管理成功的商业活动,达成销售自动化,使得企业具备新竞争环境下的及时商业分析能力。 主动数据仓库需要一个可扩展的、高性能的数据仓库解决方案,需要实时数据仓库的支持。 2、实时数据仓库和ODS
很多数据仓库设计者认为不可能把现有的24小时运行周期的ETL改为15分钟的周期。因为即使将数据清理的步骤并行处理,最大的事实表和维表的增量加载也不一定能在这么短的时间内完成。 2.1、ODS的引入
规划数据仓库时,可以在常规的、静态的数据仓库之外,建立一个实时的分区,这个特别的分区在物理上和管理上独立于传统的数据仓库。事实上,实时分区通常并不是数据库概念上的表分区,而是由一些独立的可以在其上进行更新和查询操作的表构成。。 存储实时分区的系统就是ODS(Operational Data Store)。ODS和实时分区是两大数据仓库流派的不同名词定义而已,我们姑且将ODS理解为存储和管理实时分区的系统。ODS处于业务系统和数据仓库之间,具有实时的、常变的、当前的、临时的等特点。引入ODS,DW的体系结构变为:源数据→ODS→DW→OLAP。增加ODS,还需要前端工具的支持,才能够进行无缝查询。 实时分区必须满足如下的一些苛刻要求: 在静态数据仓库更新前,承担所有的查询操作; 在粒度和内容上与静态数据仓库的事实表能够吻合链接; 支持大量并发的查询响应。 2.2、实事分区(ODS)的应用
在维度模型中,主要有三类粒度的事实表:交易粒度(Transaction Grain),周期性快照粒度(Periodic Snapshot Grain),增量快照粒度(Accumulating Snapshot Grain)。实时分区在3种类型的粒度上有不同的结构。
|
热门博文 |
|