|
做数据仓库的一点疑问,达人帮忙想想办法minightblue@gmail.com 20061125 在最近的数据仓库项目中,遇到了如下问题: 那位达人有这方面的经验,给支个招这种情况数据仓库项目如何应对? 这种实时性高的报表,还是放在生产系统中吧,否则只能降低实时性。 这也不是想放到生产系统就放的,也不是应该放到哪个系统那么简单啊。在数据仓库没有见到什么用处的情况下,恐怕还是出报表,至少能够看得见摸的着。 我想做过电信经分的同志们有过此类感触,不是很多人都在说经分就是一个大报表系统吗?你看那些集成商,没日没夜地对数,难道不郁闷吗?唉,本来开始做数据仓库的时候,大家有个印象,数据仓库的数据是用于分析的,对准确性要求并不是太高,可残酷地现实摆在眼前。 从客户角度说,一个数据仓库项目怎么才算满足需求?总不能说你整合了多少数据源,数据模型设计得多完美吧。没有什么客观东西来衡量,报表是一种最明显的衡量手段,至少你要是能够出了这几百张报表,就算你OK。没法子。 我看到的数据仓库项目,没有将精力放在报表上的,可能有以下几种: 反正吧,不想做报表,得跟客户有个交代,"你这个仓库到底能够创造什么价值?你说不应该做报表,也行,那能够作甚么?证明给我看。我也得跟领导交代啊!" lizhenguo 20061127 如果报表的复杂性不高,而且在生产系统开发时就已经作了冗余度的考虑,在统计时仅引用了少量表,而且表间都有索引,数据量不大。在这些条件下,适当在生产系统上开发一些报表,对系统性能影响应该不是很大的。 记得上次有个全国数一数二的银行的某个数一数二分行的科技部的达人说过,他们做过的分析系统,产生的价值约为数十亿美金,看看他们是怎么衡量出来的?都是报表,差别咋这么大泥? 数据仓库的数据用于分析的,对准确性要求并不是太高? 在银行业,每日有资产负债平衡表的,数据仓库出的报表,如果跟这张表差别很大,那是万万不行的。 我之前做过的系统,跟资产负债表各科目的差别只允许在四舍五入上有差别,其他理由的差别都是不被允许的。 有一句话,要出来混的,迟早要还的,就算是第一种数据仓库,基础设施项目,也一样是要在后期应用中体现价值的,数据源整合得再多,没有用的数据日积月累也没什么大价值,数据模型设计得再好看,实际应用上有缺陷,该重来还是要重来。 如果陷入到报表的工作中来,疲于应付各种的报表需求,资源就会分散开来。人员总是有限的,把有限的人力投入到多且多变的生产报表需求中去的结果就是注意力分散了。不能把有效的力量投入到分析上面来。 但是上面的兄弟也说的对,分析的结果是不好量化的。没有报表的工作成果那么明显。但是要算算的话,数据仓库的投入是很高的,主机,数据库,BI工具,存储,实施资金那个少了大点的项目投个几千万就进来了。就算做了几百个报表,这样的报表平均一个要多少钱?客户不傻,也会算这个帐的。你能忽悠人家做第一次,以后的路该怎么走? 刚加入BI这个行业,我这个菜鸟对于在中国一个数据仓库项目如何才是比较成功的,符合中国目前国情的还是很迷茫.... 如果“统计报表的数量非常大”,看是否对业务系统数据库的压力太大,以至可能影响业务系统运行,如果是那样的话,划到数据仓库来实现是合理的。可以考虑建设建ODS,专门应付这类实时、生产报表需求。感觉需求无法控制,恐怕还是因为开发单个(固定)报表的成本太高,这时候一方面看多维模型能否替代系列报表的开发,一方面看有无更好的报表工具能够降低报表展现开发的工作量。
责编:姜玲
微信扫一扫实时了解行业动态
微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
|
热门博文
|
|