如何衡量数据管理的好坏

  作者:姜玲
2007/3/29 16:24:27
本文关键字: ttnn 2005年12期

项目一期一期地建,可衡量标准仍然是模糊的。

这是上次回北京,和王璟交流他们项目时的一点感触。他们金融行业的经营分析系统也是从一期走到二期,一期主要的目标,是做数据整合和单一客户视图。后者是一种应用,还是比较容易明确地度量,而前者是一种后者的支撑,相当于基础设施了。它可以用于单一客户视图,也可以用作其他诸如报表、贷款风险分析等应用的支撑。如何度量?
不能度量,也就没有明确的目标,也就无法分工细分,数据管理这项任务只能作为项目大锅饭的一部分,不会作为一个单独的项目来进行,而且通常还是个吃力不讨好的部分。它总是要拿具体的应用来衡量它,如联通经分中,至今也是只能用出哪些报表,作哪些主题,哪些专题应用等来衡量后台的数据仓库。

在王璟的项目中,也是这样的问题。衡量数据整合的效果,只能用单一客户视图来衡量,如果这点做到了,基本上认同一期成果。至于数据整合做的确实有些缺陷,可以放到二期再慢慢补充。如此,如果仅仅是为了满足单一客户视图,其实根本没有必要去建数据仓库。但这样哪行呢,领导知道了,肯定又不同意,"那不行,数据仓库还是得建,要为日后打基础嘛"。这真是矛盾的事情啊,一个项目岂不就是最怕目标不明确吗?

因此,有个设想,是否能够为"数据管理"这件事建立度量其好坏的参考规格?此处我更加愿意将数据整合扩大一层含义叫做数据管理,它的目标是为了让企业分散的、凌乱的、异构的数据变成一种可管理状态,就像要上ERPCRM将企业中资源、客户变成可管理一样。后者为了能够提高资源利用率、客户服务,前者也是如此,提高数据的利用率,从中挖掘金子。

通向这种可管理状态,数据整合只是其中的一步,此外还有数据建模、元数据、数据质量等等,而数据整合也是一种泛称,可以是ETL,也可以是EAI、EII。当然,如果完整地考虑数据管理,可能还会包含数据安全、存储等方面,暂时那些还不在探讨范围之内。

发现数据管理的这些部分都可以从两个方面来看,动态的过程,和静态的结果,如图:
大的行业做大项目,往往是要建立规范的,其实也在做建立标准、将目标度量化的尝试。然而这确实是个难以平衡的事情,规定的太细了,基本上这份规范将仅供参考,因为根本不符合实际项目环境;定义的太粗了,又失去规范的作用,大家还是各自按各自的做法。
例如联通经分规范中有个条款是规定数据源接口必须是文件接口的形式,这就是对过程的约束,有必要,但基本成为一种强制性的。所以河南联通在通过总部测试时就因为这一条不合格而未通过。这是有必要的,因为如果一些好的方法得到证明,确实可以推广之。然而,也不得不怀疑这样的约束是否总是起到作用,就算上面这个文件接口的约束吧,是在所有环境中都能适用的吗?如果有的省分数据量没到一定级别,综合营帐厂商和经分厂商就是一家,可能未必就是最好的方法了。

因此我看,如果在规范中规定动态过程的方法,最好还是作为指导性的,关键还是对静态结果的约束。

对于每项静态结果如何度量并没有想太明白,倒是可以借鉴数据质量这部分,因为毕竟这块已经设计出一些质量指标,不管其是否充分衡量质量的好坏,总是已经有了度量标准。可以借鉴的地方在于同样为数据模型、元数据模型等静态结果都建立起一套指标体系。最终将数据管理当作一个项目来做的话,其实让这些指标达到具体数值范围就是目标。
 
还需继续探讨这个话题,此处并没有正面回答标题所提出的问题。

 

责编:姜玲
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918
Baidu
map