S&I:对BI项目建设的革命性探索

作者:顺胤科技(上海)有限公司总经理 卫欣
2007/8/15 10:55:47

谢谢各位参加今天的会议,我先自我介绍一下,我叫卫欣。就BI而言,我是一个非常新的一个人,大家知道,我一直是做ERP的,应该说可能在中国是最早一批做ERP的,我想我从86年开始真正开始参与实施了中国最早的MRPII的项目。那么,经过将近20年在ERP领域的工作,我最近开始研究BI。为什么我对BI开始感兴趣呢?因为我发现了一件非常奇怪的事,当我们很多企业做了ERP,做了信息化以后,他会觉得ERP有些地方不能满足他的需求。在哪些方面呢?比如说他在ERP系统或者管理信息系统里面累积沉淀了很多信息,但是这些信息没有办法很好地被利用,或者没有办法很容易地去用,这就是现在各位在上了信息系统之后面临的一个问题。或者说,对于企业老总,对投资来说,他每年花了几百万,像刚才的IBM公司,或其他等等主流的软件公司、大型的国外公司都在讲“500强里面的哪些公司是我们的用户”。500强的这些企业里面每年都是上千万美金投资在IT方面,但是即使在全球,大家还是发现有这样一个问题:企业花了很多钱在IT里面,IT最后沉淀了很多信息,但是最后这些信息还是在睡觉,这些数据还是在睡觉。这个就是一个普遍存在的问题。那为什么会睡觉呢?因为瘦的管理系统不能很容易地把这些数据取出来,不能很容易地做成各种各样能够展示的方式来给用户看。最后就有了BI的厂商,在10多年前就有一批人就有人提出了BI——Business Intelligence。

那BI起初的宗旨是什么?就是指:企业搞了那么多信息系统,这些系统沉淀了很多数据,而这些数据不好用,用了BI这个工作,可以使数据变得好用。但是,经过十几二十年的发展,我们会发现一个非常有趣的现象。从国外的角度来讲,现在BI在全球是50%的成功率。

为什么成功率只有50%?主要来讲,BI解决两个问题,它起了两个作用,它作为独立的体系生成主要两个点。一个是信息的发布。它能在恰当的时候把恰当的信息提供给恰当的人,这就是它所要做的。关于这部分的项目,几十年来,我们所看的BI项目,至少在中国90%都变成了在做报表来提供信息了。那么这些信息的展现形式可能发生了变化,过去是纸质的,变成电子文档,现在是通过web的,通过技术的改变而改变,但是还是报表!那么,IT部门在做的很多的事情是什么呢?为企业提供标准化的报表。BI在这一部分的工作做的非常好。

BI还有另一个作用。如果BI只是做报表,就不应该叫Business Intelligence,对不对?之所以叫BI,是因为它有另一个很大的含义:决策支持。决策支持和BI有什么关系呢?决策支持要靠信息,当一个将军在指挥所里运筹帷幄指挥部队打仗的时候,他要知道天气,知道敌人的情况,知道各种各样的信息。各种各样的信息汇总到他这里,然后做智能地分析,然后决策。

那我们想一想,为什么报表比较容易,决策就比较难。因为大家都知道,报表都可以是标准化的,比如说有些大型的企业,定义了银行40种报表,但是最后到每个部门后根据角色来定义,可能变成40万报表,所以说都是提供标准报表。但是我想请问各位,决策是有标准的么?有没有一个标准决策?如果有标准决策,那么我们在座的各位都可以去做国家主席了对不对?决策么?那你知道胡主席是怎么做决策,江主席是怎么做决策呢?也就是说不同的信息到了他们那里,他们用不同的方法在思考。所以说,江主席的决策方法和胡主席的决策方法是不同的,美国总统和中国主席的也是不同的。那也就是说,做决策的时候是没有标准化的。在座的各位IT人员比较多,如果你的公司换了个总经理,他对你提出的一些信息的要求可能会有不同。那也就是说,决策支持里面要提供给决策者的是决策者个性化的东西,所以我非常赞同金蝶的演讲,中国式的企业有很多不确定的因素、个性化的特征,金蝶发展的方向是要满足这种不定的需求。其实我觉得,不仅仅是ERP要满足这样的个性化的需求,在BI里面更给应该满足不同的需求。我相信在座的几百人,大家拿到同样一份数据,可能大家每个人作分析的时候用的角度都不同,这就是说我们没有办法提供一个标准的东西。

我们接下去看看传统的BI是怎么做的。首先,传统的BI是这样的:在做BI项目的时候,企业一定已经有了数据。数据是哪里来的呢?可能是ERP系统、CRM系统、EXCEL等等中有的数据。一般BI的逻辑就是先用ETL把数据抽取出来。现在的BI厂商在讲一个概念:企业级的BI系统。大家都在讲大嘛,企业级的ERP系统,企业级的BI系统等等。那么怎么表述企业级的呢?就是要把企业里面各个信息系统里所分布的数据有机的组合在一起,变成一个企业级的数据仓库,这就是我们一般做的。或者,我们会针对某一些主题,比如财务主题、销售主题等等,做一个Data Mart。做完之后,我们基于这个,为不同的分析用户,或者是管理层,或者是业务人员,或者是部门经理等等,提供OLAP的这种分析,提供报表。现在我们讲的高级一点,提供仪表盘、记分卡等等。那么,实际上大家看到的很著名的BI厂商,像Cognos、Microstrategy等等,这张图说明他们的产品都是由很多不同的软件组成的,有的是买来的,就是说它们不是在一个体系结构里的,每个产品都是在一个独立的体系结构里去做的。所以,很多情况,很多大型的客户ETL是用A公司的BI产品,其他的用B公司、C公司的等等,然后把它们组合在一起来做这种项目。

传统的BI是这么构造的,那么传统的BI项目是怎么做的?第一步,要定义数据源。我们有很多的数据,要把数据定义好。第二步,要做数据的清洗、关联。目的是建立一个中央的数据仓库,一个集合的集成的数据仓库。对于大多数的BI来讲,有了这个数据仓库以后,接下去要建一个OLAP的Cube,一个Cube满足一个东西的需求,有了这个Cube之后可以根据这个Cube建立很多让最终用户看起来很方便的用户界面,用户呢就可以使用这个界面,看图形或者报表等等。这个就是基本的做法。

这里我们要探讨几个问题,第一个问题:目前的BI的做法里面有一些我这个新人没想通的问题。没想通什么地方呢?大家看,首先,BI的第一步就是要把分散的不同系统或者同一系统里的数据库集成在一起建一个数据仓库,把分散变成集中。集中后再把集中做小,分解出一些Cube,一个Cube只对应一个Data Mark里面很少部分的数据。所以,厂商在玩一个游戏,把分散的数据集中起来,为某一个个人服务的时候再把集中的数据变小,大概就是这么个逻辑。这就造成BI的实施周期很长,往往还长过ERP,实施比ERP还难。

为什么要这样呢?因为,如果不建OLAP Cubes,不把数据弄小,不把维度弄小,系统的 会受影响Performance会受影响,用户就不能得到很快的相应,所以在建Cube的时候IT人员预先预计客户会从哪几个维度去分析问题,然后根据这个猜想去建立几个维度,把数据抽取来、合并好、算好,然后用户再去实时的用。这样,最终用户在用的时候,感觉到这是实时的,东西是活的。实际上他不知道,在座的IT把他要做的东西全部已经做好放在里面了。那么在这样一个游戏规则里面,碰到的一个最大问题是,如果今天IT为我做了一个分析是从ABCDEF五个维度,用的时候不管怎么样去组合看起来都很完美。问题出来了,如果今天我希望要加一个X维度进去,或者要换一个X维度的时候,我能马上就用么?不能。我需要IT重新来帮我建这个Cube,可能是增加一个Cube,或增加一个维度或者是减少一个。

那么大家会讲一个问题,为什么不能够把所有可能要分析的维度都放在一个Cube里面,那事情不就解决了么?但是现在技术上面有问题,如果数据仓库里面,和它有关的有100个字段,如果把这100字段都放在一个Cube里面,那你按了一个按键,可能到明天都出不来结果。所以只能是把你最有可能要看的维度的东西放在里面,因为技术实现不了。那么就造成一个问题,现在所有的BI厂商都时说企业级的BI,那么企业级的BI是企业里很多人都在用还是只把数据集成起来变成企业级的但是很少人在用,这是很大不同的观点。如果说企业级的BI是企业里很多的人在用,假设企业里有50个人或者100个人在用BI这个产品,来做每天不同的业务决策分析,如果每天每个人有一个新的想法——应该很正常的吧,IT在每天就会得到50个或者100个做Cube的请求。做一个Cube要多少时间呢?一天做不好对不对?那么IT部门要多少人呢?如果IT只有一个人,就是要做100天才能满足今天的需求。那么明天是不是就没有需求了呢?不是的,实际上在这个社会上,永远不变的就是“变”。人每天都在变,人的想法每天都在变。变是正常的,因为世界在变,所有的东西都在变,所以他变是正确的,那么我们IT怎么去满足他呢?根据IDC的报告,现在全球的所有的IT部门面临的很大压力在于不能够及时满足它所服务的业务部门的这种“变”的需求。当客户要“变”的时候,IT可能要几个月才能满足他的需求,或者几天。如果一个企业的需求是一成不变的,不管是上ERP还是BI,都很容易去解决。问题是现在我们要解决的问题是“变”,如果这个企业的需求一直在变,我们怎么去满足他的需求。很多的企业买了BI产品,最后不用了,什么原因呢?我们做这个项目的时候,满腔热情地在做,但是做完以后用了之后会发现,这个东西实际上是不适合我的。为什么呢?没法变!我要变,每个人都要变,IT很难支持。这个就是传统BI存在的最大问题,当客户出来新的问题的时候,我满足他的需求很难。

第二,我觉得存在一个逻辑上的悖论。先把分散的数据集中起来再分小部分来做,这些成为了厂商赚钱的方法,实施的周期非常长,咨询的周期非常长。

第三,传统的BI是这样做的。如果你做过BI就会知道,举个例子,如果A公司(BI厂商)跑到你公司(比如是李宁体育用品公司),会说:“我是世界知名的BI厂商,我做过Adidas,Adidas业务是和你一样的,Adidas是怎么样去建立数据仓库,怎么样去建Cube,怎么样去建KPI的。”然后说“我是行业专家,我告诉你……,你应该学Adidas”。但是我觉得,现在很多情况下的问题是:因为Adidas是Adidas,李宁就是李宁,李宁的总裁想要分析的东西和Adidas的是不一样的,每个人都是不一样的,如果这两个没有任何区别,就应该是一个名字了。这就是说,很多BI项目做不好的原因是,认为同行这样做能成功的我就能成功,实际上我觉得这有很大的差距。现在最大的差距在,从我在市面上的了解,很少有人到你那里问你:你想要分析什么?你想要做什么?我来证明给你看。没有的,所有的人的证明就是:我做过张三,张三能够实现的在你李四那里就能实现。那么我想,张三想的和李四想的是要一样的,问题是如果张三和李四跑到同一家餐厅去点菜,点同样菜的几率有多高呢?

所以,在我看来,传统BI要花很长时间,花很多的钱,但是它的价值比较低。这是我整体的看法。所以BI不像ERP那样能在中国蓬蓬勃勃的发展起来,因为大家没有看到价值。因为如果BI工具买来就做个标准报表,那我找人自己来开发有什么区别呢。所以,大家看到的传统的BI,IT人员要花费很多的时间学习不同的软件,ETL是ETL,数据仓库是数据仓库,Dashboard是Dashboard,OLAP是OLAP等等,每个都不一样,要一组人去学习不同的东西,是比较复杂的事情。数据建立模型,间数据仓库很费时很耗时,因为要去和业务部门去讨论哪些数据要拉过来。为什么要讨论?因为当我们把很多分散的数据合并在一起的时候,这是一个几何级的数据量的增长,所以希望能够把可能会用到的数据集成起来,没有用的就不要了。但是如果做少了,下面分析就不够了,做多了对硬件的要求就太大了。但是往往IT和业务人员一起来弄,还是非常非常复杂的事情,很难。还有,IT人员要不断地重复去建那些没有很大价值的OLAP、Cube之类的工作,今天建这个Cube是四五个维度,明天要增加一个维度,不停的在做,而且还有问题。这个软件很复杂,表现在实施的周期很长,IT掌握时间很难,业务人就是真正应该去用的人很难用。其实我想问问大家,你知道世界上用的最多的BI工具是什么么?应该是EXCEL。EXCEL是现在大多数的管理人员、业务人员在用的他自己的一个分析工具。为什么EXCEL的功能是比较弱的,不能处理大量的数据,那么多的管理人员——你去看看你的财务部门等等,每个人都在用的都是EXCEL,为什么?因为,业务人员他能用!我们现在看到的很多BI工具,给我我也不会用啊。能用是硬道理!现在最大的问题就是:你给我一样不能用的东西,再好,我也没用,要给我一个能用的东西。还有,实施周期非常长,这存在什么问题呢?就像刚才傅先生讲的,中国客户的需求是不断在变化的,如果一个实施周期要12个月,从拿到需求到完成是永远完成不了。因为需求一直在变,还没做完需求又变了,然后又跟着做,这是永远不满足的。所以在功能上来讲,它是不能满足用户的需求。但是就业务人员本身来讲,或者企业内部的IT来讲,也没有办法满足自己的客户的需求。就是说,不仅供应商没法满足客户需求,用户的IT部门也没有办法满足业务部门的需求,这就是存在着的很大的问题。

BI究竟是干什么的(图)。一个是信息发布,一个是决策支持。这就是BI的作用。那现在做的比较好的就是提供各种不同类型的报表,然后监控交易系统,传统的做法是根据系统之间的比较,看数据有没有差异,出一个报表。实际上,在决策支持里主要要解决的两个问题是什么呢?一个是即兴地查询和分析。我发现问题的时候能够即兴地查询和分析,这个“即兴”是很难标准化的。最近股市非常热,大家都在做股票,举个例子来说,**股份狂涨,那么在座的你要去分析一下,*股份涨了,它为什么涨呢?你说哪个BI系统能够事先预计到**股份会涨,没有的。所以,标准的KIP只能告诉你“现状是什么”,标准的报表也只能告诉你“过去是什么”,但是它不能告诉你,这个**股份为什么涨。为什么涨?你要去查查所有和**股份有关的信息里,去找几条可能的原因。反过来做什么事呢?在所有股票里面,还有哪些有这些体裁的,然后再去做。这么复杂的一个分析,有可能事先做好所有的Cube么?有可能事先做好标准的KPI么?不可能的。KPI也好,标准报表也好,都是针对过去的那些没有发生变化的事情。就好像,假设股票今年要涨300点,那么大家都在这么个标准情况里面,对80%的情况它都是适用的,但是你如果要找到黑马,要找到这个为什么涨,你从标准里面是找不到的。BI的决策支持最主要的问题就是让我去找到不是一个标准的东西,而是一个不标准的东西。不标准的东西就是我们没法事先预计的,但是我们传统的BI做法都是按照原来预计好的东西去做。

刚才金蝶讲了,金蝶在发生变化,提供给用户满足他个性化需求的东西,我们非常赞同这个观点。怎样满足用户个性化的需求,我们从自己的IT部门来讲,我们是要让用户——不是指IT用户,是指比如财务部门、业务部门、总经理等等——能够做他所需要的即兴的分析、他所需要的报表和他所用的一个仪表盘,如果他觉得这里需要增加一个维度,他自己可以放上去。如果用户能够做到这一条,我们IT就不会存在天天被骂的问题,为什么?我们能让用户独立!那么怎么能够让用户独立呢?讲了半天,我还是讲点产品。

我和大家一样,在苦苦地追索。我们是一个服务的厂商,过去我们在做J.D.的ERP,我们要发展一个新的业务,我们选择了BI,但是我们没有选择现在市面上非常热的仅仅是500强大公司在用的产品,我们选择了欧洲的一个BI产品,叫QlikView。为什么选择它?主要的原因是,不需要建数据仓库,不需要建Cube,还有Performance非常好,在超过10亿条数据的情况,只要Click,结果就出来了,没有等待时间,然后不需要对所有数据进行排序,不需要对任何字段进行排序,但是每一个字段都可以作为检索字段。大家觉得怎么样呢?过去,我们花很长时间去做索引,不可能对所有字段去做索引,三个字段的索引就很长时间了。但是,这个产品你不需要对任何字段进行索引,所以时间就快了。而且,任何情况下,就是我刚才讲的,用户有机会能够做自己所需要的Dashboard、报表。而且它拥有标准的BI的功能,市面上的BI有的功能它都有,但是这个产品像EXCEL那样好用。真的还是假的?我们在外面有一个展台,我们有演示。同时我告诉大家我们最大的一个不同,我们不说我们已经做了多少,尽管截止到去年10月份,全球已经超过5000个客户,平均每天增加10个客户,很多是500强的客户,但是我觉得我们不讲这个,我们最大的区别是什么?是骡子是马拉出来溜溜。如果你有需求,如果你有传统BI你觉得都没有做好的需求,你告诉我,我们的人可以去你那里做出来给你看,如果你觉得骗人的,我们走人。所以我们不讲我们是行业专家,我们没有行业限制,任何行业,只要你有数据,只要你有想法,传统BI项目最大的问题就是用户没有想法,所以各位只要你有数据有想法,你就到S&I来。

结束前我插一下,这是IDC的观点:传统的BI是一个数据跟踪,从系统里把数据抽取出来,进行比较,看看现状和目标的差别,然后信息发布,可能出个报表,然后有个警报告诉你。这是一个闭环。实际上不应该是这样,应该说这只是BI的开始,就像我们刚才讲的**股份,我们要去找假设条件,开始做即兴的分析和查询,去找出“为什么**股份会涨那么多”的所有有关信息,然后去分析。分析完后找出可行性有哪些也会这么涨,制定几个方案,根据这个去比较去做决策,最后去做实施。传统的BI做法,给个报表给个警报应该是BI的开始,就是做即兴分析的开始。

如果要资料需要,可以和童小姐联系,我们在外面有个展台,我也不想过多的占用大家的时间,因为毕竟我在BI圈子里是一个新人,但是我想我们和别人的不同是,我们可以把你今天想要的东西给实现出来,包括用你的数据。好,谢谢大家!

责编:顺胤科技(上海)有限公司总经理 卫欣
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
畅享IT
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918
Baidu
map