分析思路模式化

作者:刘庆
2007/5/25 14:25:57
本文关键字: ttnn 2006年11期

十一月二十一大雾,不宜出行
可还是从南三环穿梭到北五环,纵横南北
没有想象中的寒冷,只是多加了一件外套
仅仅在早晨和夜里,才能感到北京的冬天
暖洋洋的办公室,在五层看到不少美女
中午小睡一会儿,闲的无聊便遐想一番
当然,跟美女无关


已经回北京两天,除了见老友叙旧,还去拜访了朋友公司。怎么形容他们呢,是依靠数据为生的。当然,卖原始的数据只是初级阶段,现在干啥都讲究增值业务,数据也有增值业务。也就是分析。这是在ttnn里面讨论最多的一个话题,数据仓库、数据挖掘、分析的方法。大家互喷一通,算是脑力激荡,从中也颇有收获。


最近也在寻思一个问题,如何将眼前这些杂乱无章的分析专题变成产品呢?当然不是那种类似算法的东西,那是工具。如果将工具性质的这种产品放在下层,最上层是针对客户具体问题的分析方法,那么这个想象中的"产品"是处于它们之间的。看来我对这个想法还是不能说清楚,只是隐隐有那样的感觉。总觉得,应该可以将现有的分析方法抽象一下,变成一种适用范围更广的东西。就像挖掘工具、OLAP技术适用于不同行业,是对普遍分析事物的抽象。不过这种产品太通用了,离解决具体问题还是有一段距离。虽然,诸如sas、spss之类,也提出一些更加具体的方法论,并融入了产品当中,但方法论总是比产品虚幻一些的东西。


想象中的这种产品,它的"适用范围"可以局限于某个行业,或者是针对某个行业某个业务问题的。后者也许更加现实一点,市面上确实有一些这样的产品。我们做项目,给客户建设各式各样的专题时,大多都是"应景之作",或者说,是摸着石头过河。因为项目进度的原因,经常不会去花时间进行总结。因此,反观现在做的这些工作,几乎没有一个能够拿出来,可以不作修改地或者修改很少地移植到另一个省去。


将分析思路整成产品难度不小,因为大家都知道,人的思维太灵活,没有固定的套路。几个月前,曾经探讨过一种叫做"分析流"的东西,应该算是一种产品化的尝试,希望用流程来表示思路。但似乎也不符合人的思维习惯。人的思维并非流程化的,可能是并发地从多个角度同时思考,这有点像OLAP,将这两个维度组合看看效果,没什么发现,然后再组合另外两个,选取某些维元素查看,再变换一些展现方式。可以看到,这不是一个流程。这看似混乱的思维,可不可以将他们总结成有限的几种模式呢?模式化的东西才好产品化,他不一定是最佳的方法,确实容易普及的方法。不能解决100%的问题,却能比较轻松解决80%的问题。这就够了。


产品的可复制性应当是很高的(是指应用的可复制性,而不是盗版的可复制性),应当是结构简单的,是经过抽象的。变化的的部分,都是可配置。


哦,也许首先要区别的就是,哪些是不变的,哪些是变化的。


frankwansunny 20061120


很赞同Qing的想法,这也是目前BI做不大的主要原因之一,不可复制,不稳定。数据一变原来的模型就不管用了。直接造成人力成本上升,大家都是作坊式的方式做BI。不过要做到分析思路模式化还是很难的,应该是共产主义一级的目标,要实现BI的共产主义至少认知科学(congnitive science)和数据挖掘的理论基础(像统计学一样有理论基础,可以保证模型的稳定性)要有飞跃的发展,并且成熟到一定程度。


觉得作为一个过渡目标,我们是不是可以先建设一下社会主义,以前也提到过的一个观点,既然纯手工统计的工作量太大,纯自动化(模式化)的分析难以实现,我们是不是可以走半自动化路线。顺着Qing的思路说,是不是可以让分析思路半模式化,好模式化的部分模式化,有些简单的,方便抽象的,大家公认的分析方式可以模式化起来,比较灵活的分析方式保留接口给人,把人脑和电脑有机的结合起来(电脑承担复杂的统计和可模式化的分析,人脑承担灵活的分析),当然,计算机承担的部分也是人脑(一般不是甲方的)先想好的,系统的,模式化的分析指标体系和分析模式,这些指标体系和分析模式是可以产品化的,可以复用的

责编:刘庆
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
畅享IT
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918
Baidu
map