困扰,数据挖掘还没有算命技术成熟

作者:姜玲
2007/5/25 14:23:15
本文关键字: ttnn 2006年11期

frankwansunny 20061117

前几天陪朋友去算了一卦,觉得算命和数据挖掘确有相通之处。业务理解:要问什么(爱情、婚姻、学业、事业)
输入:生辰八字 建模:“易经大全”(几千年前就建好了) 输出:你出了什么问题,该怎么去破解(e.g.现在是你的人际关系低潮,解决方案:在窗台上摆盆花)

算命先生整个忽悠过程中最让我感兴趣的就是那本“易经大全”(有点像功夫里的那本),上面的中国字我都认识,但是就是不知道什么意思,还有好多table,据说这本书后面的大学问叫“易经学”,和统计学是一个概念。

其实我们做的数据挖掘项目感觉上大部分还是靠和用户沟通让用户相信的,有点信不信由你的感觉,模型预测的东西也时准时不准,这符合以前听说过的数据挖掘不是一门科学相吻合。

不过要是我们也有"挖掘大全"在手,岂不更像专业的江湖术士。江湖术士给人解命的时候有投机的嫌疑,但是我们能不能真正发现些规律呢? 那些是规律呢? 规律使用的范围如何?这些问题可能多应该在以统计学位基础的“挖掘大全”里有答案吧。

寻找数据挖掘的易经和信仰中。

Qing 20061120

呵呵,算命是BI的个人版,是PI。其实如果BI能够做到算命的程度,那就非常不错了。

昨天跟人乱侃,谈到一个问题——数据分析、数据挖掘到底要如何让客户满意呢?是构造更精准的挖掘模型?是从各种角度去分析一个指标?看到frank的这个感慨,我想,其实就得像算命一样要让客户满意。为什么这么说呢,将科学的事情当成迷信干。

前段时间,探讨关联分析的时候,不是提出了几种衡量关联规则是否有效的指标吗,支持度、置信度、兴趣度。支持度、置信度还是一种客观可以计算出来的,而那个兴趣度,可不就是一种主观的。我看,目前这个阶段,要让客户对分析结果满意,那就得在兴趣度上下功夫。这是自然的事情,因为客户喜欢新奇的东西。如果一项模型得出的结论是,你们的高价值客户消费都挺高,这个规则置信度很高,可是地球人都知道啊,兴趣度不高。就像一个算命先生掐指半天说对顾客说,"我预测,你有个爸爸,还有个妈妈"。

一个挖掘模型应当去发现那些目前还没有表现出来的,或者模糊的业务规则,这样比较好。怪不得,现在有个词叫做"知识发现"了,挺有道理。

责编:姜玲
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
畅享IT
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918
Baidu
map