数据分析的模式

作者:kaiyun体育官方人口
2007/11/13 14:52:08
本文关键字: 数据分析

作者: ewen321 20070929

数据分析的模式

1. 从概化群体入手,分析一般特征,得到的结论是特征分群的标准-属聚类分析。
2. 从细化个体入手,套用聚类结果分析具体行为,得到用户所归属的具体群体-属分类分
析。

举例:

目前联通的客户资料中,有不到50%的入网客户是采用身份证作为入网凭证的,我们可以从身份证中得到:年龄、性别、籍贯等信息。针对年龄,我们对已知的年龄分层,结合已知身份的用户通话行为,可以得到一些结论:比如:打长途比本地费用高的集中在50岁以下(群体a),并且可能性是80%(群体a/所有打长途比本地费用高的人),并且…… 那么,假设现在有一个不明身份的客户,她/他的长途比本地费用高,我们就可以得到这样的结论:他/她的年龄在50岁以下的可能性是(80%)。是不是有NBA这样,在后台模型充分的基础上,我们可以给一些身份未知的用户打出一些标志,勾勒出这个用户的粗线条或者叫轮廓。由此推而广之,我们便得到这样的实例化结论:用户B,男,30左右,可能是上班族,经常游走于XX小区和XX街道之间,上班时间的前30分钟内,经常会打电话给小C(小C,女,和她年龄相当,30左右,和B是亲密爱人或夫妻),同时,B保持亲密关系的还有一个小D(女性,交往圈极广,20出头,籍贯北京,属于前卫少女),B和小D经

常长时间通话,互发彩信,并且大都比较暧昧。在C存在的情况下,D很可能是B的另一个倾诉对象(网友或情人)。B每月给D打的电话费高达XXX元,其中彩信都有XXX条之多,但B的电话费是公司代缴,因此C可能完全不知D的存在(B、D之间从未有联系,交际圈也不同等等吧,反正没有特征显示她们是认识的)。而从某一天开始的接连几天,C连续给D打了不少电话,这几天里,C也不断给B打电话发短信,并且到营业厅里打印过B的通话详单,总之,C这几天波动异常,情绪不稳。之后,B再没主动和D联系过。而D呢,刚开始还主动找过B几次,以后就再也没联系过,而且D也换了号码,似乎还有了新欢……呵呵,哈哈,想去吧,简直就是《手机》的翻版,抑或是某个都市情感剧的原型。经分要是做到这个地步,倒也给我们这些做分析的人带来不少联想的乐趣,呵呵。

作者:goldenfish3 20070930

数据分析做到高级阶段就会触及隐私,而隐私保护涉及法律问题和技术问题。分析做的好就会既能发现规律、发现知识又能有效保护隐私。

作者:Hu, Jiangtang 20070930

分类和聚类,一个是有指导的学习,一个是无指导的学习。分类有类别标注,聚类则没有。

作者:yunong 20071001

基本上目前对individual 层面的分析不可能那么详细吧,要分析也分析VIP用户~从VIP用户里挖掘潜在的卖点。

作者:Delin He 20071001

我觉得这个只是探讨探讨数据觉得 好玩而以吧。某天闲的无事把我自己访问我们公司的网站的数据给提出来了,稍微做了分析。发现我的特征如下: 上网的时间属于夜猫子的出来的时间,从音乐试听记录上来看,对男歌手无兴趣,对漂亮女歌手感兴趣,我这人基本乐盲,只听最流行的,喜新忘旧型......哈哈哈,有点意思。

作者:hunter 20071001

说道隐私,记得数据挖掘里有经典两例,一例是美国军官快退休时被发现同性恋,开除军籍,纠纷闹得影响很大。另一例是英国电信,直接把促销(经常通话的号码)信息发到客户家庭,结果某家的婚姻就此解体。

作者:Qing 20071008

旧时王谢堂前燕,飞入寻常百姓家。

分析vip客户,讲究的帕累托原理,可长尾理论出来了,就开始对广大劳苦人民分析起来。现在这个社会不是从精英走向草根了嘛,bi也是这个道理。

而且对数量巨大的长尾进行分析更能体现bi的价值,因为对于vip来说,数量少,一对一服务,有时候根本用不着什么分析,而对那些非vip,没法一对一,又要所谓的个性化服务,用bi提升客户洞察力。

作者:Hawking, Bin 20071009

后半部分说的是social network analysis。我已准备作为下年的电信BI应用的一个提案--通信是social行为,怎能不作social 分析呢?

计算量当然是巨大,这就有正当理由扩容几千万¥的机器了,哈哈。

责编:姜玲
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
畅享
首页
返回
顶部
×
畅享IT
    信息化规划
    IT总包
    供应商选型
    IT监理
    开发维护外包
    评估维权
客服电话
400-698-9918
Baidu
map