大数据:没有最大,只有更大

来源: 温州网
2014/2/24 9:38:53
大数据或巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大,以至于无法在合理时间内通过人工截取、管理、处理并整理成为人类所能解读的信息。

分享到: 新浪微博 腾讯微博
本文关键字: 大数据

而在大数据时代,我们能轻易地得到数据全体,而不再需要样本。譬如,阿里巴巴能得到所有买家的数据,它能轻易地统计“光棍节”那天的交易金额,算出哪个地区交易最活跃,可以通过媒体实时转播交易盛况。这就是大数据的全数据模式,数据处理的范围是全体,而不再是样本。第二个变化,是不再一味地追求数据的精确性。由于大数据的多样性、丰富性、动态性(在处理的同时,数据还在大量产生),强调数据的精确性是做不到的,也没有必要。纷繁的数据会混杂在一起,看起来好像全无用处,甚至有些还是错误的数据,但没有关系,这就是大数据的本性,看似无关无用的一堆数据却蕴含着无限商机。

想一想,当人们在百度上比以往更多地搜索“感冒”、“发热”等关键字时,往往意味着某地将要爆发流感,甚至还能预测是什么流感,这就是大数据的威力。第三个变化,是关注数据之间的相关性,而不是因果关系。比方说,通过挖掘天猫商城的交易数据,发现购买德龙咖啡机的买家,会有很高的比例购买宠物粮食,那商家会不失时机地推荐你购买皇家狗粮。咖啡机与狗粮没有因果关系,但却有内在的相关性。数据之间的相关性,就是大数据所蕴含的价值,也是商家追求的商机。大数据的相关性,告诉我们在面对错综繁杂的大数据时,我们不需要去研究“为什么”,只要知道“是什么”就足够了。

最后,大数据时代将催生一个数据挖掘行业,出现一批数字科学家。简单地说,数据挖掘就是从收集的数据中用一定的算法分析计算,得到我们所需要信息和知识的过程。传统的统计分析是将数据按已知的类别进行分类统计,然后寻找有价值的数据。如果给定的分类是不合理的或是错误的,那统计出来的结果就不会产生最好的效果。而数据挖掘采用的是一种叫作“聚类”的方法,它事先不需要人工分类,而是由算法分析数据的属性,将数据自动聚集成“类”,使“类”间的相似性尽量小,“类”内的相似性尽量大。比方说,保险业务涵盖各类人群、各种职业,所以设计某个险种潜在的客户目标群,需要对大量数据进行挖掘,才能找出不同的客户群和重要系数,这不是事先人为设定的。要“让数据自己说话”,这样才能因地制宜地制定营销计划,科学测算盈亏平衡,为保险企业创造更多利润。

大数据的红利

有人断言,数据将成为人类的重要资产,成为比石油和黄金更为重要的可重复开发使用的资源。笔者也认同这个观点。最近,媒体报道“三马”联手买保险新闻,这是一个攒取大数据红利的例子。“三马”利用阿里巴巴、腾讯和平安保险三家公司掌握大数据的优势,成立了网络保险公司——众安在线,这是具里程碑的互联网金融创新,旨在利用大数据对保险消费者进行准确定位和精准营销,瞄准的主要是80后、90后消费者。可见,利用大数据技术将是未来各保险公司抢夺市场非常关键的一环。

另一个有益的应用将是利用大数据来防范电信诈骗。电信诈骗是当今社会的一大顽疾,如果电信、银行、互联网、公安等各方摈弃利益纠结,共享各自的大数据,那么最大限度地杜绝电信诈骗是完全可能的。我们只要分析挖掘各方的大数据,找出电信诈骗相关性的数据因数,然后建立动态监控模型,那么一旦相关数据出现,公安就能根据数据链快速找到诈骗犯。

炒股的高手都想赚取大数据概念股的红利。大数据的红利在哪里?存在于大数据的拥有者、大数据技术公司和大数据价值挖掘者(也就是提供思维的数据科学家)。马云说过:未来的世界是数据的世界。大数据时代已经撼动了世界的方方面面,从工业、农业、商业、科技到政府、医疗、教育、文化以及社会的其他各个领域,人们的生活日益被数据所改变。可以说,大数据是一种比石油、黄金还要珍贵的资源,谁掌握了足够多的数据,谁就抢占了制高点,增强了竞争力,也就掌握了未来。

共2页: [1]2 下一页
责编:王雅京
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map