大数据不仅仅是大流量

来源: 机房360
2012/9/20 11:24:34
大数据——被定义为是超越了其能力的数据集,典型的数据库软件工具捕捉、存储、管理和分析,最常见的是PB级的艾字节(exabytes)大小,是非结构化分布式和扁平架构模式。

分享到: 新浪微博 腾讯微博
本文关键字: 大数据

大数据——被定义为是超越了其能力的数据集,典型的数据库软件工具捕捉、存储、管理和分析,最常见的是PB级的艾字节(exabytes)大小,是非结构化分布式和扁平架构模式。随着大数据的持续增长,行业预期其将为企业带来巨大的和未开发的价值。根据infineta的报告显示,大多数企业将在未来的12至18个月重点采用大数据技术。

所有这些数据需要采集,存储,处理和分发,有可能堵塞网络。Hadoop管理每petabye字节的大数据大约需要0.5Gbps的带宽,Hadoop是一个大规模计算的开源平台。带宽需求可以影响企业广域网中的延迟时间、速度和可靠性。

研究结果显示,快速发展的趋势将影响到整个数据中心行业。这些主要的发展趋势包括:

存储价格日趋便宜。传统的数据存储运行每GB的字节成本大约为5美元,而采用Hadoop存储相同的存储量,每GB的成本仅为0.25美元。

增强的可扩展性。Hadoop采用预付一小部分费用的形式,使企业能够添加额外的存储空间。Hadoop的可扩展性,可能会导致在未来五年内,全球50%以上的数据都存储在Hadoop环境中。

缺乏分析。只有百分之一到百分之五的外部收集的大数据实际上是进行了分析。由于缺乏分析,有相当一部分有价值的数据被遗漏。根据麦肯锡最近报道显示,如果医疗保健行业对他们的95%的未捕获的数据进行了分析,那么估计每年将创造出3000亿美元的价值。另一个缺乏分析的例子是石油工业领域,石油钻井平台每秒产生25000个数据点,但石油企业对于这些数据的使用率仅仅只有5%。

该报告认为,企业部署Hadoop集群提供一个集中式的服务,使个别部门不用再建立和运行自己的大数据服务,并认为当涉及到处理批量工作负载时“越大越好”。

这种设置带来了大流量——数据在集群之间移动,在数据中心内部和数据中心之移动,包括但不限于复制和同步,这将变得尤其重要,因为Hadoop成为企业级存储的一个重要的因素。大流量移动数据服务支持大数据分析,合规性要求,高可用性服务和安全服务。

责编:赵龙
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map