云数据库应用研究

来源:万方数据  
2014/4/8 10:54:31
从实际出发分析了传统数据库面临的问题,提出用云数据库来解决问题。对云数据库技术的发展和现状进行了阐述,分析了当前主流云数据库的特点和优势,并采用HBase 作为云数据库平台进行了实验研究。

本文关键字: 云数据库 HBase 数据库
2.1 Amazon 的SimpleDB
 
SimpleDB是Amazon 提供的简单数据库服务,主要用于存储结构化数据,并为数据提供查找、删除等基本的服务,其具体的实现细节Amazon 没有公开。由于Amazon 主要是提供商业性的服务,使用其服务需要一个Amazon 的帐户,那么一个用户帐户就相当于全集,而具体的数据则相当于子集。由于SimpleDB简单的数据存储方式,其所有的数据都是以字符串形式存储,导致其采取词典顺序进行查询,数据操作很不方便。考虑到其技术封闭性,不能在实验环境中使用其平台。
 
2.2 Google 的BigTable
 
BigTable是Google 基于GFS (Google File System)和Chubby 开发的分布式存储系统。BigTable 是非关系型数据库,是一个稀疏的、分布式、持久化存储的多维度排序表。它采用行键(row key)、列键(column key)和时间戳(timestamp)对表进行索引。表中的每个值都是未经解释的字节数组。BigTable 在行键上根据字典顺序对数据进行维护,并且一张表的行键也是其划分行区间,进行Split 和负载均衡的依据。其设计目的是可靠地处理PB 级的数据,并且能够部署到上千台机器上。BigTable 已经实现了下面的几个目标:适用性广泛、可扩展、高性能和高可用性。BigTable已经在多个Google 的新产品和项目中得到了应用,如Google Analytics 和Google Earth 等。
 
根据对BigTable 的研究,了解到BigTable 主要是Google 针对自身各种应用设计的存储系统,并且没有开源,在实验中无法使用。但是BigTable 的主要技术和实现都对外开放,并且BigTable 的研究资料非常丰富,在研究云存储的过程中具有很高的借鉴意义和参考价值。
 
2.3 Microsoft 的SQL Azure
 
SQL Azure 是微软的云关系型数据库,是基于SQL Server 技术构建的,主要为用户提供数据应用服务。SQL 简化了数据库的部署,用户无需安装和配置数据库,也不需进行维护和管理。并且,SQL Azure 还为用户提供高可用性和容错能力。SQL Azure 做为一个商用数据库,其提供一个云端的DBMS(DataBase Manager System),这使得本地应用和云应用可以在微软的数据中心的服务器上存储数据。用户是按需付费,其中主要的费用是操作费用,而不是磁盘和DBMS 软件投入的费用。
 
SQL Azure 做为一款商业软件,其采用按需服务、按需收费的模式。由于其不开源,所以无法在实验环境中搭建,但是做为云数据库中采用关系型数据模型的典型代表,依然具有重要的研究意义。
 
2.4 Apache 的HBase
 
HBase数据库是基于Hadoop 的Apache 顶层项目,它是BigTable 的开源实现,但存在很多不同之处。HBase 是一个在HDFS 上开发的面向列的分布式数据库,主要支持实时的随机读写超大规模数据集。HBase是自底向上地进行构建,能够简单地通过增加节点来达到线性扩展。HBase 是非关系型数据库,不支持SQL 查询,但其具备了RDBMS 无法比拟的特性:在廉价硬件构成的集群上管理超大规模的稀疏表。HBase系统结构如图1 所示。
 
 
HBase 采用一个Master 节点协调管理一个或多个RegionServer 从属机(HBase 把表水平划分成Region“区域”)。HBase 主控机(master)负责启动和注册RegionServer,把Region 分配给RegionServer 并负责RegionServer的故障恢复。RegionServer 负责Region 的管理和响应用户的读写请求,当有新的Region 产生时,RegionServer 将通知Master 节点。
 
HBase 依赖于Zookeeper(Zookeeper 提供分布式锁服务,类似Google 的Chubby),它管理一个Zookeeper实例,作为集群的“权威”(authority),并负责根目录表的位置、当前集群主控机地址等重要信息的管理,并负责维护整个集群的工作状态和灾难恢复。
 
HBase 是开源实现,可以方便地从互联网上下载安装包和源代码,非常适合企业、科研单位和学校进行使用学习和再开发。但其操作和管理界面比较简单不够友好,需要进一步提高。
 
2.5 云数据产品比较结果
 
通过对几种具有代表性的云数据库进行研究,比较结果如表2 所示。
 
责编:李玉琴
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
IT系统一体化时代来了

2009年Oracle 用Exadata服务器告诉企业,数据中心的IT服务一体化解决方案才是大势所趋,而当前企业对大数据处理的..

高性能计算——企业未来发展的必备..

“天河二号”问鼎最新全球超级计算机500强,更新的Linpack值让世界认识到了“中国速度”。但超算不能只停留于追求..

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map