Hadoop生态图谱

来源: nosqlfan
2012/11/29 14:36:29
当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。



分享到: 新浪微博 腾讯微博
本文关键字: Hadoop 大数据 MapReduce

当下Hadoop已经成长为一个庞大的体系,貌似只要和海量数据相关的,没有哪个领域缺少Hadoop的身影,下面是一个Hadoop生态系统的图谱,详细的列举了在Hadoop这个生态系统中出现的各种数据工具。

  1. 这一切,都起源自Web数据爆炸时代的来临
  2. 数据抓取系统 -Nutch
  3. 海量数据怎么存,当然是用分布式文件系统 -HDFS
  4. 数据怎么用呢,分析,处理
  5. MapReduce框架,让你编写代码来实现对大数据的分析工作
  6. 非结构化数据(日志)收集处理 -fuse,webdav,chukwa,flume,Scribe
  7. 数据导入到HDFS中,至此RDBSM也可以加入HDFS的狂欢了 -Hiho,sqoop
  8. MapReduce太麻烦,好吧,让你用熟悉的方式来操作Hadoop里的数据 –Pig,Hive,Jaql
  9. 让你的数据可见 - drilldown,Intellicus
  10. 用高级语言管理你的任务流 –oozie,Cascading
  11. Hadoop当然也有自己的监控管理工具 –Hue,karmasphere,eclipse plugin,cacti,ganglia
  12. 数据序列化处理与任务调度 –Avro,Zookeeper
  13. 更多构建在Hadoop上层的服务 –Mahout,Elastic map Reduce
  14. OLTP存储系统 –Hbase

责编:杨雪姣
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
IT系统一体化时代来了

2009年Oracle 用Exadata服务器告诉企业,数据中心的IT服务一体化解决方案才是大势所趋,而当前企业对大数据处理的..

高性能计算——企业未来发展的必备..

“天河二号”问鼎最新全球超级计算机500强,更新的Linpack值让世界认识到了“中国速度”。但超算不能只停留于追求..

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map