RichData大数据智能分析平台

来源: kaiyun体育官方人口
2014/6/6 18:17:08
RichData是一个跟具体行业业务无关的、通用性的大数据平台工具产品,通过这个产品所具备的的高性能的实时和非实时大数据计算能力、丰富的统计、分析、挖掘模型,为行业全流程、全周期的生产运营活动提供商业智能支持。

分享到: 新浪微博 腾讯微博
RichData是一个跟具体行业业务无关的、通用性的大数据平台工具产品,通过这个产品所具备的的高性能的实时和非实时大数据计算能力、丰富的统计、分析、挖掘模型,为行业全流程、全周期的生产运营活动提供 商业智能支持。
RichData与具体业务实现了松耦合,是一个中间性的大数据分析挖掘平台,可应用到各个行业,实现行业内特定场景下,对大数据的分析需求。
产品定位
RichData从产品定位上,主要为行业大数据提供处理能力,是一个数据分析挖掘平台。因此,RichData的客户目标定位为具备大数据场景的行业客户。RichData作为一个大数据商业智能的基础平台,以RichData作为支撑,与行业具体的解决方案结合,可以延伸出行业化的数据产品族。
产品架构
●管理子系统:主要包括集群管控、元数据管理、调度管理、数据服务管理、系统管理五个功能模块。
●ETL子系统:RichETL以元数据驱动的方式提供强大的抽取、转换盒加载(ETL)能力
●计算子系统:以HDFS Federation和YARN为核心,在YARN集成了各种计算组件,包括HBase、Hive、Tez、Storm、Kafka等。
●服务配置工具:通过可配置式个性化开发,大大降低了平台实施和使用的技术门槛,对平台的大部分二次开发不再需要专业的开发人员,业务人员就可以实现对数据计算的定义、脚本实现并通过定义规则驱动数据计算。
●报表和分析工具:包括自定义报表工具和自定义分析工具。
●数据服务子系统:对外提供各种数据服务,开放多种数据接口,外部系统/用户可通过服务认证、数据API等方式按权限访问相应的数据。
技术架构
通过采用当前业界先进的大数据处理技术和模式,构建与具体业务松耦合的中间性的大数据统计、分析和挖掘平台。
利用大数据平台,通过资源的线性扩展,可以实现单条信息秒级的在线处理性能、TB级数据离线分布式处理、PB级数据的存储。
产品特性
配置化的安装部署
●系统可实现跨平台、跨网络、跨区域分布式部署。
●将大数据平台各组成部分封装成统一的产品安装工具,实现界面化的向导式安装。
●平台采用向导式过程安装,自动检测资源,自动化安装。用户只需指定机器资源,平台自动进行资源检测、资源规划、平台各模块的安装,真正做到向导式安装,无人值守式安装。
元数据驱动的平台运行体系
●平台采用分布式架构,弹性管控集群资源。
●平台运行以元数据为基础,元数据包括数据源元数据,数据仓库元数据,结果元数据,数据服务元数据,任务元数据,平台信息元数据等。
全域的系统监控与管理
●管理模块是大数据平台信息的汇聚点,通过管理子系统获取的信息可以知道系统的总体运行情况。
●实时查看平台运行的业务,对业务进行调度,优先级配置,多维度的业务报表。
●通过管理平台的信息呈现,用户可以清晰地知道当前系统运行的变化趋势,从而把握系统的稳定性及健康状况,可动态管理集群。
●具备集群监控、集群管理(节点管理,异常管理,用户管理,安全管理等)、元数据管理、调度管理、数据服务管理、系统管理等功能。
完善的安全管理策略
●多层面的用户权限管理机制,设置严格的数据管理机制。
●内置了用户操作记录机制,全面监控用户对平台的使用情况。
丰富的函数模型库
●对常用的统计函数,数值计算函数,字符函数进行封装。
●对常用的数据挖掘模型、算法进行封装。
●插件式的函数模型库,可动态增加新算法模型
●提供行业分析模型及类似 BI的分析和展示工具。
开放的数据服务
●对外提供各种数据服务,开放多种数据接口,外部系统/用户可通过服务认证、数据API等方式按权限访问相应的数据。
●采用可视化的图形,列表等页面展示方式。
●标准化的接口访问协议,为各类数据服务提供统一入口,提供便利,全面的数据服务。
●统一控制,对用户访问和数据访问的统一管控,访问日志记录,保证数据安全。
●统一数据缓存机制,接口访问稳定性和速度的提升。可扩展,可定制,满足未来的数据访问需求。
多来源多格式适配的数据采集
●以元数据驱动的方式提供强大的抽取、转换盒加载(ETL)能力。适配多种数据源,支持从文件、DB、数据流中导入数据。
●灵活的数据转换配置和任务配置,提供给了直观的图形界面设计器,大大缩短了数据抽取的开发周期,并且容易维护。设计界面友好,提供了工作流设计模式,满足各种场景的实现。
●服务以集群方式部署,支持多任务并发,自动负载均衡,支持大数据量的抽取转换处理,执行效率高,提供了丰富的异常处理功能,能满足各种异常处理需求。
统一的分布式存储
●以HBase作为 数据存储的统一格式,MapReduce、Hive通过接口使用HBase数据。
●做到一份存储,多处使用。
配置式的服务配置工具
●通过配置完成计算任务的配置,降低平台实施和使用的技术门槛。
●通过统一的配置模板实现对数据计算的定义、脚本实现并通过定义规则驱动数据计算。
可视化的自助分析工具
●自定义报表工具,实现了基于XML的定义文件来可编程性地生成报表的能力。
●围绕着报表引擎,开发用户图形界面,用户可以使用向导,无需编程,通过工具配置一步接一步完成创建一个报表。
●数据展示格式灵活,能更大程度上满足用户的数据需求。
●多维分析工具,提供丰富的图形化展现界面和接口。
●用java语言开发支持MDX(多维表达式)的查询语言、分析型XML和olap4j的接口技术规范,实现了从SQL和其他数据源读取数据,在内存缓冲区中生成集合数据。
模组化的平台架构
●平台采用分布式架构,弹性管控集群资源。
●平台各功能组件之间通过数据进行交互,实现松耦合。平台各子系统既是一个独立的功能模块,又能通过数据的交互构成一个整体。
责编:李玉琴
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
进口鲜 玩转海鲜O2O

上海进鲜实业成立于2014年12月30日,其创办的O2O平台“进口鲜”专注于为消费者提供高品质的海鲜产品。在短短一年不..

首届优秀信息化产品及信息化最佳实..

.mod_B_1{background:rgba(0, 0, 0, 0) url("//www.iqiam.com/bacohome/2015/cio..

    专家专栏
    李浩实现与PLM协同工作的三维零部件数据资源平..

    目前国内外不少企业和研究单位在建设完成以三维CAD、PDM系统为核心的产品研发平台建设后,将目光投向零部件数据资..

    AMT咨询浅析集团型企业的信息化商业价值

    国内管理咨询公司AMT信息化建设专家提出下几点关于集团型企业信息化商业价值“营销”推进的方式

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map