|
RichData大数据智能分析平台RichData是一个跟具体行业业务无关的、通用性的大数据平台工具产品,通过这个产品所具备的的高性能的实时和非实时大数据计算能力、丰富的统计、分析、挖掘模型,为行业全流程、全周期的生产运营活动提供商业智能支持。 RichData是一个跟具体行业业务无关的、通用性的大数据平台工具产品,通过这个产品所具备的的高性能的实时和非实时大数据计算能力、丰富的统计、分析、挖掘模型,为行业全流程、全周期的生产运营活动提供商业智能支持。 RichData与具体业务实现了松耦合,是一个中间性的大数据分析挖掘平台,可应用到各个行业,实现行业内特定场景下,对大数据的分析需求。 产品定位 RichData从产品定位上,主要为行业大数据提供处理能力,是一个数据分析挖掘平台。因此,RichData的客户目标定位为具备大数据场景的行业客户。RichData作为一个大数据商业智能的基础平台,以RichData作为支撑,与行业具体的解决方案结合,可以延伸出行业化的数据产品族。 产品架构 ●管理子系统:主要包括集群管控、元数据管理、调度管理、数据服务管理、系统管理五个功能模块。 ●ETL子系统:RichETL以元数据驱动的方式提供强大的抽取、转换盒加载(ETL)能力 ●计算子系统:以HDFS Federation和YARN为核心,在YARN集成了各种计算组件,包括HBase、Hive、Tez、Storm、Kafka等。 ●服务配置工具:通过可配置式个性化开发,大大降低了平台实施和使用的技术门槛,对平台的大部分二次开发不再需要专业的开发人员,业务人员就可以实现对数据计算的定义、脚本实现并通过定义规则驱动数据计算。 ●报表和分析工具:包括自定义报表工具和自定义分析工具。 ●数据服务子系统:对外提供各种数据服务,开放多种数据接口,外部系统/用户可通过服务认证、数据API等方式按权限访问相应的数据。 技术架构 通过采用当前业界先进的大数据处理技术和模式,构建与具体业务松耦合的中间性的大数据统计、分析和挖掘平台。 利用大数据平台,通过资源的线性扩展,可以实现单条信息秒级的在线处理性能、TB级数据离线分布式处理、PB级数据的存储。 产品特性 配置化的安装部署 ●系统可实现跨平台、跨网络、跨区域分布式部署。 ●将大数据平台各组成部分封装成统一的产品安装工具,实现界面化的向导式安装。 ●平台采用向导式过程安装,自动检测资源,自动化安装。用户只需指定机器资源,平台自动进行资源检测、资源规划、平台各模块的安装,真正做到向导式安装,无人值守式安装。 元数据驱动的平台运行体系 ●平台采用分布式架构,弹性管控集群资源。 ●平台运行以元数据为基础,元数据包括数据源元数据,数据仓库元数据,结果元数据,数据服务元数据,任务元数据,平台信息元数据等。 全域的系统监控与管理 ●管理模块是大数据平台信息的汇聚点,通过管理子系统获取的信息可以知道系统的总体运行情况。 ●实时查看平台运行的业务,对业务进行调度,优先级配置,多维度的业务报表。 ●通过管理平台的信息呈现,用户可以清晰地知道当前系统运行的变化趋势,从而把握系统的稳定性及健康状况,可动态管理集群。 ●具备集群监控、集群管理(节点管理,异常管理,用户管理,安全管理等)、元数据管理、调度管理、数据服务管理、系统管理等功能。 完善的安全管理策略 ●多层面的用户权限管理机制,设置严格的数据管理机制。 ●内置了用户操作记录机制,全面监控用户对平台的使用情况。 丰富的函数模型库 ●对常用的统计函数,数值计算函数,字符函数进行封装。 ●对常用的数据挖掘模型、算法进行封装。 ●插件式的函数模型库,可动态增加新算法模型 ●提供行业分析模型及类似BI的分析和展示工具。 开放的数据服务 ●对外提供各种数据服务,开放多种数据接口,外部系统/用户可通过服务认证、数据API等方式按权限访问相应的数据。 ●采用可视化的图形,列表等页面展示方式。 ●标准化的接口访问协议,为各类数据服务提供统一入口,提供便利,全面的数据服务。 ●统一控制,对用户访问和数据访问的统一管控,访问日志记录,保证数据安全。 ●统一数据缓存机制,接口访问稳定性和速度的提升。可扩展,可定制,满足未来的数据访问需求。 多来源多格式适配的数据采集 ●以元数据驱动的方式提供强大的抽取、转换盒加载(ETL)能力。适配多种数据源,支持从文件、DB、数据流中导入数据。 ●灵活的数据转换配置和任务配置,提供给了直观的图形界面设计器,大大缩短了数据抽取的开发周期,并且容易维护。设计界面友好,提供了工作流设计模式,满足各种场景的实现。 ●服务以集群方式部署,支持多任务并发,自动负载均衡,支持大数据量的抽取转换处理,执行效率高,提供了丰富的异常处理功能,能满足各种异常处理需求。 统一的分布式存储 ●以HBase作为数据存储的统一格式,MapReduce、Hive通过接口使用HBase数据。 ●做到一份存储,多处使用。 配置式的服务配置工具 ●通过配置完成计算任务的配置,降低平台实施和使用的技术门槛。 ●通过统一的配置模板实现对数据计算的定义、脚本实现并通过定义规则驱动数据计算。 可视化的自助分析工具 ●自定义报表工具,实现了基于XML的定义文件来可编程性地生成报表的能力。 ●围绕着报表引擎,开发用户图形界面,用户可以使用向导,无需编程,通过工具配置一步接一步完成创建一个报表。 ●数据展示格式灵活,能更大程度上满足用户的数据需求。 ●多维分析工具,提供丰富的图形化展现界面和接口。 ●用java语言开发支持MDX(多维表达式)的查询语言、分析型XML和olap4j的接口技术规范,实现了从SQL和其他数据源读取数据,在内存缓冲区中生成集合数据。 模组化的平台架构 ●平台采用分布式架构,弹性管控集群资源。 ●平台各功能组件之间通过数据进行交互,实现松耦合。平台各子系统既是一个独立的功能模块,又能通过数据的交互构成一个整体。 责编:李玉琴 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:kaiyun体育官方人口
文章著作权分属kaiyun体育官方人口
、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
最新专题 专家专栏 |
|