|
KXEN挖掘疾控紧急事件背景:自SARS以后,政府十分重视紧急突发事件的控制。最近,KXEN成功中标某地市疾控紧急突发事件数据挖掘产品的采购项目。此项目既有传统的处于领导者的数据挖掘产品,也有国内新兴的产品,最终,客户选择了KXEN自动化数据挖掘,吸引客户的,主要是KXEN的自动化建模流程和处理超高维数据的能力。 以下选自客户经过工具的评估之后,选用KXEN的结论书。 “对于流行病、传染病或者是慢性病,往往因为其未知性而难以对其进行很好的控制,疾控部门需要依据数据仓库中汇集的大量各个方面的数据,发现疾病的发病原因,洞察流行趋势及发病群体,以更好的决策,对疾病进行控制。基于此,KXEN的数据挖掘的优势在于: 1.建模种类齐全:支持分类、回归、聚类、关联规则、时间序列等模型,能够预测流行病的高危病发人群,通过居民、地理、环境、流行病等信息的综合,对所有居民患病概率进行预测,识别高危高发人群,识别流行病重要影响因素,能够有针对有目标对流行病的高危高发人群进行病发之前的预防。 能够预测流行病相关联因素,挖掘与流行病相关联因素,洞察流行病成因。能够依据设定监督目标对流行病发群体进行群体细分,对病发人群的不同诱因及人群特征进行全面剖析。能够对疾病在未来一定时期内的传播、发展情况进行预测和动态展示,建立流行病发展的时间序列模型,对疾病的发生及发展趋势进行深刻的预见及洞察分析,剖析疾病发展的周期季节性及波动性,对流行病未来发展进行预测,据此更好的对应急处置过程以及预防控制过程中的人、财、物等资源消耗进行调度、协调、监控。 2.快速高效建模:流行突发病具有未知因素多,发展迅速快的特点,KXEN的模型有很强时效性,KXEN能够在短时间内得到预测性能高的模型(经评估,KXEN的建模时间<3天,传统工具约为1周);同时,随疾病发展,模型需要动态更新,KXEN摆脱了传统的建模方法,实现了低成本、低人力消耗、快速的建模;在评估中,KXEN显示了最高的模型产量,能够短时间内提供多角度多方面的模型,保证结论的正确性。KXEN有高度的智能性,提供了自动化建模流程。能够自动选取最优性能模型(对于传统工具,只能提供默认的参数设置,并且这个参数设置是不会自动变化的,没有智能性),并且KXEN所提供的算法应该具有行业针对性,能够兼顾医疗行业数据维度高,相关性强等特点。 3.功能全面,简单易用的预处理过程。数据挖掘高性能模型建立,数据的预处理至关重要,KXEN提供全面的数据预处理功能,能够进行数据类型的转换,能够对数据进行装箱操作,能够针对数据的缺失,对奇异值进行恰当处理,能够在建模之前进行数据的统计,能够兼顾医疗行业数据的特点,容纳多种分布特征(正态,非正态,指数分布,对数分布)的数据,容纳不均衡数据建模,容纳高度相关维度的数据建模。同时,能够提供相应自动化预处理机制,简化数据预处理过程,缩短建模时间。(传统工具的预处理没有自动化,这占用整个建模过程70%的时间,并且预处理需要有良好基础的数据挖掘专家,如果运用不当,大大影响模型的性能;KXEN的自动化预处理模块解决了时间和技术的问题) 4.功能先进,针对行业特点的建模算法设计。预测性能高的模型,算法的应用至关重要,KXEN的算法必须性能好、速度快、对硬件配置要求低,同时,得到的模型的要求具有良好的可解释性,结果能够让行业人员理解,能够存储于数据库,格式可以简单识别。 5.广泛使用群体:高性能的模型,必须有行业专家和业务人员的支持,同时,流行病的数据挖掘会涉及多角度,多领域的数据,评估显示,KXEN最易让业务人员接受,除专业的数据分析师之外,业务人员和决策支持人员也能够独立使用,建立良好预测性能的模型。这样,模型能够更好的利用行业专家的知识,模型的结果才更具可信性,数据挖掘结果能够直接用于决策。(传统工具的使用者必须有数据统计基础,并且有2-5年的数据挖掘经验) 6.高维数据建模:疾控数据仓库有来源于居民个人信息、健康信息、流行病信息、环境检测信息库、病媒信息库等多方面的数据,传统数据挖掘算法往往存在对高维数据的支持不够,必须做人为的变量选择,这往往丢失一些重要的信息。KXEN能够支持高维数据直接建模,自动确定各个维度的重要性,在评估中,KXEN的模型能够容纳多至5000维的变量,不需做事先特征选择。 7.易于集成,与数据仓库,决策系统有良好的整合能力。KXEN能够充分利用数据仓库性能,不需单独存储,以降低成本,提高性能,保证数据的安全性;能够提供多种模型输出形式(JAVA、C、PMML、XML、HTML等),支持不同的集成开发模式,实现集成成本最优化。” 此次中标代表着KXEN在国内数据挖掘市场有了更广泛领域的应用, KXEN的高度开放性,自动化数据挖掘的理念正越来越被广大客户所接受。
责编: 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:kaiyun体育官方人口
文章著作权分属kaiyun体育官方人口
、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
热门博文 |
|