大数据工具开发缓慢

来源: kaiyun体育官方人口作者:赵龙 译
2013/2/27 9:36:15
kaiyun体育官方人口 :了解大数据的人知道,数据科学家很稀有,找到便于使用的数据科学工具显然是个挑战。

分享到: 新浪微博 腾讯微博

kaiyun体育官方人口 报道,了解大数据的人知道,数据科学家很稀有,找到便于使用的数据科学工具显然是个挑战。

总部位于西雅图的Context Relevant公司的CEO和联合创始人Stephen Purpura说,今时今日的数据科学家所使用的开发工具仍是“中世纪”的,这是新兴公司希望解决的问题。

Context Relevant提供内部部署的对于Splunk的大数据搜索和监控,包括点击预测与分析的数据托管分析软件,它的应用可以运行在Hadoop和其他的MapReduce引擎之上。

Context Relevant是个年轻的团队,但其管理团队有丰富的大数据管理经验。例如,该公司的工程副总裁Jim Walsh主持开发的宇宙分布式数据存储和分析环境,是包括Bing在内的微软众多服务的基础。

“我们专注于预测分析应用程序,因为我们的团队主要由机器学习专家组成”。Purpura说,“这是我们可以增进的价值”。

当然,Context Relevant并非预测分析软件的唯一供应商,而且新兴公司需要面对强大的竞争对手,如Opera、Palantir,以及像IBMSAP这样的科技巨头。

我们具有1000个节点大的Hadoop集群可以运行在任何一台笔记本电脑,Purpura说。

Context Relevant如何在这样一个红海形成自己的差异化竞争力?

“我们的机器学习应用采取横向自主配置数据”。 Purpura说,“而不像我们的竞争对手那样采用‘垂直’的应用”。

客户可以使用Context Relevant的源代码快速构建大数据应用。

库上运行的Hadoop的源代码非常精巧,通常是一个Python代码,很便于理解。Purpura说。

对于单一客户,Context Relevant预测分析技术为基础的应用,能够使开发时间从几个月缩短为几天,Purpura声称。

“即便那些数据科学的外行也能轻松地找到对他们有价值的数据,他们可以凭一点仅有的数据认知,产生类似风格但却更适合他们需求的新应用”。

欺诈检测是Context Relevant看好的另一个领域。

“一旦你有能力扫描大量的数据,你就有了足够的基础去做关于人们选择倾向的研究。”

“发现人们的异常行为事实上很容易,”他说。“我们的系统几乎可以实时做到这一点,这样的速度远超市场上现有系统。”

Context Relevant在分析领域经验尚浅,但他已经给客户带来回报。Purpura说。Context Relevant迄今为止最知名的客户是Concur,一家旅行和费用管理提供商,它使用Context Relevant的相关产品帮助人们检查发现异常支出和减少开支。

Purpura说更多大型企业用户尚未同意公布其名单,但他补充,:“即将签订更多客户。”

“客户花一大笔钱购买一个创业11个月的公司的产品是很罕见的”。他补充,“现在的市场需求很紧迫。”

责编:赵龙
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
最新专题
流动存储 为大数据而生

伴随信息技术的突飞猛进,更大量级的非结构化数据与结构化数据构成的大数据成为企业级存储所面临的最大挑战:一方..

磁盘阵列及虚拟化存储

利用数组方式来作磁盘组,配合数据分散排列的设计,提升数据的安全性。虚拟化存储,对存储硬件资源进行抽象化表现。

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map