|
数据挖掘师角逐大奖 Brierley先生仅利用一台有最新处理器和大容量内存的现成电脑,用名为R的开源软件和他自己的软件工具,已经开发了十年以上的数据挖掘。 本文关键字: 数据挖掘 足智多谋的数据挖掘师很认真地为300万美元大奖竞标。 澳大利亚的三个团队进入一场竞赛,去为努力帮助医生积极治疗病人并节省数千万的美元而去获得加利福尼亚医疗保健机构提供的近323万美元的奖金。 他们是400多支传统健康奖争夺者队伍中的三支,该奖项是列于墨尔本Kaggle网站上的一项数据挖掘创新方面的竞赛,它使用互联网信息源聚集的现象来解决问题。 美国国宇航局(NASA)、福特、Deloitte、斯坦福大学、莫纳什大学和墨尔本大学在Kaggle数据分析市场举行了以前的竞赛,提倡算法在真实环境下的数据集中测试以提高业务规划。 现在,来自几十个国家好奇的数据分析师正分析三年以来洛杉矶地区的医疗记录以找出如何预测哪些患者会在第四年住院的方法。根据预测算法的准确性,参赛者将在2013年2月比赛结束时赢得规模高达300万美元的奖金。 “赢家至少保证有美元的奖金,” 墨尔本数据挖掘师Phil Brierley说,Brierley用Tiberius v Sali Mali这个结合了他自己的数据挖掘软件的名称Tiberius和威尔士儿童书里的人物合起来的用户名,参加了对大奖的角逐。 “两年后,我希望仍在认真参与的每个人能朝同样的得分上汇聚,” Brierley先生预测说。“最终,你将会弄清每个人都在做什么。” 做为辅助,会有不断升级的奖金每六个月奖给领先的选手。两个八月得分最高的队伍将分别获得30000美元和20000美元的奖励,但他们必须对其他参赛者显示他们的方法。 Brierley先生正在思考如果在下一个名列第一或第二名时,他该做什么。他已经在博客和Kaggle健康奖论坛上分享了一些技术,但不能确定他是否还会分享他现在的方法。 上周,Brierley先生与另两位澳大利亚的队伍,Planet Melbourne 和 Tom & Jerry, 一起进入了前十位。 Brierley先生仅利用一台有最新处理器和大容量内存的现成电脑,用名为R的开源软件和他自己的软件工具,已经开发了十年以上的数据挖掘。 有英国教育背景的工程师Brierley,是在IBM公司工作的数据挖掘顾问和为澳大利亚四大银行做过多年的信用卡风险分析。 但他为追逐大奖的探索不仅仅是一种爱好。上个星期,他对比赛做了67次提交,并有几次的排名第一。 Kaggle的创始人Anthony Goldbloom认为最好的数据分析师应该得到更好的回报。 “顶级的对冲基金经理赚1亿美元一年,” Goldbloom先生说。“我们希望在未来,最好的预测建模师能赚2500万美元到3000万美元一年,Kaggle就是他们赢钱的市场。” 300万美元的Kaggle健康奖目前由佛罗里达州的男子David Vogel领先。
责编:亢晋芳 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 著作权声明:kaiyun体育官方人口
文章著作权分属kaiyun体育官方人口
、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。 |
热门博文 |
|