刘振飞:做云计算比保障双十一要难得多

来源: CSDN作者:刘江
2014/12/16 14:51:45
阿里云基础设施的刘振飞一度非常困惑:淘宝、天猫、支付宝这么大的网站,我们可以把它的稳定性搞得很好,双十一这么大的活动,我们也能hold得住。为什么同一个平台,同一班人马,支撑云计算平台上面那些小得多的客户却不那么轻松呢?

分享到: 新浪微博 腾讯微博
本文关键字: 刘振飞 云计算 阿里云

与此同时,在阿里巴巴整个集团的愿景中,云计算已经被提升到非常关键的战略地位。

一方面,阿里通过令人眼花缭乱的收购,已经进入零售、金融、物流、文化、娱乐、健康、无线甚至包括足球等诸多领域,这些新业务都将由阿里云支撑。

另一方面,阿里云要面向全社会,面向整个实体经济,打造商业基础设施。包括政府机构、交通物流、金融体系、农牧水利、建筑工程、医药卫生等国计民生的系统都将有望运行在阿里云的平台上。这意味着阿里技术保障要完成转型,从单纯保障阿里业务,成长为技术驱动的商业基础设施服务商。

刘振飞他们将要面临的业务多样性将超出过去的想象。与之俱来的是更重的责任,是对技术实力和管理运营服务水平的更高要求。以前淘宝和天猫出问题,甚至双十一有问题,不过是用户买不了东西抱怨一下的事情,而未来,云计算将承担类似电网和电信运营商的社会责任,在台风、暴雪、地震等场景下如果掉链子,可能影响到许多人的生活甚至生命了。“其实这是让我非常恐惧的一件事情。云计算将要承载的东西意义太大了。”

在这样的大背景下,刘振飞在思考技术保障部的未来该怎么走。“我们这个部门,整个团队思想意识要快速扭转。以前我们自己开玩笑叫活在当下,说直白点,就只干一件事儿:维稳,一直在维稳,保证别出事儿。后来再加上一个双十一,就这两件事。而面临云计算、面临大数据的时候,我们需要大的组织性变革。简单说,就是‘疯狂搞人’、‘疯狂搞技术’。”

所谓“疯狂搞人”,就是大规模招聘高端人才。阿里技术保障部原有的人力大多在传统的网站稳定性上,而如何做好服务商,服务运营、业务运营、系统研发和运营能力还比较弱,赶不上公司发展的要求。

刘振飞列了一个巨大的招聘计划,其中满眼都是高级专家以上的岗位。他补充说,这些岗位除了锁定国内的顶尖人才,还需要引入海外人才。目前阿里技术保障已经在硅谷成立研发团队,加强计算、存储、网络等基础技术的研发实力,人才吸引的重点也放在了美国几大互联网巨头身上。

而技术保障部下一步需要哪些能力呢?

“首先,我们需要很强的运营能力。”刘振飞拿出事先精心准备的演讲稿,为我展示出一幅宏伟的发展蓝图。运营能力包括三点。

第一是从传统运维到商业市场的考虑。比如每年花这么多预算对不对,整个运营体系怎么优化,从云计算到采购、谈判、供应链,然后下单、装机器,然后上架,这个链条会对云计算的成本和弹性最终对平台竞争力产生巨大影响。这本身就是需要算法和系统来优化的。

第二是数据驱动。所有事情都要用大数据来驱动、来指导我们的方向。比如服务器的数量,多少是合理的,服务器的负荷每天有波峰波谷,怎么优化,其实有很大空间。

第三是需要很强的技术能力,从数据中心的风火水电(空调、电力和制冷等)开始做起,到网络,到服务器,到操作系统,到数据库,一直到中间件,云计算的架构,所有的东西都要加强,要大胆创新,走到底层,走到业界前沿去。这就是所谓“疯狂搞技术”。

为了尽快完成转型,阿里技术保障今年也进行了组织架构重组,新增了系统研发、性能与容量、平台与工具等部门,加强了技术规划、研发和运营方面的投入,而原来的重点职能(维稳和双十一)只占50%左右。

新增的职能不少是由部门中资深的技术专家承担,首先给他们减负,从日常业务中抽离出来,既不用管维稳,也不用直接负责双十一保障,让他们专心思考。有的负责前沿技术,有的承担创新任务,有的要将规范、流程、方法工具沉淀下来。

刘振飞也强调,阿里整个集团并不是只有技术保障部在做平台性的、系统技术的工作,包括阿里云本身、支付宝和淘系公司都有很多同事在一起努力,大家共同构成了对外的阿里平台。比如数据库层面,他们的计划是逐步用自研数据库OceanBase替代商业解决方案,而OceanBase的核心团队就属于支付宝。本次双十一OceanBase承担了10%的流量,顺利通过大考,下一步的计划就是进一步扩大应用范围,最终OceanBase会通过阿里云向社会提供产品化的服务。

在阿里技术保障部的办公区,我看到几个易拉宝,展示了他们的一些创新工作,从定制自研的AliRack整机柜服务器到生态环保数据中心。我知道,这些仅仅是一个开始。

共2页: [1]2 下一页
责编:李玉琴
vsharing 微信扫一扫实时了解行业动态
portalart 微信扫一扫分享本文给好友
著作权声明:kaiyun体育官方人口 文章著作权分属kaiyun体育官方人口 、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
IT系统一体化时代来了

2009年Oracle 用Exadata服务器告诉企业,数据中心的IT服务一体化解决方案才是大势所趋,而当前企业对大数据处理的..

高性能计算——企业未来发展的必备..

“天河二号”问鼎最新全球超级计算机500强,更新的Linpack值让世界认识到了“中国速度”。但超算不能只停留于追求..

    畅享
    首页
    返回
    顶部
    ×
    畅享IT
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918
    Baidu
    map