|
[原创]IT运维中的“规则”与“经验”一次旅行外出登机找座位的经历使我至今记忆犹新。那天,登机牌座位号是9E,登机后我走到客舱的第9排,“A、B、C、D、E”我从左边数过来第五个坐位很自然地就坐下了。这时,一个老外冲我走了过来,“对不起,你坐了我的座位。”我明白他讲的英语。我一愣,“你确信吗?”我掏出我的登机牌,“我的是9E,你的呢?”我在他面前晃了晃,心想“老外肯定没看清座位号码。”“我的是9F”老外很认真地说。“那应该是在旁边呀”,我指指右手边的座位。“No,no ,no”,老外的脑袋摇地像波浪鼓似的。看到发生争执,坐在9C的另一个老外站起来, “我的坐位是C,这个座位应该是E。” 显然是支持我的,我更得意了。讲英语的老外指了指头顶的座位标识牌,“C、E、F”。我一看,傻了,人家是对的。原来我们所在的是前舱靠近机头位置,比较窄,座位少了一个,所以坐位编号从C就直接跳到了E,没有中间的D。原来是我弄错了,连忙道歉“Sorry”。显然,我是凭经验在找作为,而老外是老老实实在看头顶位置的座位标识牌。结果带有一丝“经验主义”的我却找错了座位。 这次经历使我不由地联想到规则和经验的问题,现实工作中,我们或多或少会遇到此类问题。在IT运维中,也存在类似的现象,“规则”和“经验”仿佛一对孪生兄弟,共同影响着运维工作。我们很难说运维中是规则重要还是经验重要,因为它们总是在不同的方面影响IT运维的整体效果。 “规则”是IT运维之基础,日常的运维工作如果离开规则的约束,运行效果将会被运维人员个人的工作能力所左右,很难控制。正因为如此,目前各级运维部门都针对自身工作特点制定了一系列的运维规则,如机房管理规定、值班制度、巡检制度、问题处理规程等等。正是这些制度的实行使IT运维效果有了基本保障。 相对于规则,“经验”可以说是IT运维中解决突发问题,发现系统存在隐患的“利器”。特别是在IT突发事件中,更能体现运维经验的重要性。而且,通过运维人员自身的经验积累,查找隐藏在系统深处的潜在隐患,可以使IT系统更加稳定、健壮,并减少故障发生的频率。 其实,在IT运维实际工作中,“规则”与“经验”都是不可缺少的,它们一个是“正规军”、一个是“特种兵”。“规则”是“正规军”,是用来打常规战争,解决运维中的一般问题的。比如我们的值班制度、机房管理制度、应急预案等等都属于规则的范畴。遇到问题的时候,我们查找这些规则就很容易找到解决问题的办法,使信息系统稳定运行。“经验”是“特种兵”,是用来执行特殊任务的,它是我们在日常运维工作中形成的各种知识的积累。一般来说,这种经验对于每位工程师都是不同的,而且没有固化成文字记录。运维中,我们需要灵活运用这两种手段来保障系统运行。 笔者总结以往自身的IT运维经验,认为以下做法可以达到比较好的运维效果: 一、建立运维规则,强化制度管理 据统计,IT运维中90%以上的工作都属于日常管理工作。应对这些工作的最好办法也就是设立有效的规章制度。尽可能地把日常的所有工作都纳入制度中,以制度去约束日常地运维行为。 二、培养运维人员的经验,应对突发事件 由于IT系统的日益复杂,运维中除了日常管理工作外,运维人员将不可避免地扮演“救火队员”的角色,处理系统的突发故障。此时工程师的运维经验就显得十分重要。因此,工作中除了要应对日常事件外,还需要工程师尽可能地拓宽技术视野,进行技术储备,达到增加运维经验的目的。 三、不断将经验转化为规则 由于“经验”更多地是建立在运维人员个人工作经历上的,并且鲜有文字的记录,因此,系统的稳定运行不可避免的对某些关键运维人员产生了强烈的依赖。如果一旦此人离开工作岗位,后果将不堪设想。最好的办法是把这些经验进行总结,逐渐归纳成文字保存,并在适当的时候加入到规则中,这样后人在学习规则的时候也就间接具有了这种经验。 对于IT运维而言,“规则”与“经验”均具有十分重要的意义。“规则”是我们系统得以“长治久安”的基础,而“经验”可以在应对突发事件中起到“奇兵”之效果。如果在实践中,我们能够不断将一些有益的“经验”融入到制度中,逐步转化为“规则”,那么就能更好地达到不断完善规则、强化管理的目的。 责编:张赛静 微信扫一扫实时了解行业动态 微信扫一扫分享本文给好友 |
最新专题 |
|