高手自述:运维工程师的13种技能
以我的个人经验而言,要想做好运维工程师,你至少要能做以下的工作:
1,网络工程师的工作 你至少要能配置CISCO 6509以下的设备,熟悉各种网络协议,否则网络出问题的时候你会傻掉。 2,系统工程师的工作 你至少要理解各种系统服务,在出问题的情况下要迅速解决问题,而不是等系统工程师来解决。 3,安全工程师的工作 我不要求你一定要会各种网络编程,但是在服务器收攻击的情况下,没有防火墙的情况下,做一些简单的处理工作。 4,存储工程师的工作 至少要熟悉各个厂商的设备,各种备份和还原的办法 5,测试工程师的工作 在新版本上线之前,你至少要协同测试工程师做测试工作,因为你是运维人员,不了解程序架构导致无法解决故障,你也有一份责任。 6,研发人员的工作 运维工具都需要自已开发,熟悉开发语言,需要有过实际开发经验,否则工作会非常痛苦,我深有体会。 7,英语 不想说了,我的最大痛苦就在这里 8,好的沟通者 不出问题时候你可以打游戏睡觉,出问题的时候要能和项目人员沟通,快速解决问题,而不是推;我知道有很多人能推责任,你可以做替死鬼,但是离开这个工作你还能找到更好的;把责任推到别人身上的人,下次出问题的时候,绝对没人帮你。你要能和各个兄弟部门关系非常的密切,出了问题有兄弟帮你担责任;也要能非常扯皮,没事在会议上把别人都搞定。 9,库房管理员 数万台服务器让你来管理,任何丢失或者损坏都是不负责任和失职的表现。 10,运动员 不要回家就睡觉,有空还是运动下吧;在服务器down机的时候,机房恰巧就你一个人,机柜没有空间,你需要更换一台HP 585 4U的服务器,满配约80公斤的服务器,你怎么做? 11,责任心 这个我不想说什么,这是你的职业精神。 12,组织者 给你2个啥都不会的民工,再给你2000台服务器,要求你2天把服务器装完,你咋办? 13,1-7条中,你必须有一条非常精通,是这个行业的专家。否则过了32岁,没有公司要你。 大家看了肯定觉得这个人是神仙,但是这必须是你慢慢能做到的,至少是我6年来运维经验的一点总结。 因为现在的公司都在用招聘民工的钱招聘神仙,其次我也是想让各位看看,运维工程师要担负多少责任。 我去面试过的一些公司都说,你什么都会,什么都不精。我说对,正是需要我们这些什么都会的人领导什么都精的人。 我这句话没有贬低大牛的任何意思,只是当时一个临场的发挥。虽然说完就知道这个面试白来了,但是我还是想为广大的运维工程师出口气。 不怕千招会,就怕一招精。这仍旧是我给大家的建议。 最后给大家最后最大最重要的建议,做什么工作都可以,千万别做SA。 我把SA的定义成:speediness answer而不是system admin。为什么?你可以想象一下哪些工作需要快速响应。网络工程师需要,机房网络骨干交换机故障,整个机房所有服务器无法连接,需要快速响应不?系统工程师需要,系统出问题了,要快速响应不?安全工程师需要,服务器被攻击了,要快速响应不?存储工程师需要,公司核心存储有问题了,要快速响应不? 你可以做研发,出了问题可以测试,可以想办法慢慢解决;你可以做DBA,出了问题可以推到网络工程师或者系统工程师身上,说不是DB连接问题;你可以做测试工程师,你说有问题这个东西就可以不上线……在出问题的时候,倒霉的就是SA,所以不要再争论SA包含哪些工作,SA就是一个倒霉的快速响应者,你想,哪个SA 24小时不开手机?哪个SA 晚上可以舒服的睡觉或者安心的出去度假?走在路上一听到和自己手机短信铃声一样的,利马下意识的抓出自己的手机看看是不是服务器报警;晚上和老婆 XXOO00,一个电话过来,立马停下,抓出手机看流量图;包里放着笔记本,但是因为还要开机,太慢,拿着手机上putty ping或者telnet机器…… 这就是大家羡慕的SA ,你也不要抱怨自己做了SA,生活就是这样。所以不要再争论哪些xxx员应该归属于SA,系统管理员或是运维工程师,如果想做这行,就安生的当一个“快速响应者”,这是你的职业,也是你需要做到的。作为一个SA,你肯定经历过通宵好几天加班做事,你肯定经历过饭买来已经忘记了吃,你肯定经历过几天加班没睡觉,着个沙发坐下就失去知觉睡倒……没有经历过不能说你不好,只能说你管理的机器太少。 我公司是每月发21天工资,某两月我一月发了44天工资一月发了47天工资,创全公司建司7年来加班记录……项目做完自然也就落了个部门通告表扬,然后的结果就是健康情况急剧下滑,然后就是某天晚上在机房内加班一通宵,穿着短裤进机房,然后一个通宵被机柜下面的冷风吹了个关节炎……这就是做SA的代价。本文来自互联网,仅供参考- 1云计算改变传统IT灾难恢复模式
- 2企业设备信息化管理软件的实用性
- 3数据中心机房建设如何提升投入产出比?
- 4数据中心资源管理十大功能详解
- 5改变网络安全现状的八大趋势
- 6服务器管理经验:IIS故障问题分析及解决方案
- 7如何用IT网络安全管理解决网络访问故障
- 8十大IT运维管理经验解析
- 9计算机设备管理系统维护系统体系结构详解
- 10企业设备管理痛点及解决方案
- 11数据中心事件管理流程详解(图)
- 12设备管理系统维护经验:如何设置保护被破坏的Wi-Fi
- 13系统管理的“洗手间哲学”
- 14网络安全管理:网络安全领域预测
- 15设备管理系统维护经验:如何预防黑客攻击WEB
- 16虚拟化数据中心的智能基础设施管理方式
- 17巧用标识提升企业IT设施管理效率
- 18企业设备管理系统如何应对员工“微博控”
- 19企业设备管理软件的使用效果
- 20融合型网络终究是未来的方向
- 21数据中心管理框架应包含的七个管理领域
- 22IT运维人员如何应对虚拟化安全?
- 23设备管理系统经验之谈:如何选择自动补丁管理策略
- 24好用的设备管理系统是怎样的?
- 25IT运维管理人员必须掌握的IT能源管理技术
- 26数据中心运维管理框架4Ps剖析
- 27数据中心设备管理系统之采购分布式设备管理系统系统五项注意
- 28保证大数据安全的九个技巧
- 29企业怎么科学化管理设备?
- 30如何解决路由器ARP原因引起的网络故障