怎样提高企业应急恢复能力
聪明的IT领导者不仅会制定应对灾难的企业恢复计划,而且还会定期对这些计划进行升级,并对其测试保证可靠性。
去年12月一个星期天早上6点,Buncefield油库发生了爆炸,该事故的受害者不只是当地的居民,几百家公司受到了这起事故的影响,建筑的门窗被震碎、道路被堵塞、员工没办法 到公司上班。互联网零售商ASOS属于受害最严重的公司之一,它的主要仓库与Buncefield处于同一位置。
ASOS基础设施部经理Paul Cottingham说:“当爆炸发生时,大楼的所有窗户都被震碎了,房顶被掀起,库房的自动喷水灭火系统被彻底地破坏了。值得庆幸的是,当时我们只有一个人在大楼里面,如果再 过一会儿的话,可能里面就会有三四十人。”
尽管ASOS也有灾难恢复计划,但是公司里没有人事先会预想到这种事故的发生。Cottingham说,我们的应急计划在这样的事故面前失灵了,员工和办公地失去了联系,他们也没办 法查收电子邮件。
现在,越来越多的公司要求IT管理者帮助公司应对紧急事故的发生,并从灾难中恢复原气,而这些紧急事故往往与服务器和通讯系统没有关系。
Rebecca Ellis是西门子通讯公司的顾问,她认为,公司已经不再局限于灾难应急计划,而是从更长远的角度出发,保证业务连续性。
技术的发展已经到了一个关键的环节,它不仅能够帮助企业迅速地恢复服务能力,而且还能够在突如其来的灾难面前提供不间断的关键性服务。
Gartner研究副总裁Simon Mingay说:“大约有75%的英国公司拥有某些帮助企业正常运转的计划,但是在这些计划中真正能够发挥作用的却寥寥无几。其中的问题在于,大多数人都没有制定一个广泛的应急 计划,有些应急计划范围虽然广泛,但是已经过时了。”
要制定一个有效的公司可持续运营计划,第一步是应该了解公司提供的哪些服务在突发事件中也必须提供给客户。比如,客户订货系统就应该在突发事件发生后数小时内恢复运行 ,而假日预订系统可以在稍后进行恢复。
Ellis还说,IT部门经理应该与其他公司的管理者们进行合作,收集一些重要的信息,这是了解公司业务优先次序的重要步骤。
城市保险公司Close Premium的IT经理Jonathan Cattle说,他们公司制定了一项计划,将最重要的功能在1个小时之内恢复,而其它功能分别在12小时、24小时和72小时内恢复正常。这是一个在实践经验面前不断积累才制定的计 划,在这以前我们在办公楼历经了多次伦敦IRA爆炸。
一旦你拟定好了一份带有先后次序的服务列表,下一步就要考虑应该使用什么技术在突发事件中来提供这些服务。
技术手段的使用能够极大的提高企业运营恢复能力,从数据监视到非办公地点的服务支持,保证公司总是能够得到关键性手段、程序和软件的安全拷贝。
Double-Take软件公司英国销售和市场营销部经理Ian Masters说,大多数服务可以被归为三个类别,它们是高有效性、灾难恢复和远程恢复。有些产品的功能不仅具有某一类的恢复能力,所以花时间去比较多种产品和服务是值得的, 从而计算它们各自的性价比组合,选出最优的一个。
有的公司还使用地理信息系统(GIS)和其它模式技术来为突发事件做准备,使IT和商业部门的领导者能够对灾难性事件进行模拟,从而预测最有可能获得成功的恢复战略。比如: Bristol City Council最近进行了一项时间长达36小时的灾难演习,其中演练了应急服务手段的运用,并锻炼了其它一些关键部门的员工。
委员会负责突发事件应急方案制定的官员Kevin Hattersley说:“GIS软件可以为工作组指出本地居民最容易受到灾害影响的居住区域。这意味着我们能够看到老房子所在的位置,并知道哪里是最需要社会服务的地方。当突发事 件发生时,我们知道哪些人最容易受到影响、哪些人最需要额外的帮助。”
与技术手段一样,其它一些问题也应该在考虑之列。比如:在灾难发生时,你需要使用哪些设备、调配哪些人员,或者与人力资源部门联系保证员工在不能进入办公地点时知道应 该去什么地方。
你如果已经制定好了一份计划,那么下面的重要步骤是要验证它的有效性。
Accenture公司的欧洲商务持续运营计划的领导者Martin Byrne认为,很多公司都有一个安全的假象,因为他们所推崇的突发事件应急方案往往束之高阁。如果不对制定的应急预案进行测试,那么怎么才能知道员工已经明白在突发事件面 前应该如何去做?怎么才能知道备份的录音带是否能有效地工作?怎么才能知道远程软件能不能在灾难来临时与新的薪酬系统协同工作?
不能只是因为应急计划一次成功就认为它每一次都是适用的。Gartner的Mingay说,很多公司的突发事件应急计划还是为了千禧年的来临而制定的。现在的问题是,整个环境,包括 企业的合作伙伴、客户、员工和政府,相比那时发生了很大的变化。
案例分析:Enterprise Home Loans
金融服务市场竞争非常激烈,提供金融服务业务的公司停业一天就意味着会失去大量的潜在客户。对于Enterprise Home Loans这样一个小型抵押供应商来说,运营的连续性对其生存的意义至关重要。
公司的IT经理Matthew Cramer说:“我们需要知道,当某些突发事件发生时,我们能否很快地恢复运行,而且不至于丢失大量的数据资料。我们不可能花一天的时间来恢复信息,这样的时间成本对我们 来说太昂贵了。”
为此,Enterprise Home Loans使用了Imperidata公司提供了一项在线信息备份服务,这项服务可以帮助公司在每十五分钟就备份一次公司的所有数据。
尽管这项服务相比其它服务来说比较昂贵,但是Cramer还是选择了它,因为Imperidata的这项服务可靠性能好,而且管理起来很方便。
Cramer说:“这项服务能够直接从SQL数据进行备份,这对我们来说是非常理想的,因为我们正是在SQL Sever上运行客户化软件的。在此之前,我们依靠每天工作结束后对一天的工作用磁带进行备份。”
我们有一个快速的网络连接,这对于充分利用这项服务很有帮助,Cramer说。
这项服用的另外一个好处是,它是基于网络的。Enterprise Home Loans能够在全世界的任何一个地方对公司数据进行备份和存储。
Cramer说:“不管因为何种原因,只要我们不能进入公司的办公地点,我们就可以使用Imperidata公司提供的这项服务在其它任何地方进行数据备份,使我们的工作能够正常地运 转,直到我们能够再次进入公司服务器。”尽管相比同类服务来说Imperidata公司提供的服务有点昂贵,但它仍然是我们的首选,Cramer说。
为什么需要企业持续运营的应急计划
病毒存在
2003年一个星期六的早上,Slammer计算机病毒开始对计算机进行入侵,在短短10分钟内全世界所有易受攻击的计算机中有90%已经遭到病毒的入侵,企业的损失额达到10亿美元。
网络钓鱼
用户收到来自某个组织的电子邮件,并邀请他们访问组织网站、输入个人信息资料。这些数据能够被用来进入用户的个人帐户。网络钓鱼攻击正在蔓延,它的目标主要是英国银行 、税务局和其它金融机构。
应用软件安全漏洞
在新的安全威胁来临之时,如果你的计算机系统还没有升级,那么黑客能够在外部进入你的系统。如果黑客在你的服务器中找到了一个易于攻击的点,即使是世界上最好的安全系 统也无济于事。
硬盘资料窃取
保护秘密数据和系统是虚拟安全和实体安全并重。比如:美国银行最近遭到了攻击,计算机中的敏感数据被窃取,网络盗贼进入数据库并窃走了用户的身份信息。
系统升级
有25%的系统在升级时会导致新旧应用程序的冲突。这种情况发生时,两个系统都将停止工作,直到系统冲突被解决为止。
自然和人为灾难
洪水、火灾、恐怖袭击和地震灾害虽然发生的频率不高,但是一旦不幸发生,你能保证完全恢复丢失的计算机系统数据吗?
(zdnet)
- 1易经与售前顾问之道
- 2网络推广陷误区 中小企业年死亡140万
- 3协同办公OA系统的投资估算及风险评估
- 4通用汽车的生存本能
- 5萨班斯法案-企业生存的紧箍咒
- 6网络系统集成工程师应具备哪些技能?
- 7SOA不是选择中间件的重要考虑因素
- 8中小企业到底需要什么样的安全解决方案
- 9企业战略对应模型让CIO学会两条腿走路
- 10如何在企业内部进行权限的配发和管理?
- 11CIO怎样缩小目标与结果之间的差距
- 12建设覆盖全集团的统一协同OA软件管理平台,以信息化方式提高集团
- 13从流程优化到专业化企业
- 14企业ERP软件的三种模式
- 15营销方式决定IT建设思路
- 16企业内网安全管理实例
- 17如何把BI融入业务流程
- 18我们介绍一下现阶段晶澳太阳能的信息化建设情况
- 19企业电子用户的工作环境
- 20IT外包文化是最大障碍
- 21戳到软肋,还得偷着乐
- 22企业怎么选监控软件
- 23未来网络电子商务收益在哪?
- 24中小企业常见的信息安全威胁
- 25网络财务能够给企业用户带来什么
- 26市面上主流数据仓库解决方案比较
- 27企业网站如何“安家”最合适
- 28CIO用质量管理风险
- 29信息权力的透明隧道
- 30如何解决中小企业信息化满意度低