黑马科技
数码产品

为灾难恢复制定有价值方案的七项技巧

时间:2019-10-06

在经济紧缩时期,在你的公司,你如何制定投资于灾难恢复的案例?我们采访了灾难恢复服务的领导厂商,并请他们对需要证明灾难恢复方案价值的客户的提一些建议。以下是一些他们该做的和不该做的注意事项。

销售

1.通过做风险评估或业务影响分析销售灾难恢复方案。

这样的分析将使计划集中于最关键的特征上,从而节省资金。SunGard Availability Services LP咨询服务总监Bill Hughes说:“考虑到经济限制,你不可能专注于一切。”在你的恢复环境中,你真的需要有一个集群环境吗?或10台Web服务器?风险评估将有助于CIO们关注于他们减轻核心风险的绝对需求,如有必要,推迟其余风险。Hughes说,飓风听起来有点吓人,但是如果你有一些确定的风险预防控制措施,飓风影响你的机会有多少?业务弹性是一个预防性的风险控制措施。

Hughes说:“也许你最大的弱点是软件变更控制和释放过程。需要经常地将更多的关注放在这些令人头疼的环节上。”

2.停止把灾难恢复和业务连续性作为IT项目和或者IT的恢复目标。

SunGard公司的Hughes说:“业务不关心技术。”专注于业务目标。他举了一个零售商的例子,该零售商将它的大部分在线业务转移到呼叫中心,以节约在其店面的不动产和销售代表。

Hughes说:“如果你像这样展现它,人们会接受BC/DR(连续性/灾难)作为这个项目的另一个组成部分。然而,如果你只是谈论网络和系统,业务部门很容易从他们的业务经营目标中分离出DR。”

IBM全球客户解决方案执行官、具有DR/BC领域32年经验的Pat Corcoran说,DR方案必须与企业整体战略衔接。他说:“如果你不能证明这一点,那你就有一定的差距。”

制定方案

3.BC/DR应该真正融入组织的正常变更流程中,最好在架构阶段。

Hughes说,这是一件艰难的事情。甚至CIO们不可能完全了解业务项目进展到哪了,而且业务负责人不希望他们将BC/DR成本分摊到他们的项目上。但对CIO们来说,关键是让他们的DR专家在项目最早的可行性阶段介入。

另一种方法更糟。Hughes说:“你构建了某些方案,在最后时刻,你将DR人员带入,他说‘这是行不通的’,这就是你的ROI(投资回报率)。” SunGard公司和它的客户一起坐下来,检查流程以便发现在哪儿可以加入现有的流程以使其更具弹性。当客户构建了参考架构,但是他们没有考虑灾难恢复时,这个修补措施是尤其困难的。他说:“这需要采取大量的销售工作才能逆转工程。”

Toigo Partners International首席执行官Jon Toigo赞成,在大多数公司,DR被隔离,而没有加入公司依赖的IT系统和业务流程中。Toigo说,这使DR规划者的工作十分艰巨。

Toigo说:“这些DR人员收到了一套卡片,并不得不玩分派给[他们]的卡片。在如何设计应用[或]如何托管数据方面,他们没有一票的权力。他们只是收到了交来的这个烂摊子,并被告知,保护它是他们的工作。”

在一开始,提出将DR灌输到业务中的策略至关重要。

事实上,Toigo更远了一步。他说:“灾难恢复需要避开。我们不应该再做了。在这个时候,作为我们设计和管理我们的基础设施的方式,它应该是业务流程的不可缺少的一部分。它不应该再孤军作战了。”

4.专注于业务流程的弹性。

技术解决方案比变更人员和流程更容易实施以增加弹性。技术解决方案也是昂贵的。

Hughes说:“我们现在正在和许多客户一起做的一件事情是专注于业务方面。这些客户不得不推迟他们的技术解决方案,但担心他们的整体恢复。我们正从这些业务流程中找出每一处弹性点,并且实际上,我们正发现了未挖掘的地方。”

有时候它是变换工作到另一个流程以消除风险或者使用组织现有的手工控制措施进行工作的问题。

例如,SunGard公司建议具有有限DR的资金的医院完善它所需的临床工作程序,首先,确保程序实际可用,然后,万一出现灾难,可以提供至少12个小时的健全的护理级别。Hughes说,这不是一个理想的修复措施,但这个新的流程将减少风险。

重新审视业务指标有助于DR。一家制造公司,正在分析历史存货清单,以预测它将需要什么以继续运行业务长达48小时,而不是现在的灾难恢复计划的12个小时。

测试策略

5.制定一份五年计划,该计划可以展示随着时间而出现的改善,例如可以通过,消除额外的风险,或更好地支持业务需要,或加速恢复时间,或降低错误率。

Hughes说,由于灾难恢复合同的本质,“就业务增值而言。”许多DR方案已实施了很长时间,但从来没有改善。

灾难恢复,像任何其他业务过程一样,需要突显改善。

Hughes说:“如果你推出一个计划,并在未来5年有同样的恢复次数,即使你和业务方保持平齐,但你没有交付价值。即使唯一的改善是你降低了灾难恢复时间目标,消除了业务风险。”

请记住,测试恢复次数需要控制RTO(恢复时间目标)。Hughes说:“因此,对于一个24小时的RTO,如果你可以用这个时间的一半执行测试,那么实际上你可以执行24小时的测试。”

改善计划的一部分是减少错误率。他说:“即使你可以实现你的恢复次数,并不断减少那些RTO,如果你仍然犯有同类错误,那么你仍然有风险。”

跟踪测试中的错误,重新检查重复的错误并找到根本原因,然后建立方案以消除这些错误。

6.确保灾难恢复依赖更多经受过训练的人。

即使在一次测试中,一切顺利,如果是同样的人一直在执行这个恢复,[那么] Hughes说:“你并没有像你应该做的那样做好准备。”

为了在一个五年计划的过程中,保持持续的提升,头两年,DR规划者可以使用他们的主要资源。他说:“到了第三年,你需要测试你的二级资源,并在第四年,让三级资源加入计划。你需要能和C组一起应对它。”

7:测试计划。

很多人不关注灾难恢复测试,尤其在景气的时候。

Toigo说,在所有机构中有50%至70%制定了灾难恢复计划,但是只有不到一半的组织实际测试了那些计划。他说:“那等同于根本没有计划。”

移动信息化交流QQ群:一号群:211029692 二号群:344692795 CIO交流群:316076815(需认证)

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源; 2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任; 3.作者投稿可能会经我们编辑修改或补充。转载请注明模板网#