企业容灾体系建设:防患于未然 保证业务持续的软实力

2016-02-24 10:08:21

来源:

    随着计算机技术的迅速发展,信息技术广泛应用社会每一个领域。企业信息化已成为企业科学管理和提高服务水平的有效手段,信息化在企业业务中发挥了越来越重要的作用。然而近年来数据中心火灾、停电、设备故障等灾难屡有发生,让更多的企业越来越重视数据中心容灾建设。企业的容灾建设应该如何建立?容灾的方向又该从何入手?

  华为IT产品线灾备解决方案研发总监马俊杰表示,随着信息化的发展,企业业务停机造成的经济和名誉损失越来越大;尤其是在一些关乎国计民生的行业领域,如果出现业务长时间停机或数据丢失,造成的损失将难以估量。

  那么引起IT系统业务连续性中断,引发一些灾难的原因到底有哪些?马俊杰介绍,主要分为三大类,第一是设备故障,包括硬盘故障、应用故障以及存储介质、数据的损坏等。第二是基础设施的故障,比如电力故障、网络、制冷,甚至水灾、火灾等。而第三种则是不常预见,也就是区域性的灾难,比如地震,大型火灾,又或者有恐怖行动。

  容灾方案不完整 业务损失没商量

  马俊杰列举了两个例子,一个是在西部的某商行,异地备灾中心建设完备,但是平时管理不足,导致生产中心火灾发生后不能够及时切换,这直接拖延了所有业务的恢复时间。第二个例子也是在西部的某个银行,这个银行平时做过很成功的数据库瘫痪后快速修复和遇火灾异地灾备中心快速切换的演练,而最终真正遇到核心系统数据库故障的时候,进行容灾切换耗费时间却比平时的演练成果晚了一天多的时间。之所以举例银行的事件,马俊杰表示,因为对传统企业来说,银行业是灾备要求最严格,也是建设灾备最早、最规范的行业。屡次出现数据中心灾难的银行业,其容灾系统也面临着越来越高的挑战。

  接下来,马俊杰又举例了互联网公司的两个案例。在第一个案例中,互联网支付平台虽然对外称有“异地双活”的分布式架构,但是仅仅因为一台挖掘机把数据中心对外的光纤线挖断了,就导致了部分用户无法登陆或支付,而且恢复的时间长达2个多小时之久。第二个案例是某互联网公司的公有云服务,其在香港开通了一个公有云服务,可是由于数据中心电力出现了全面的故障以及瘫痪,导致涉及上万的用户无法访问。在互联网行业,对外部用户提供大规模IT服务,一旦出现业务停机或数据丢失,造成的损失和声誉影响将非常巨大。

  马俊杰总结了一些传统银行和互联网企业近两年发生的灾难事件后,从中分析了企业客户的容灾发展思路并介绍了容灾相关的国际和国家标准。

  据马俊杰介绍,国际的标准分为七级,国内的是六级。其中,一二级容灾标准主要包括本地和异地的备份;三四五级容灾标准主要包括主备的容灾和3DC的容灾,通过数据的同步复制或者异步复制;第六级的容灾标准是通过双活方案和主备,而主备也要满足数据的同步复制,保证数据零丢失和企业要有强大的运维团队,以及相关完善的应急措施、应急预案,能确保灾难发生时可以在数分钟内进行切换。

  总而言之,对于金融行业,首先监管要求越来越严格,其次银行自身业务发展要求的业务连续性非常高效,每次业务的中断带来的影响越来越大。所以双活数据中心的建设已经形成了银行业建设的一个趋势。

  银行行业分析过后,马俊杰分析了涉及人们日常生活的医疗行业。马俊杰表示,分析医院的相关系统,包括HIS、EMR、LIS还有PACS等等以及一些其他的综合管理系统,这些数据对业务连续性要求以及数据保存要求是非常高的。比如患者就医时如果发现检查数据丢失,于医院和患者都是无法接受的。同时其IT运维能力跟银行IT运维团队比肯定有很大差距,所以容灾自动化、免人工参与,也有着很迫切的诉求。因此,医院部署双活数据中心也是非常有必要的,这能保证数据零丢失和业务零中断。这对于患者也是负责任的保证。同时马俊杰表示,国内的医疗行业,双活数据中心的应用也逐渐增多,说明双活数据中心在医疗行业中已经成为一种普遍趋势。

  像金融、医疗等对于容灾的急切需求的行业还有很多,比如人社行业。人社行业的监管要求和银行类似,因为它存有大量的重要数据,包括所有从业人员的社保基金、养老保险以及退休金等。所以国家针对人社行业有明确的灾备要求发文,在人社行业的“金保”工程建设中,灾备建设是其中一个很重要的要求。同时由于人社行业涉及重大民生,业务连续性要求很高,双活数据中心的建设在人社行业也有广泛的应用。

  华为双活数据中心 面对灾难轻松应对

  除了文中提到的行业,还有很多行业的IT系统都需要各种容灾方案来保证不同层级的业务连续性。马俊杰提到了华为的容灾解决方案,华为的方案主要按照本地、同城以及异地三个地域分别。本地采用高可用的架构,也就是双活架构本地部署;同城可采用主备容灾,以及同城双活数据中心的方式;异地可以采用两地三中心,也可以主备容灾。

  本文中一直提到双活数据中心,那么华为的双活数据中心是怎样的解决方案呢?马俊杰介绍,华为的双活数据中心首先来说是端到端提供双活解决方案,而不仅仅提供存储层。端到端双活一共分为六层,存储层A-A双活访问数据保证两个存储同时对外提供同一业务,数据做到零丢失,任意一台存储故障业务不感知,同时可以利旧已有存储容量。在计算层面,华为拥有自己的云平台FusionSphere,也可以和VMware进行配合。在应用层面,华为与Oracle进行联合测试发布了Rac双活最佳实践,可以保证数据的强一致性。在网络层,双活数据中心网络解决方案会提供一个可靠优化的二层互联,把两个数据中心通过网络进行二层互联,看起来使他们逻辑上是一个数据中心的内部网络一样,这样达到一个高速互联。在传输、安全层,华为有自己的产品线,这也是华为公司传统的优势产品线。

  同时,马俊杰也介绍了华为双活数据中心的特点:第一是数据不丢失、业务不中断。第二是数据的强一致性的数据保证,保证数据的安全。第三是高性能,架构简单,平滑演进(主备到双活,双活到两地三中心)。最后是开放架构,因为与业界主流的数据库、应用和虚拟化厂商进行了联合设计和优化,不需要做IT软件架构层面大规模的改造。

  IT灾难发生不是小概率事件,一旦出现,影响会越来越严重;各行业监管越来越严格,业务连续性要求越来越高,双活数据中心已经成为企业容灾发展趋势。互联网架构“异地双活”首先是满足其本身业务需求而定制的,互联网架构定制的“鞋子”不一定适合传统企业业务的“脚”。

  马俊杰还表示:华为双活数据中心自从2012年开始,经过了3年多的发展,已经成熟,逐步成为各行业的首选容灾方案。除了双活数据中心,华为容灾解决方案可以为您提供其他各种容灾方案和专业服务,解决诸如异构、利旧、虚拟化等问题。

  2016年3月10日-11日,华为中国合作伙伴大会将在成都举行,届时也将展示华为双活数据中心解决方案,欢迎大家到时参观,共同探讨信息化深入推进的时代企业业务容灾建设方向的发展与变化。


相关阅读