技术干货 | 分布式云计算环境下的品高云SDN业务能力实测

2017-11-10 09:17:00

来源:

云服务,尤其是公有云服务之所以受到越来越多企业用户的青睐,除了云计算本身具有的池化间隔的物理资源、统一按需分配,以及理论上无限可扩展的特点之外,其很大部分原因还在于,云计算给用户提供了一套自动化的整体解决方案,用户可以聚焦在与企业业务息息相关的应用层的研发之上,而无需额外关注底层基础设施的建设与运维。

既然用户可以集中精力在自身应用上,那么应用部署的难易,部署后的应用效果,都成为用户评估云计算架构的主要内容。因此企事录在实测了了品高云提供的优秀的万兆虚拟网络网络架构后,自然将目光转向了分布式应用环境的部署和应用,希望借助实际的部署案例来诠释品高云的品质。

实战品高分布式架构

尽管对于中小企业而言,采用公有云提供的电子邮件应用(如软件即服务)更加简单便捷,但对于中大型规模企业用户而言,自建邮件系统仍具有很大意义,也是企业用户不可或缺的关键应用之一。往更大的范围说,即使企业不需要自己搭建邮件系统,分布式邮件服务的范式对私有云/公有云上的分布式应用也有很大的参考价值——譬如,腾讯的微信本质上也是基于邮件服务的模式发展而来。

回到企业市场,微软公司推出的电子邮件服务器(Exchange Server)解决方案以其部署简单、功能多样、管理便捷以及扩展方便等特点而受到广泛接受,使用基于Exchange Server的ESRP(Exchange Solution Reviewed Program,微软公司推出)性能评估方案来测试和评估IT系统(包括计算、存储和网络子系统)的综合性能水平,也广受解决方案供应商和企业用户的认可。

企事录实验室通过构建一个分布式邮件服务的环境来验证品高云在企业关键应用中的综合性能表现,并评估随着需求的增长,品高云的水平扩展能力与性能表现。下图为企事录构建的邮件服务器集群架构示意图: 

\
 

企事录实验室基于品高云构建的邮件服务器集群示意图。安装多个同等配置的Exchange Server(均为4 vCPU,8GB内存)以构建邮件服务器集群,每个Exchange Server上均设置多个Exchange数据库,并均分为活跃数据库(Active DB)和备用数据库(Passive DB)以满足高可用需求。

基于Exchange Server所构建的邮件服务器集群测试环境,虽然对计算子系统有一定的需求,但更多的是评估存储子系统的综合表现(包括性能和容量),同时,在集群环境下,其对网络子系统的性能也有很高的要求(包括带宽和延时)。并且,因为我们构建的Exchange Server集群是一个贴近真实的测试环境,在测试过程中,缓存(Cache,这里主要是内存和闪存)作为整体解决方案的一部分,也将对测试结果带来较大的影响。

在测试环境构建方面,企业录实验室采用微软公司的Exchange Server 2013来构建高可用的邮件服务器集群,每个Exchange Server上均挂载1个500 GB大小的卷(Volume)用于Exchange Server数据库。

值得注意的是,在真实应用环境中,Exchange Server通常会有主(Active DB)备(Passive DB)数据库的设置,以满足某一个或多个Exchange Server故障停机后的业务不中断需求。但在本次测试中,Exchange Server上的所有数据库均为活跃数据库(Active DB),即假定某一台或几台Exchange Server故障后,在满负载环境下,邮件服务器集群是否能够按照既定设计目的正常运行,从而实现业务连续性。企事录实验室以3个Exchange Server为一个集群(一个DAG)起步进行测试,随着测试的深入,不断增加集群中Exchange Server的数量,来验证品高云的水平扩展能力和综合性能表现。在3-5-7个Exchange Server测试环境下,品高云的综合性能表现(如下图):

\

随着Exchange Server数量的增加,邮件服务器集群所能支持邮箱总数随之增长(蓝线),在7个Exchange Server环境下,品高云可支持1.4万个邮箱,(受限于总的存储容量)每个邮箱大小为250MB。图中橙色虚线为参考线,数据源自企事录根据微软官网公布数据整理的物理服务器所支持的最大邮箱数量,并不代表实际的极限性能水平;散列点则表示使用SAN或者融合设施(闪存用作缓存)实现的最大邮箱数量,数据同样来自微软官网。

测试结果表明,随着标准Exchange Server的增加,邮件服务器集群规模增加,其所能支持的邮箱用户总量亦线性增长。需要注意的是,ESRP测试重点考虑存储子系统的综合表现,包括性能和容量。如果尽可能提高存储的性能(比如使用SSD),出于高可用目的,Exchange服务器会将数据散布到集群内的其他节点之上(比如多副本机制),存储性能的提升,必然导致网络子系统的更大压力。本次测试的意义就在于,人为提高存储性能,从而考量品高云SDN网络在邮件服务器集群应用中的稳定性、可靠性与可扩展性。

在本次测试中,当Exchange Server数量从3个逐步增加到7个时,其存储子系统性能(包括容量)随之线性增长。由于采用了高性能的SSD,随着集群内节点数量的增加,其性能随之增加,而由此对网络产生倍增的性能需求。但从测试结果可以看到,从3节点集群逐步扩展到7节点,整个邮件服务器集群支撑的邮箱数量越多,对网络子系统的压力越大,但品高云的SDN方案很好地支撑了这一应用场景,并且可靠性、稳定性与可扩展性都得到了验证。

由7台Exchange Server构成的单一应用服务器集群已属于较大规模集群,为了实现业务连续性,通常也会从应用层面保证数据的高可用,比如本次测试中所使用的DAG,以及2副本设置,会对网络子系统提出一定要求(如带宽和延时)。品高云SDN的分布式网络设计也为此测试项目提供了必要保障,上一篇实测带宽在万兆虚拟网络环境下可以获得媲美物理网卡的带宽,即便在同宿主机高压力并发时,品高云SDN也能很好的保障业务的流畅。

品高云的企业级架构特色

品高云对大型企业的业务有较强的优化能力,在品高的多个客户的环境中,品高云的优化技术都显著提升了云计算环境的性能优势。

凭借品高SDN在网络性能上的优势,云计算环境中的计算、存储和网络的最后一个瓶颈被打通,为了能够在云计算环境中供给用户媲美物理环境的性能,品高云还围绕用户关心的海量数据传输、检索等应用,引入各种新的技术为用户提供更好的云计算体验。下面将介绍几个典型的品高特色技术。

01

S3数据湖

传统物理网络构架受限核心交换总带宽的瓶颈,在今天的用户选型中已经落伍了;而性能较好的CLOS网络构架,随着用户的重新部署或改造,都面临着高成本的威胁,在于云计算时代,任何过高的成本都会被大多数用户放弃。

\

上图就是传统架构进化到品高云SDN数据湖的对比。品高云的网络结构不是简单的高性能SDN环境,还依托了品高云在存储部署结构上的改进。

品高云的数据湖是将S3服务、分布式存储直接部署到业务节点上,并利用SDN的引流技术,使数据流减少访问核心交换的几率,直接流向业务节点内的分布式存储环境。通过这种架构有效的解决了用户在海量数据量下的带宽瓶颈问题。

\

SDN加速-S3性能对比测试图

可以看到,在大并发流量场景下,SDN加速后的上传速率和下载速率都有极大的提升,使用户可以获得更好应用体验

02

Greenplum集群

基于容器的Greenplum计算集群环境在大流量的应用场景中常有不确定的因素,特别是在高并发时服务可能出现的响应慢/不可用的情况,用户对GP的性能与稳定性有疑问。

品高云支持的Greenplum 处理特点是,在处理大数据时,会启动多个实例和进程去执行相同的操作。且处理的都是不同的数据分片,因此实际上就是实现了GP的并行处理。这对于视频、图像等对象存储领域和在线查询、公告等应用环境下,品高云的GP(容器+虚拟机)性能非常接近物理环境的带宽,据品高云内部测试数据显示:

\

容器网络性能-物理网络性能对比图

如图所示,在品高SDN支持的容器环境中,GP的性能可以达到物理网络的93%,可以满足用户大数量高性能的网络带宽需求。

03

SDN+LVS负载均衡

\

品高SDN通过对数据包首帧信息进行分析,直接创建二层的加速通道,充分发挥物理网络的带宽,品高云SDN+LVS负载均衡后,可以获得优秀的表现,在KVM实例下,可以获得百万的稳定连接;在负载均衡环境下,可以获得最高160W的连接数。

\

LVS测试曲线

测试环境(数据来源品高云):

NC规模:(CPU: 80,内存: 314 GB)

客户端实例:50台(CPU:2,内存: 2 GB)

后排服务器实例:20台(CPU: 4,内存: 8 GB)

总结

通过企事录在品高云生产环境中的测试,结合品高云特有的技术,我们认为品高SDN在性能上已经接近物理网络的指标,特别是在高负载的分布式应用场景下,品高云具有极强的可用性,能够为用户在复杂的企业级应用环境下提供良好的使用感受。

本文首发企事录,品高云经编辑发布。


  • 关键词:
  • 云计算
  • 信息安全
<