正在阅读:全自动拆东墙补西墙 VMwareDRS集群测试全自动拆东墙补西墙 VMwareDRS集群测试

2009-09-01 16:49 出处:PConline原创 作者:PConline企业频道 责任编辑:heyaorong
1DRS介绍回顶部

  上一个测试场景《彻底榨干虚拟化iSCSI带宽资源》中,我们对虚拟化平台上的诸多的虚拟服务器进行了正常以及非正常的数据流量监控,只针对物理网络端口的监控方式在虚拟平台上已经得不到确切的流量监控数据了,监控物理端口得到的都是多个虚机流量重叠的数据,更为严重的是如果多个虚拟服务共用一条物理网络链路,很容易就会出现过载的现象。这里也就带出了一个问题:在千兆网络环境下共享存储的虚拟化平台上,如何规划网络才不会出现带宽的瓶颈。对于这个问题我们应该可以在VMware Cluster DRS上找得到相应的解决方案。

  VMware DRS动态地分配和平衡资源调配,将硬件资源聚集到资源池中。VMware DRS持续不断地监控资源池的利用率,并为虚拟机智能地分配合适的资源。当某虚机的工作量过载时,VMware DRS会根据定义好的分配规则为它分配额外可以使用的资源。俗语中所谓的拆东墙补西墙,其实也就是这个道理,虽然听着不象是好话,但如果这些墙砖都是自动的去填补所需要的空缺,拆东墙补西墙这句话放在虚拟化系统中其实是将资源最大化地利用起来,绝对不让一块砖闲置下来。

tesr

  DRS分配资源的方式有两种:将虚拟机迁移到另外一台具有更多合适资源的服务器上,或者将该服务器上其他的虚拟机迁移出去,从而为该虚拟机腾出更多的“空间”。虚拟机在不同物理服务器上的实时迁移是由VMware VMotion来实现的。VMware DRS具有自动模式和手动模式两种方式。

VMware DRS
DRS资源分配方式一
VMware DRS
DRS资源分配方式二

  在自动模式中,DRS自行进行判断,拟定虚拟机在物理服务器之间的最佳分配方案,并自动地将虚拟机迁移到最合适的物理服务器上。在手动模式中,VMware DRS提供一套虚拟机迁移最优方案的建议,然后由系统管理员决定是否根据该方案对虚拟机进行调整。

点击相关阅读:

  IT共产主义 WMware DRS资源调度技术详解 

  动态资源自动分配 VMware DRS部署图解

  锱铢必较 彻底榨干虚拟化iSCSI带宽资源

  技术趋势的另一面 虚拟化对网络提出挑战 

  

2DPM验证测试1回顶部

  搭建基于VMware DRS的主机集群以后,无论是CPU资源,内存还是网络带宽都会纳入到可分配调用的资源池中,当某个虚拟所在的主机上出现资源系统短板时,DRS都会根据手动或自动的策略选择给出操作的建议或直接将虚机迁移到有更多可用资源的空载主机上,这整个过程中,被迁移的虚拟服务器完全没有停机,上面所运行的应用程序都会保持工作状态,这就是VMware技术中的动态迁移VMotion。

  要实现VMware HA以及DRS,使用共享存储系统都是必要的前提条件。测试环境搭建全程实录:《天网就是这样建成的 虚拟化平台搭建实录》。

DPM验证测试:

  ESX4支持新增加的分布式电源管理(DPM)。这项功能在之前的VI3版本是实验性的,而在vSphere就全面投入使用。VMware DPM通过平衡数据中心的工作量来减少耗能。作为VMware DRS的一部分,分布式电源管理(DPM)会自动切断当前不需要的服务器的电源,而在计算资源需求上升的时候,重新启动这些服务器。

VMware DRS
DPM断电示意图

  当群集的利用率低时,带有DPM功能的DRS就会将工作量重新整合到少数ESX服务器主机上,并建议将某些暂时不需要的主机断电。当群集的工作量增加,需要更多容量的资源时,带有DPM功能的DRS就会建议重新给某些ESX服务器主机供电,并再一次平衡群集中正在供电的主机的工作量。DPM还能保证所有供电主机的容量符合VMware HA的设置要求。

  DPM与DRS一样,具有自动和手动两种操作模式。只要硬件设备能够支持DPM,同时进行了适当的配置,VMware DRS群集在任何ESX服务器主机上都能使用DPM功能。比如,使用VMkernel网络的网卡(NIC)必须支持远端唤醒(Wake on LAN)功能,该功能主要是用于将ESX服务器主机从断电状态启动起来。

VMware DRS测试
空载的主机进入休眠状态中

    上图是搭建好的VMware DRS Cluster,共有两个ESX主机:192.168.0.30和192.168.0.40。由于DPM设置的是自动选项,各个虚机都没有启动的时候,DRS察觉到这个能源浪费的现象,所以将192.168.0.40休眠。 

3DPM验证测试2回顶部

    同样的场景,不过将所有虚机都启动电源,但不启动各自的应用使虚拟服务器空载运行。这样的目的是尽量少占用主机的资源,免得去触发DRS的运行启动阀值。

VMware DRS测试
DPM自动运行

    虚拟服务器空载运行一段时间以后,其实这时候两个主机的负载量都极低,这是DRS再次的触发DPM的电源管理机制。主机192.168.0.30进入休眠,但其上运行的虚拟机backup1会自动的动态迁移到192.168.0.40主机上。

VMware DRS测试
持续的Ping迁移中的虚机

    如果持续地Ping迁移中的虚机,会发现一个超时结果,这个是主机管理权转移的一个标志符号,如果使用中就会发现其实虚机一直没有停顿。 

 VMware DRS测试
重新启动已经休眠的主机192.168.0.30

    重新启动已经休眠的主机192.168.0.30,刚才已经迁移出去的虚机backup1会自动的回迁到这个主机上,VMotion动态迁移讲究的是不停机的在线转移主机管理权。这次的Ping完全没有超时的现象。

  

4阀值与自动化DRS test回顶部

阀值与自动化DRS test 

  VMware DRS是自动化运行的智能程序,部署过程其实是很简单的,期间所需要的只是选择手动和自动以及定义自动选项“保守”到“激进”的一个阀值水平。另外,具体设置每个虚拟服务器占有资源多少,每个主机资源预留多少也是DRS能否成功运行的关键所在。

  当虚拟服务器运行时系统负载达到主机保留分配资源的临界值时,DRS会触发启动,如果选择“手动”设置,这是VC系统会给出警报和建议,而当我们选择“自动”,另外将自动水平定位在“激进”水平时,DRS这时候就会自动的根据最优化选择进行自动的虚拟服务器迁移动作。

  当上述这些都设置妥当,我们只要给虚拟服务器施加压力,就可以看到各个虚机在VMware Cluster中自动漂移的可爱场面了。 

ERP压力测试
ERP压力测试

ERP压力测试
ERP压力测试中的内存占用

ERP压力测试
CPU占用几乎维持100%

  给虚拟服务器添加压力的方式有很多,很多自动化的压力测试软件比如IOmeter甚至WinRAR都可以做到这一点,这里我们用的是ERP在大并发用户数下的一个压力状态,内存和CPU得占用都会长期维持为高水平位置,可以轻易的将虚拟服务器的资源全部消耗掉,同时也可以将压力逼近到DRS的临界值。

   

5VMotion启动回顶部

VMotion启动

  当系统压力到达DRS阀值的,由于我们选择的是全自动“激进”式DRS,在系统毫无提示的时候,虚拟服务器的VMotion已经启动了。

 VMware DRS测试
某次ping的超时可以视作VMotion的发生

    ERP压力测试中,随着同时在线的并发操作数不断上升,占用大部分主机资源池的虚拟服务器资源几乎耗尽,DRS会在Cluster内寻找更多资源的主机来接管这个虚拟服务器运作,以保持业务的连续性。

VMware DRS测试
VC的事件日志中关于DRS的详细记载

 VMware DRS测试
使用IOmeter同样引发DRS

    IOmeter会持续的对虚机磁盘文件进行读写操作,这种操作也会消耗巨大的内存和磁盘时间。由于虚机的虚拟磁盘文件位于iSCSI SAN上,这种操作也会挤占巨大的网络带宽,这在上个测试场景中已经得到验证。但是用于VMotion连接的使用的是单独的网络链路,DRS的启动不会受到iSCSI SAN链路堵塞的影响。DRS启动后同样顺利的将高负载的虚拟服务器搬迁出去。 

  

6系统资源分析回顶部

系统资源分析

  关于资源,Cpu和内存分别是主机预留20%,其余都交给虚拟机使用。也就是说当虚机使用的资源总量到达80%的时候,DRS就会触发启动。

VMware DRS测试
网络监控DRS启动时的突发流量

    VCenter自带有系统资源的监视器,可以记录各个主机和虚机在单位时间段或者实时的系统健康情况,上图现实DRS启动时的网络流量。虽然峰值貌似非常拔高,但实际上高位20-30MBps,DRS持续流量在5-10MBps左右。

VMware DRS测试
主机的内存占用超过了80%

    在我们定下的规则中,内存80%占用就是DRS的触发阀值,上图为多个虚机集体的加压使得主机的内存开销一下增长到80%以上。

VMware DRS测试
超过80%的内存占用

    192.168.0.30上面原本的两个虚机在同时发力,系统资源的枯竭信号维持将近30分钟,在DRS已经将虚机backup1迁移出去以后,腾出来的资源空间很快就被另一个剩余的虚机VM1所消耗,资源依然维持在80%以上。不得已将VM1继续挪移出去。

7端口映射分析回顶部

    用传统监控物理网络端口的方法,比如网络端口映射,我们可以看出DRS的网络流量没有想象中的巨大。

网络端口映射流量监测图
DMP策略下主机的持续流量

    网络端口映射显示DRS启动以后虚机迁移时的持续流量维持在5MBps以下,偶尔的几个波峰是VMotion操作的几个关键时刻,比如资源重新分配、主机管理权交接棒的时刻等等。

网络端口映射流量监测图
ERP压力测试中的常规流量

    在ERP压力测试中流量并不巨大,这个ERP的测试就是一个IO密集型操作,压力主要集中在CPU和内存中,流量以数据库查询为主,在千兆网络中占用大概在15%左右。

网络端口映射流量监测图
波峰处显示VMotion的启动

    VMotion的操作会引发流量的瞬间爆发, 但持续时间会极短,也就是ping中出现超时的那个回应。

网络端口映射流量监测图
IOmeter的测试流量

    IOmeter测试中,由于虚拟磁盘位于iSCSI上,对虚机磁盘的所有读写操作都会直接体现在网络端口上,大型文件块的读写会有庞大的持续流量作用于网络上,相对于虚机的其他数据流量,IOmeter测试数据显得尤其巨大,在先前的测试中,这个流量甚至有可能占用全部的千兆网络带宽。

结论:

    搭建基于VMware DRS的主机集群以后,无论是CPU资源,内存还是网络带宽都会纳入到可分配调用的资源池中,当某个虚拟所在的主机上出现资源系统短板时,DRS都会根据手动或自动的策略选择给出操作的建议或直接将虚机迁移到有更多可用资源的空载主机上,这整个过程中,被迁移的虚拟服务器完全没有停机,上面所运行的应用程序都会保持工作状态。

    我们所搭建的这个虚拟化测试平台,就各个测试项目和结果来看,系统最短板最有可能出现在于网络上。目前最为主流的千兆网络环境在iSCSI SAN平台上往往会成为系统瓶颈。在升级万兆环境还不太现实的时候,对于系统中各个虚拟服务器所担当的角色,以及对应使用的网络链路都需要详细进行规划。象IO密集型和吞吐密集型的不同应用在使用DRS中使用不同的资源配置方案,要根据其运行的极端情况赋予偏重于计算或者存储的资源。物理网络连接方面尤其需要注意,多个吞吐密集型应用如果共用一条物理链路,其结果是可想而知的。

    以往我们接触过的虚拟化实施工程师,他们开展工作的第一步就是测试与评估,对旧有系统的负载压力以及服务器整合进行最优化的计算,P2V导入各个现有的应用到已有物理服务器上去。使得物理服务器上使用效率接近一个良性的饱和水平,这需要对各个系统的负载一一计算清楚。而DRS的使用最大的好处就是将这一个繁琐的过程交给系统进行自动配置。在搭建好的虚拟化平台上,引入的新应用系统,DRS会为其找到一个最为合适的位置。

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多

服务器论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品