这是一个对比评测,主要目的是对比AMD新发布巴塞罗那与原来的双核系统的差距。服务器分别采用曙光A830r-FAMD (opteron8218HE*4/ 需要强调的是,华硕RS161-E5是1U机架式服务器,随机附带的存储系统是一个SATA160G硬盘,我们安装的内存是ECCR 1G*4。在预测试中,这个存储系统的性能惨不忍睹,完全不能发挥四核的威力。这也很容易理解,华硕RS161-E5明显是面向密集计算市场,如果要在企业里用做ERP数据库服务器,必须有独立的存储系统支持。华硕RS161-E5支持两个半高的PCI-E 16扩展插槽,可以通过HBA光纤通道外接SAN存储,遗憾的是我们拿到华硕RS161-E5服务器时,光通道存储已经归还。因此我们只好利用手里有的服务器资源,用“开膛破肚叠罗汉”这样的非正规形式来完成评测。 从下图看,上层是一台1U华硕RS161-E5,配有两颗
叠罗汉为1U服务器增加4*73G SAS RAID
连接两台服务器(两根粗黑色排线为SAS连接线)
CPU风扇罩(左下黑色部分)顶歪了RAID卡(左上)
工作中(图上部为1U服务器,下为是四个SAS硬盘) 这个测试总共进行了两天,在两个全天的测试中,这套编辑非正规拼的系统没有出现任何意外,即便在重负荷应用中,CPU处理能力被压榨到80%以上,系统仍然很稳定。上图为运行中的服务器,可以看到华硕RS161-E5 服务器的网络灯正在闪烁,而下图的四个磁盘读写灯也表示磁盘正常工作。 介绍完硬件配置,照例我们要说说测试场景: 测试采用的是数据量是大小为5G的数据库,测试用的数据库表示浪潮PS各个功能模块中涉及的物料字典、往来单位记录、出入库单据、帐本、凭证单据和销售发票等等各种数据记录表单。在5G的数据库中,光是销售发票就有137754张之多,出库单数量是346430张,其他的各种单据都在30万张以上。假如单张销售发票面额是1000元,这个5G的数据量已经代表了一个营业额过亿的中等规模的加工贸易型企业了。 与以前的测试不同,以前的测试我们主要是衡量硬件平台能支持什么样的应用规模,这次我们测试的目的是两套系统的替代性,因此侧重于一个场景在两套平台上的性能对比。在真实的生产环境中,不可能像基准测试那么精确,实际测试中我们虽然力求一致,但是测试过程还是有差别。测试中相关的术语解释,请参照本站文章“微软、浪潮工程师谈ERP压力测试”。
两路四核物流并发用户
四路双核系统物流模块并发用户
从上面两张图可以看出,虽然测试场景设计都是一次加载200个用户并发,退出是每5秒7个,但是实际运行的用户和完成整个测试的时间还是有较大的差距。在华硕RS161-E5 两路四核上,有20余个用户运行了13分钟,而在曙光A830r四路双核服务器上,基本是按照测试场景完成整个测试过程。这对测试结果多少有些影响。分析原因,主要是两套系统内存大小有一定区别,因此在模块的加载顺序上会有差异。不过这种差异对生产环境几乎不构成影响。
前5分钟,两路四核与四路双核系统CPU占用接近 在前5分钟,两套系统并发用户数都是200,因此对系统处理器的压力可以视为相同,测试结果显示,华硕RS161-E5 两路四核的巴塞罗那系统平均CPU占用为66.29%,而曙光A830r-FAMD四路双核系统的CPU占用平均为70.95%。从CPU资源波动情况看,四路系统相对平稳,可见有16G内存的四路系统性能相对均衡。 由于两套系统完成测试消耗时间不同,因此对比TPS就没有太大实际意义。在两路四核系统中,最后5分钟的时间是20余个并发用户,这必然大大拖后其TPS成绩。 还需要强调的是,前面几篇测试报告反复有网友建议测试应该采用混合场景而不是单个模块。实际上我们采用的物流模块和帐务模块场景,都是混合模块测试。例如物流模块,就是按照下表的比例来混合组成200个用户并发。
物流模块混合比例 很显然,在这样的测试场景中,出现个别模块响应时间(是指从客户机提出请求到服务器返回数据给客户机的完整时间)变快或者变慢非常正常。这是因为在一个混合测试中,每个时刻同时运行的模块以及系统的资源是在变动过程中,因此测试中不但每个模块响应时间有变化,同一个模块响应时间也有很大变化。最快响应时间和最慢的响应时间甚至会相差10倍。这也是真实生产环境不同于基准测试的地方。
从上面六个模块的平均响应时间来看,两路四核系统大约落后于四路双核系统10%左右,而销售提货单制单响应时间相差较大,两路四核系统是四路双核系统的一倍。这并不表示两路四核系统性能就大大落后四路双核系统,而且从测试前5分钟测试CPU资源占用看,两套系统的CPU资源都还有较大的储备。 如果更细致的分析整个系统资源占用,在测试后期,大量用户退出测试,系统会有大量的日志操作;另一方面,浪潮通软PS-ERP系统是一个两层结构的系统,实际应用中并发数和实际用户的经验比值大约是1:3,换句话说,200个并发大约能支持600个在线用户操作,浪潮通软PS-ERP其实不会遇到这样大规模的客户。就如同我们在另一篇测试报告提到的,四路双核系统胜似闲庭信步。直白一点说,就是面向中小企业的PS-ERP并发性能遇到了上限。 产生并行上限的原因并不是个别网友猜测的那样,是在程序上做了什么手脚限制了性能的发挥,而是大量并发用户访问数据库时,必然会产生大量的锁。举个简单例子,销售提货单和库存入库单模块都会访问类似物料编码这样的表,假定在操作时有用户在维护物料编码,则相应的物料编码行或者列就会被锁定,而需要使用该表的事务就需要等待。当然实际的应用环境比这个例子要复杂很多,这也是为什么有些应用在小用户量时一切正常,在大用户量时就错误百出。而处于这种锁等待的时候,就会出现一个很奇特的现象,一方面系统资源占用较低,硬件平台还有较大的性能余量,而另一方面个别模块的个别事务却响应很慢。 作为一个例子,我们来看看两路四核系统和四路双核系统在帐务模块测试中的表现:
两路四核帐务并发用户
四路双核帐务并发用户 从两套系统测试场景看,加载用户的过程很接近,都在大约1分钟左右全部加载到最大并发数,而在退出过程中,两路四核系统再次出现了部分并发用户拖尾现象。而且两路四核系统完成整个测试耗时也因为拖尾而大大长于四路双核系统。
凭证制单模块两路四核全面超越四路双核
凭证记账模块两路四核全面超越四路双核
科目余额查询模块两路四核大大落后四路双核 从测试结果看,出现了喜剧性的一幕。在前面两个模块中,两路四核系统在凭证制单和凭证记账中都绝对领先于四路双核系统,基本上平均响应时间都在四路双核系统的50%以下。而在课目余额查询中,结果正好相反,两路四核系统的平均响应时间是四路双核系统的一倍多。 两路四核系统资源占用(从上到下依次是CPU、内存、磁盘时间) 四路双核系统资源占用(从上到下依次是CPU、内存、磁盘时间) 参照上面两张测试中系统资源占用的图,我们不难解释为什么出现如此喜剧的场面。从内存使用看,四路双核系统的内存占用一直维持在5.5G,而双路四核系统的内存则有一个增加——平稳——再增加的过程,最后的内存占用稳定在3.1G左右。 其实内存的变化正好解释了响应时间差距形成的原因,在两路四核系统上,测试初期消耗内存相对较小的模块凭证记账和制单首先获得了系统资源并首先执行,而课目余额查询因为资源不够而等待。在四路双核系统上,三个模块的资源都能得到满足,因此模块基本上是并行执行。这样分配给凭证制单和记账的计算资源,在两套系统上并不对等,这就是为什么两路四核系统这两个模块响应时间要大大短于四路双核的原因。而在测试后期,两路四核CPU占用有一个明显的波谷,与此相对内存占用和磁盘时间则有一个明显的上升,此时是SQL Server要将更多的数据表读入内存,而此后CPU占用再次上升到一个高峰甚至逼近100%。这样的执行过程自然科目余额查询响应时间要大大长于四路双核系统。 通过分析脚本,我们看到浪潮通软PS-ERP的课目余额查询实际上是一个报表服务。脚本录制中设置的会计期间是2007年1月1日——2007年8月31日,课目有10余个。将如此长周期和如此的多课目的数据查询并汇总是一个很庞大的工作量,即便是四路双核这样Power的系统,CPU资源也被压榨到90%以上。这样模块无疑是最消耗系统资源的模块。 结论: 从实际测试的情况,我们认为在ERP这样的数据应用中,两路双核系统在生产环境中是可以取代四路双核的。虽然这两套系统性能上还有一定的差距,但是在实际生产环境,CPU的平均占用不过30%左右,用两路四核系统取代四路双核系统,既可以储备足够的性能应付高峰,也可以满足日常的需求。而这样的两套系统在价格上的差距可不是一星半点。 因为四核的发布,对一个中型企业而言,采用两路四核的x86服务器也可以构建一个数据中心。这必然大大降低企业信息化的成本。
|
正在阅读:PS-ERP压力实测 两路巴塞罗那堪比四路双核PS-ERP压力实测 两路巴塞罗那堪比四路双核
2007-11-22 09:05
出处:PConline原创
责任编辑:huangjianjun