【PConline 解决方案】我们还记得,为了进行故障定位和相关功能的恢复,08年北京奥运会网络订票系统曾在系统瘫痪后被迫中止服务达到两周之久。这一事故反映出数据中心管理员对系统的监控和管理方面的乏力,管理员能否对应用系统进行有效的监控已经成为数据中心管理乃至网络业务管理的必要一环。 然而对应用业务的监控和管理并非易事。随着数据中心的不断建设及虚拟化技术的应用,应用系统的部署密度不断提升,而应用系统一般都是由数据库、后台应用、中间件和Web服务一同构成,这些应用系统又依托于它们所运行的操作系统和网络环境。 目前传统数据中心运维管理所面临的问题: ♦ 每个应用系统均涉及到从网络、操作系统到中间件、数据库等多个不同的层面; ♦ 缺乏一个基于应用层面处理过程的端到端的视图; ♦ 由于数据中心的分工明确,导致单一IT人员仅能分析其所负责层面的问题; ♦ 每个应用出现问题,均会将其所涉及的各环节(包括公共环节)重新梳理一遍; ♦ 运维的工作量和压力不断增大; ♦ 故障定位时间延长。 数据中心的应用管理需求 也就是说,应用管理能够支持从底层的操作系统到上层的各种应用的监控,包括:应用服务(如:BEA WebLogic、BEA WebLogic Integration、IBM WebSphere、Jboss、Tomcat、Oracle Application Server、Microsoft .Net)、操作系统(如:Windows、Linux、Sun Solaris、FreeBSD、IBM AIX、HP- UX、Tru64 Unix、Mac OS等)、数据库(如:Oracle(8.x/9i/10g/RAC/11g)、MySQL(3.23.x/4.x/5.x)、MS SQL Server(2000/2005)、IBM DB2 (8.x/9.x)、Sybase等)、Web服务、邮件服务器、ERP和常用中间件等,来满足用户对于不同业务应用进行监视的需求。 减少对现有系统的影响 应用管理系统部署后势必会对现有应用系统造成影响,这些影响包括:降低应用系统性能或降低应用系统的稳定性。目前的应用管理系统分为有代理和无代理方式两类。有代理是指需要在应用系统所运行的服务器或计算机上部署客户端,客户端负责采集应用系统的信息,上报给管理台。无代理方式是指无需在应用系统所运行的服务器或计算机上部署客户端,应用系统信息的采集通过管理台轮询来实现。相比较而言,使用代理方式时,代理需要逐个服务器上进行安装部署,实施比较困难;此外,代理(客户端)需要占用应用系统的计算机资源,会减少应用系统可以申请的资源,影响被监控应用的性能;并且代理一旦出现故障,可能会危及到应用系统的稳定性。比较而言,无代理方式的应用管理系统部署简单,对现有系统影响较少,是应用管理系统的首选。 支持多种动作的故障管理 管理员不可能实时监视应用系统的运行状态,但又必须在应用系统不稳定或故障时及时做出响应。这就要求应用管理系统必须具备灵活的告警定义能力和方便的告警通知机制。管理员可以根据以往经验数据给监视指标设置多级阈值,当应用的性能采集数据超过预先设定的阈值时,可以触发相应告警,并通过电子邮件或短信等方式及时知会管理员采取措施。 具备组合根本原因分析能力 正如前面我们讨论过的,大部分应用系统都是由多个模块组成的,常见的结构是在一台服务器上运行有后台数据库,中间有通信中间件,前台有Web服务的形式。管理员需要关注的往往不仅是单个数据库或Web服务,而是需要监控整个应用系统的运行状态。这就要求应用管理系统能够将多个监视器组合成一个完整应用进行监控,并通过各个模块间的依赖关系,智能分析出整个应用系统的性能瓶颈所在;并在应用系统出现故障时,快速定位出引起问题的根本原因,帮助管理员快速找到出问题的模块,缩短问题解决的时间。 具备丰富的报表功能 应用管理系统为了能够监控应用系统的运行状况,需要采集大量的信息。这些信息如果不能很好的组织和呈现,其价值将大打折扣。丰富的报表能从海量的信息中提取出系统的运行的趋势,帮助管理员进行适当的预测,并在需要时采取有效措施。同时,报表应该具备定期发布功能,提供给管理员应用系统阶段性的汇总信息。 具备自定义监视能力 任何应用管理系统都不可能预先支持所有的应用,因为随时都会出现新的应用,这就要求应用管理系统能够具备增加对未知应用进行监控的扩展能力。对于新的应用监视类型,要能够让管理员自己定制适合的脚本,应用管理系统应该可以允许通过脚本完成对新的应用的监视。 能与网络管理系统集成 数据中心的应用无一不是依赖于网络的,网络的变化势必影响到应用系统的对外服务能力。如果应用系统一切正常,而应用服务器所连接的交换机端口被其他业务流量占满或上级路由器出现故障,应用系统同样无法对外提供有效的服务。这时无论是割裂的网络管理还是割裂的应用管理,都会降低管理员的故障响应效率。所以管理员必须在第一时间了解网络运行状态,进一步了解网络中的流量组成和分布,然后通过QoS策略的部署,合理分配网络流量的带宽,从而优化各应用系统的流量分布,应用系统服务才能得到保证。[返回频道首页] |
正在阅读:数据中心能效大提升H3C数据中心管理方案数据中心能效大提升H3C数据中心管理方案
2014-03-04 15:26
出处:PConline原创
责任编辑:zhangxiaomeng