系统正常工作时,控制模块通过调整电流调节器/隔离器的导通程度,使系统均衡地使用每个电源模块——每个电源模块向系统提供相同的电流,这种工作模式称为“电流共享”。当其中某一电源模块出现故障时,切断电流调节器/隔离器,使故障电源从电源系统中隔离出来,并进行故障报警。冗余电源系统中的每个供电模块均可以热插拔,一旦某个供电模块损坏,就能在不停电情况下完成维修工作,而丝毫不影响系统的正常工作。为了满足热插拔的要求,冗余电源系统的控制模块应能够限制电源模块的电流突变,防止电源模块插入和拔出时对负载总线形成浪涌电流。
热插拔电源 现在,热插拔技术在确保服务器系统可用性已显得越来越重要了,已成为服务器的标准技术。尽管不同档次的服务器所支持的热插拔配件并不完全一样,但对于像硬盘、电源和风扇的热插拔技术支持已成为比较常见的服务器配置了。不过要实现内存的热插拔,问题就不是几句话能扯得清楚的。上面提到的风扇啊硬盘啊电源什么的,从原理上讲,还是与PCI相关的总线技术有关。但是内存要实现热插拔,就远不止这么简单。于是那些不安分的巨头服务器商就开始了自己的内存热插拔技术的研究,相继出台了这样和那样的技术,不过比起比起传统的ECC技术来说,性能是提高了不少。但是很多时候是整个内存条子损坏,那么前面的努力也就白费了。所以是不是也需要想硬盘一样,用条子做成内存备份、内存镜像来支持内存的热插拔呢? 答案是肯定的,但道路是曲折的。
内存备份 另一种方式就是服务器内存镜像。在线备份内存模式只能对发生单比特错误的数据提供保护,像镜像内存方式还可以用来保护发生多bit错误的数据。正因为如此,内存镜像和内存热备份很适合于商业应用,因为它除了正常维护之外,不需要在内存检修上花费额外的时间。这种技术的出现,是由于随着服务器系统总线提高,内存传输的数据陪增,会出现不知什么原因遇到了许多内存保护和修复技术都不能完全修复的情况。诸如其热更换热添加、热插拔RAID内存,这些就相对好理解一些,不过需要注意的一点是,许多企业实际上实现的只是有限的内存热插拔,只能拔掉特定的内存条,而不能随意拔掉其他内存条。 内存镜像是将内存数据做两个拷贝,分别放在主内存和镜像内存中。系统工作时会向两个内存中同时写入数据,因此使得内存数据有两套完整的备份。由于采用通道间交叉镜像的方式,所以每个通道都有一套完整的内存数据拷贝。 内存镜像有效避免了由于内存故障而导致数据丢失。从下图中可看出,镜像内存和主内存互成对角线分布,如果其中一个通道出现故障不能继续工作,另一个通道仍然具有故障通道的内存数据,有效防止了由于内存通道故障导致的数据丢失,极大提升了服务器可靠性。镜像内存的容量要大于等于主内存容量,当系统工作时,镜像内存不会被系统识别。因此在投资方面,做内存镜像数据保护的投资是没有内存保护功能的一倍。
内存备份
|
正在阅读:乱弹琴弦——服务器技术之热插拔乱弹琴弦——服务器技术之热插拔
2007-06-11 14:10
出处:
责任编辑:gongjianhui
键盘也能翻页,试试“← →”键