正在阅读:寻求高效存储方案 专访EMC资深技术顾问杨捷寻求高效存储方案 专访EMC资深技术顾问杨捷

2009-03-06 18:10 出处:PConline原创 作者:勤行 责任编辑:wenzhicheng

EMC资深技术顾问杨捷

EMC资深技术顾问杨捷女士

  记者:作为专业从事企业级存储的厂商,在EMC看来企业级的存储市场现在有些什么特点?而EMC针对这种特点作出什么样比较有特色的产品和服务?

  EMC资深技术顾问杨捷:EMC现在看整个不仅仅是中国,而是包括全球的,整个的IT是一个什么样的发展和需求?应对这样的形势和环境,EMC  2009年会重点关注在哪方面?先给大家介绍一下,我们看到前两年讲经济发展增速很快,企业在IT上的投资也很多,在存储上我们实际上管理的用户上的数据增速是非常快的。前两年基本上是一个相对比较匹配的增长,数据量在增长,需求也上来了,并且客户也是有相应的投入,可以是存储、备份等等各个方面。在这块大家发展的都相对比较快。

  从去年开始经济下滑,无论是国内还是国外,我们感觉到客户有这样的变化,数据量不会因为经济形势不好了,数据量的增速会放缓,增速还是很快的。在这种情况下,大家经济上都不是很宽裕的情况下,更多的考虑我怎样用更低的成本管理我这些数据,并且要依靠这些数据帮我去创造更大的利润和价值。这是跟前两年市场上的角度的一个变化。这个趋势应该是从08年下半年,在IT的环境里面非常明显的感觉到的。09年EMC将更关注于强效的解决方案。

  基本上在这样几个层面:

  第一,存储。你把数据放在那,存储的平台有各种各样的形势。哪一种形势、适合什么东西?在什么情况下用?指的是硬件这块。

  第二,保护。保护的范围是很宽的。你们的这些问题里面也有,我们不仅仅限于保护,我们怎样更有效地保护?保护是不会给用户带来额外的增值。

  我们希望:

  1.以更少的成本保护。

  2.在保护的过程中提升资产的价值。

  备份恢复、灾难备份的恢复,这两块放在保护这块。EMC会强调备份恢复与归档,这些是一定要放在一起考虑的。

  第三,优化。服务器也越来越来多,数据量多了,管理起来就会复杂。怎样优化整个基础架构?在这方面EMC主要关注与虚拟化和运营维护两个方面。

  第四,利用。最高一个层面,也是跟用户的业务紧密相连的,跟它的一些应用,数据实际上是要为业务服务的,怎样为企业创造更多的价值和利用。EMC有一整套的内容管理的软件。更多的跟用户现有的一些应用,ERP、CRM等等每个行业都不同。包括非结构化数据,大量的文档,OA里面的文档,就是怎样利用这个信息。
   
  记者:数据保护方面EMC比较强调归档,EMC说的归档和备份有什么关系和区别?

  杨捷:以前的用户在备份的时候,无论是新数据还是历史数据,所有的东西都要去备份。历史数据我们通常的是不经常访问的,其实非活动数据不改变的话没有必要每天都要备份,传统的备份都要做备份。你的备份系统会越来越庞大,备份出来的数据占的空间会越来越多,磁带库会越来越大。当我要去恢复这些数据就会很麻烦,因为你根本没有分这个数据是现在还是以前的,恢复的时候只能一起去恢复。以前客户不区分历史数据,活动数据和非活动数据,不会去关心归档。

  我们现在看到这个问题。

  第一,用户在备份上面成本越来越高。

  第二,用户在查找历史数据的时候是相当的麻烦,非常复杂,因为要从磁带上找,找的速度非常慢。

  为了解决这个问题,我们建议用户在做备份之前先归档。我们把不经常访问先从生产系统上拿出来,放到我们一个叫归档系统里面。这个归档系统能够保持数据的长久保存不被丢失,跟保存在磁带上一样可以长久保存。同时还能实现在线的访问。我们现在这种归档能够提供实时的访问。

  我们先把历史数据从生产系统里面拿出来,备份只备经过修改的数据,这块是EMC的一个理念。

  记者:归档的时候,前一段时间,那些数据里面既有活动又有非活动,把这些都统一归档?还是把非活动的的归档,怎样判定需要归档的数据?

  杨捷:归档是需要策略的,策略要靠我们人工智能,必须先了解你的数据是很长时间没人访问过的,哪些是有人经常在访问的。这都是要靠一些软件判断的,策略设定好后就由软件去判断哪些数据是需要归档的,比如软件可以自动地去找哪些数据超过半年没有人看就归档了。

  记者:数据备份现在有一个非常热门的重复数据删除的技术,EMC在很多产品里面也加入了这个技术,请工程师介绍一下EMC这种重复数据删除这个技术是怎样实现的?

  杨捷:在备份上面,现在的重复删除分为两大类:

  第一,目标端的重复删除。

  第二,源端的重复删除。

  这两种解决方案EMC都有。目标端删除一般都用虚拟磁带库,把数据备到虚拟磁带库,之后在虚拟磁带库上做判断,这个叫做目标端的重复数据删除,备份数据已经到了备份设备上再去做。基本上所有的虚拟磁带库都是采用这种技术,EMC也是用的这种技术。

  另外一种是源端的,在开始备份这块就开始做了,然后把不重复的数据再送到备份设备上面。前端和后端的删除方式分开的,可以选用目标端的,也可以选用源端的,这主要是看用户是什么样的环境。源端的重复删除我们现在的解决方案是基于网络的备份。为什么仍然再用网络备份?大家觉得网络备份有点老了,速度不行,网络会有瓶颈。实际上我们这种技术就是为了优化这个技术。当你真正要备份的时候,在网络上传输的数据量非常少,不是所有的数据都要去传。

  记者:本身的数据其实是没有移动过去的。

  杨捷:不动,就在生产系统上都做,之后再通过网络传送过去。带宽占用的非常少。所以,我们看到特别适合某一些应用场景,比如说有一些大的企业,大的客户,他有很多分支机构,分支机构想要做集中备份,分支机构和我的总部之间链路带宽非常紧张。再一种情况是服务器虚拟化的情况下,比如Vmware的环境,在这种环境里面虚拟化环境里面有大量重复的数据,特别适合用这种源端的来做。

  记者:虚拟化现在是业界很热的一个话题,EMC现在和VMware也很深的资本关系,因此无论在存储的虚拟化还是服务器的虚拟化方面都是很有发言权的,请您介绍一下存储的虚拟化是什么样的?

  杨捷:我们一般跟客户交流做方案的时候,首先问的用户说你到底想要实现什么样的功能?到底想通过一个技术解决你什么样的问题?我们再会去看是什么样的解决方案适合它?虚拟化也有很多种解决方案,并且在存储这个层面可以在很多种方案和层次上面都可以实现。你比如说我们从最底层的讲起,存储里面,磁盘阵列里面就有虚拟化技术,有些产品已经有很多年了,现在EMC又做了一些优化,比如CLARiiON里的虚拟资源调配。这是一个软件的技术,做容量的按需分配。

  虚拟存储的一个好处,比如说用户只有1T的数据,我只需要1T的磁盘,而以后可能有5个T的数据,以后再去扩这5个T的容量,扩的时候不会影响你生产系统的应用,这个可以通过我们虚拟资源调配来实现的,并且,现在它中间有一个共享空间的概念,并不是只有一个应用可以这样做,实际上在我们现在客户环境里有很多个应用,他都希望每一个应用在扩容的时候都别停机,他要扩容的容量从哪里来呢?就是从我们提供的一个虚拟的存储池,有需要就从这个存储池动态分配,谁要就给你相应的容量。刚才看到高端、中端的存储里面都是这样。这也是比较创新的技术。

  在产品方面,有的用户会有这样的需求,以前用的是另外一个厂商的存储,现在我可能想新购一台,和以前的存储做灾备,现在我希望使用EMC了,那么以前的产品怎么办,这时候需要在异构的产品和存储中间去做数据的容灾,这时候也可以借助虚拟化的存储。有的用户说我不是做容灾,买了没有扩展容量,我再新购一台存储,上新的容量,采用新的产品和技术。但是,我希望我把新的和旧的存储当做一个大的存储 空间来统一的管理。我不想用两套管理界面,我想用一套管理界面,我想做在线的数据迁移,我想把原来的数据从原来的存储上迁到新的存储上,我的应用最好也别停,这也是虚拟化可以做的一个功能。EMC这块也有解决方案。

  记者:像异构做灾备是不是必须要做虚拟化,不用虚拟化实现起来可能会比较困难,结果也难以预料?

  杨捷:也不一定。我们使用虚拟化的话实际上是又用了第三个设备,在用户的环境里面,设备越多就越复杂,所以不要以为虚拟化引进来就真的能够简化你的管理,或者给你降低风险,相当于你比原来的设备都多了一个设备,而且这些设备都有逻辑关联的,一个坏了就会影响另外一个。并不是说虚拟化就能解决用户所有的问题。为什么我把它分开很多层次?我们认为应该说我们针对 客户的每一个需求,我们看哪个方案最能解决他们的问题。

  记者:下面的问题可能要涉及到具体的产品,去年下半年的时候,EMC推出了中端存储CX4,媒体报道的都比较多,网友们都比较关注,这个产品在中端的存储上首先用了这个固态硬盘,固态硬盘是选配的吗还是标准配置的?

  杨捷:是选配的,现在在我们的CX4上面,支持三大类硬盘,实际上还有很多小类,“光纤盘、固态盘、SATA盘”,固态盘是选配,光纤盘和SATA盘是必须要选择一种,光纤盘里面也还分一万转的光纤盘和一万五千转,SATA盘我们分7200转和5400转,所以现在分层存储在一个阵列里面分细了至少可以分五层,在一个里面我可以分五层,可以根据用户的分类需要,选配不同层次的磁盘。

  记者:CX4的推出有一段时间了,现在在客户里面已经有应用了吧,应用反馈怎么样。在客户的反映里面SSD它是很必要吗?SSD的使用情况对系统的提高有明显吗?

  杨捷:有很多,在各个行业电信、政府等都有客户在使用。SSD肯定在性能方面性单个磁盘要比我们传统的光纤盘要快,快到多少?每个客户是不一样的,这取决于客户的应用,是一个数据库还是文件系统?在数据访问上面是读多?还是写多?都有关系,肯定的讲,肯定是要比以前传统的磁盘要快。举一个例子,我们有一个客户是澳门的一个博彩公司,大的数据库,交易量非常大,同时很多人去下注。还有金融公司做信用卡的交易,卡的交易也要同时有很多人,同时写入数据库里面,通过SSD就能极大提高应用性。

  记者:SSD的盘寿命问题一直是很关注的,读写有次数限制的,而您介绍的一般使用SSD的还是对读写需求比较大的行业。那么EMC又怎样来保证这些行业用户的数据的安全?

  杨捷:首先我们从盘本身上讲,SSD不是EMC生产的,是OEM的,OEM厂商在制作盘的时候就有很多的技术,SSD其实就是芯片组成的,跟U盘技术类似,但它跟U盘不同的是里面只有一块芯片,SSD是一组芯片,这一组芯片不仅可以并发提高速度,再有一个有点就是它提供了一定的冗余,大家看到73G的SSD盘,它里面真正的物理空间其实是很大的,不只73G,这就是为了预防如果我有一些空间出现了像坏块一样的情况,我可以拿这些余的空间去替代。

  像现在说的寿命几万次万次的这种,这个实际上不是说读写,因为SSD的盘,它的读没有什么寿命,没有说要读多少次,它只是写,这跟它本身的机制有关系,每次写就相当于擦除然后再写,这个是有次数限制的。当然,我们现在在企业级的存储里面采用本身就是擦写次数高于普通闪盘的芯片,跟U盘是不能比较的,加上这些技术,相应的寿命至少很快正常的使用超过5年。

  另外在阵列里面我们还有很多技术,我们可以保证在坏掉一块盘后数据不会丢的,保证坏掉几块盘数据是不会丢的等等很多技术。

  记者:CX4显著的特点是支持多重协议,支持光纤接口和ISCSI接口等,那么这两种接口是可以根据用户的需要选配的吗?

  杨捷:不是,这两种是标配,既有光纤,也有IP。那这样对于客户的好处就在于用户可以选择哪一些应用接到光纤上,哪一些应用接到IP上。这个是跟其他品牌的产品不同的地方,给用户更多的灵活性的选择。包括以后,因为我们所有的阵列都是有扩展槽的,以后我们马上要出8G的光纤,或者万兆网,只要把扩展模块加上去,用户就可以享受升级带来的好处。

  记者:支持多重协议这方面,同时标配两种接口,有的用户可能只需要一种,这就会造成为不需要的技术买单的情况,EMC对这方面有什么考虑呢?

  杨捷:我觉得真正要做存储整合的客户,我们阵列不是针对一个用户,实际上我们看到绝大多数,不能说百分之百,但绝大多数的客户是分级别的,有生产系统就有测试开发系统,有关键业务就有次关键的业务。比如制造业ERP就会非常关键,CRM就会弱一点,基本上没有客户说只有一个应用,只需要一种方案。而且我们也会跟用户一起来分析你的业务和应用哪些适合应用光纤,可用性和性能都会比较高。如果你的业务是非常关键的,对性能和服务要求非常高那你就用光纤级的,投入光纤成本比较高的,而有一些应用不是那么关键的,对性能要求不是那么很高,你可能对成本比较敏感,这块就放到IP上就可以了。

  记者:EMC针对这种不同的行业,解决方案是不是有一些区别? EMC针对这些不同的特点有什么不同的考虑呢?

  杨捷:有。比如制造,算是一大块,其实制造里面还会分很多很多种。还有医疗,还有包括像证券资金,都属于商业企业的客户群。我们针对不同的行业,我们都有特定的解决方案,我们就以医疗为例,因为现在09年,我觉得国内大力发展的,大概对我们比较有意义的是两个行业,一个是教育,一个是医疗。关系到国计民生国家投入很多的。医疗这块其实很简单,我们针对解决方案的话我们会面对两种行业应用。一种是HIS和PACS。

  这种应用跟我们去医院,看病之后去交费、拿药等,跟门诊看病流程有关的就属于HIS的管辖范围。还有一个应用是PACS,比如说腿碰了一下担心骨折,拍了一个X光片等等这些影像资料,以前是胶片给你,现在是给你一张光盘,你的片子放在里面都是数字化的,这些数字存在于PACS。

  针对不同的应用,我们会设计不同的解决方案。根据医院的特点,24小时都有门诊,HIS就不能停,给我们的要求就是要有容灾和可用性。对于PACS系统,图片的量是很大的,每天有很多病人拍片,国家规定病人的病例资料要保留15年,以前胶片很好办,弄一个仓库,现在数字化了,你的系统是要能够扩展,容量增长的很快,容量增长快了之后有一个什么问题?可能三年前的数据在这里,今天的数据也在这里,就有一个历史数据怎样去保存和管理?这就联系到归档。你看到非常明显的在一个行业里面不同的应用有非常明显不同的需求,我们会针对这些应用去设计专门的一些解决方案。

  记者:现在服务器的虚拟化正在快速的普及,那么虚拟化的环境和过去的环境对存储的需求有什么区别?

  杨捷:有区别。最简单的来讲,第一个能想到的以前服务器如果是分散的,但是现在如果服务器整合了,底下必须有一个存储支撑服务器虚拟化的环境,这个技术上是比较要有的,既然只能有一个存储去支撑这么多的应用和业务,对你存储的架构就要求可靠性和稳定性特别高,这是最最基本的特点。我们一直强调EMC的平台是在用户的环境里面已经经过验证了,至少能够达到5个9以上的。

  第二点是在虚拟化环境中,许多资源不一定在哪,是动态调配,要求你底下的存储也要能够跟着它去动态调配。比如虚拟资源调配、在线数据迁移等等这样一些技术,包括一些服务QOS,服务质量的管理,存储一级的服务器质量的管理,这都是面向虚拟化环境,专门为它设计的。这都是在阵列里面我们提供的一些增值软件。你现在的阵列不是简单的一堆磁盘在里面,是有智能的软件管理的,这个应用要求性能是这样的,应该放在哪?这个应用容量增长了,趋势是这样的,我应该把它放在哪?都是要有这个东西配合的。这是存储这块。

  另外就是备份。虚拟化环境里面备份的时候特别需要重复数据删除,并且是源端的重复数据删除,现在EMC有一个产品叫Avamar,就是专门来做这方面的工作。还有就是容灾,很多大型的用户都在用容灾的技术,虚拟化的环境里面如果要求容灾,也是EMC特别要关注的。

   

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多

服务器论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品