正在阅读:存储高达3EB:轻松存储美国3倍的数据量存储高达3EB:轻松存储美国3倍的数据量

2011-05-18 14:36 出处:PConline原创 作者:Echo 责任编辑:xujian1
1关注大数据回顶部

  【PConline 资讯】本月落幕的EMC World 2011今年的主题是“云计算相遇大数据”,云计算一直是近年的热点,大家了解的也比较多,今天我们着重来说的是“大数据”这个话题。在这个信息爆炸的时代,大数据无疑是给了所有存储公司一个全新的机会点。从EMC World 2011我们可以了解到他们今年大数据方面的重点是如何管理PB级数据量,通过分析挖掘这些数据的价值,确保及时向相关人员提供信息。

  之所以大数据受到如此高的关注,是因为随着企业规模的不断成长,有效存储和管理长期累积的且仍在持续快速增长的海量数据。因此也带来了巨大的市场机遇。就在EMC主题公布不久后的今天。IBM也高调推出了业内首创的磁带库技术。据我们了解这项技术的数据存储量接近3EB——足以存储将近美国2010年移动数据3倍的数据量。这样的说法,相信网友也想知道是否真像说的这样强悍,虽然技术刚刚发布,但是我们也有些资料可以一探究竟了。

关注大数据

  首先我们先了解一下什么是大数据。当前大量的传感器、移动设备、社交网络、云计算以及网络等公共信息来源导致每年产生的信息量正在急剧增加。与此同时,全球存储容量需求还将持续增长,据IDC统计,其复合年增长率在2009-2014年间将达到49.8%。而用户需要新的技术和方法来充分利用在数量、种类和速度上不断增长的信息,即所谓的“大数据”。

大数据
大数据时代的挑战

  大数据带来的挑战是企业的存储架构及数据中心基础设施层面的,同时也会引发数据仓库、数据挖掘、商业智能、云计算等应用的连锁反应。市场调研机构的数据显示,2011年企业会将更多的多TB(1TB=1000GB)数据集用于商务智能和商务分析;到2020年,全球数据使用量预计暴增44倍,达到35.2ZB(1ZB=10亿TB)。如果说大数据正在彻底改变IT世界,大数据的时代也将重新定义既有的IT格局,那么当前都谁做好了准备呢?>>

-----------------------------------------------------------------------------

相关文章:

大数据和“云” EMC World 2011两大看点
//servers.pconline.com.cn/manu/1105/2409121.html

IBM迎战海量信息变革 发布最大规模信息架构
//smb.pconline.com.cn/manu/0809/1417862.html

IBM推出全新存储系统有效提高工作效率
//servers.pconline.com.cn/newproduct/1010/2249733.html

EMC Isilon为大数据提供全球最大系统
//servers.pconline.com.cn/news/1105/2410540.html

如果您有什么服务器问题,请点击以下链接,进入PConline 服务器论坛:
//itbbs.pconline.com.cn/network/f252.html

-----------------------------------------------------------------------------

2惊人的3EB数据存储量回顶部

惊人的3EB数据存储量

  虽然EMC一直被默认为是存储界的大佬之一,但紧盯这块市场的大笔皆是,甲骨文、惠普、IBM都在为这块市场较量。IBM一直在不动声色的投资开发磁带存储技术。直到最近再高调宣布他们的磁带及其他存储归档组合产品的七大显著改进。业界首个存储容量超过2.7 EB的自动化低成本磁带库系统,其容量足以存储将近美国2010年所有移动数据3倍的数据量(1个EB等于1后面加18个零)。毫无疑问的,这样的新技术实现是相当强悍的。

IBM
IBM 726

ibm
IBM System Storage TS1140

  资料收集时我们发现,1952年IBM率先将磁带用于数据存储,这是IBM百年历史上的进步标志之一。2011年5月17日,IBM宣布推出IBM System Storage TS1140磁带驱动器,其数据容量达到了IBM首款磁带驱动器的200多万倍。当时的IBM 726磁带装置的存储容量为2MB,而今天的TS1140的存储容量已经达到了4,000,000MB。相信从数字上我们就可以看出存储市场前进的步伐。

大品牌+大手笔+大存储

  IBM新推出的产品主要是磁带存储产品及增强型归档、去除重复复制的产品。主要针对的是帮助客户存储数据,并从大量数据中提取信息。

IBM System Storage TS3500 磁带库

TS3500
IBM System StorageTS3500 磁带库

  IBM System StorageTS3500 磁带库是以IBM新开发的磁带传送技术为基础,这一机械附件最多可连接15个磁带库,能以较低成本创建单一的高容量复合磁带库。

  最新TS 1140驱动器和格式下,每卷磁带可储存4TB本地数据,比甲骨文的T10000c 5TB的存储量少20%,但它的本地数据传输速度为295.5MB/s,远远快于后者240MB/s的数据传输速度。IBM声称,TS1140是目前磁带驱动器市场上线密度最高的产品。

  TS1140的耗电量比甲骨文的T10000c要少65%,因为它使用的组件相对更少和更新。 例如,TS1140可同时向32个渠道写入数据,以前的产品只能同时向16个渠道写入数据 这意味着它可以在更少的磁带读取和更慢的磁带速度下提供更高的性能。

  当被用于TS3500高端库时,TS1140可将最大压缩容量提高到2.7EB即2700PB。TS1140磁带的最大本地容量为900PB,相比之下甲骨文的StreamLine 8500库所用的T10000c的最大本地容量仅为500PB。

  TS3500库在其磁带盒活动机械臂中采用了一种新的穿梭技术。它内部最多可连接16个库结构,即带有15个扩展结构或串的基本单元。这种穿梭技术可以不用中间机械臂将一个库与另一个库连接起来。它适用于LTO和基于TS11XX的TS3500,所有使用这些高密度框架的产品都配备了这种穿梭技术。它还支持现有和旧版本的结构、磁带驱动器和媒体,如果空间限制发生变化,它还可以重新配置。

  IBM称,这个库最多可容纳2700个驱动器,而穿梭技术最多可实现每小时15000次操作。据IBM称,SL8500只支持最多640个驱动器。

  IBM通常称它比EMC那种不支持磁带产品的存储厂商具备优势。IBM的Scale-out Network Attached Storage(SONAS)系统和Information Archive均采用了自动在磁带存储层移动数据的政策。>>

3LTFS LE磁带库的文件系统访问功能回顶部

  光从数据上可能不是很容易理解,我们举个例子说明一下。例如,新西兰国家水资源和气候研究所(NIWA)使用两个TS3500磁带库支持复杂的POWER超级计算机,以应对能源、航空航天、气象和气候建模等领域的挑战。两个磁带库共能存储5PT数据,相当于100多万张DVD的容量。也就是说,如果以每分钟一张的速度将DVD写入磁带库,其容量要过两年多才会被耗尽。

IBM
新西兰国家水资源和气候研究所

  我们知道磁带存储这种低成本节能型存储方式正不断创造新的市场机遇,传媒、娱乐和医疗等行业的公司可利用这一存储方式为大数据生成的数字资产和信息创建大型档案。据ESG称,2010年至2015年,存储到磁带上的数字档案的数量预计将会增加6倍。在磁带存储市场上,甲骨文、惠普、EMC和IBM在用自己优势较量的同事也为磁带存储带来了巨大的市场发展。

LTFS LE 磁带库的文件系统访问功能

  IBM最新推出的这个功能是可利用IBM Linear Tape File System Library Edition (LTFS LE)选择IBM磁带库的文件系统访问功能。LTFS LE是由IBM研究中心开发的,主要的作用是提供一种简单、经济的方式来访问并管理大量的数据和数字资产档案。而LTFS用户则可以高效地索引、搜索、检索和共享第5代LTO磁带上存储的开放式磁带存储格式的数据。

LTFS LE
IBM Linear Tape File System Library Edition

  从这点来说,与EMC等不支持或不开发磁带存储设备的供应商相比,IBM明显占据了一定的优势。磁带和磁盘可以一起使用,便于客户分层存储,让他们能够根据数据优先级在不同的层面存储数据。例如,IBM的Scale-out Network Attached Storage (SONAS)系统和Information Archive都采用相应的策略将数据自动迁移到磁带存储层。据IBM的官方资料显示,就长期来看能使用户的总拥有成本最多降低40%。

  同样,我们再举个例子来说明一下。Klinikverbund Suedwest GmbH是位于德国西南部的一家诊所及医院协会,拥有员工4200人,每年接待患者25万余人。这个协会是与IBM业务伙伴Profi AG合作的。其安装了配以IBM Tivoli Storage Manager的IBM XIV存储系统,以结合现有的IBM System Storage TS3310磁带库一起使用。

ibm
Klinikverbund Suedwest GmbH

  Klinikverbund Suedwest GmbH常务董事,医学博士、理硕士Gunther K. Weiß表示,“同时使用IBM的磁带和磁盘技术真的给协会降低了大量的存储成本,掌握了这些不同的存储层,协会就可以确保客户和员工随时都能安全访问数据。”从投入上可以给协会带来了最直接的收益。>>

4SONAS增强功能回顶部

SONAS增强功能

  SONAS是以IBM研究中心开发的技术为基础研发的,现已扩展为超过14个PB的集群存储。SONAS现在的吞吐量——即系统在给定时间内的数据处理量。SONAS单接口节点借助于两个10 GbE活动接口端使可用带宽翻倍,同时,代码优化提高了路径效率。很明显的SONAS现在的吞吐量是其前身的两倍,响应速度也更快。

IBM
IBM SONAS 常用部署的基础设施服务

  不仅如此,这项技术将支持常用的防病毒应用程序,能够扫描存档数据、隔离或删除受损文件,从而保护数据免受病毒和恶意软件的威胁。此外,SONAS还将支持一种称为NDMP的开放标准协议,让客户能够在SONAS中利用支持NDMP的ISV应用程序备份和保护大量数据。

预安装、预配置的归档解决方案

  IBM Information Archive for Email,FilesandeDiscovery,是一种预安装、预配置的归档解决方案。该技术利用整合的软硬件及服务,根据IBM的内部测评,与逐个安装和执行相比,这个技术最多可将安装和执行档案存储器的成本降低70%,据IBM内部测试显示此解决方案可在几天之内部署完成。  

面向大型机及开放存储环境

  还有一些面向大型机或开放存储环境的磁带虚拟化新产品或增强产品,便于客户更好地在虚拟化数据中心访问和保护其数据,这些产品包括:

IBM
IBM System Storage  TS7650

  IBM System Storage  TS7650 ProtecTIER重复数据删除解决方案添加了多对多复制功能,允许拥有多个数据中心的企业在不同地点之间自动复制备份数据,这样就可以存储多个关键数据副本,需要时可以快速恢复。通过在复制前删除重复数据,ProtecTIER用户发送数据所需的带宽减少了95%以上,ProtecTIER的重复数据删除功能可以使每个IBM生产客户数据的存储需求降低至20:1,同时还减少了数据归档及保护所需的存储量。

ts7700
IBM System Storage TS7700

  TS7700虚拟磁带库系列的增强功能之一就是将虚拟磁带盒数量增加了一倍,使之达到200万个,其利用IBM POWER7技术从而使性能显著提高,从数据上对比来看,TS7700的吞吐量高达900MBps,相比之下,Oracle StorageTek虚拟存储管理器的吞吐量为640MBps。

  其实之所以有如此多的产品和技术来推动存储市场的发展是和投入密不可分的,据IBM存储系统和网络部总经理透露,IBM在智慧运算的创新存储技术方面,每年占投入研发投资60亿美元中不小的一部分。而目的只有一个:牢牢抓住客户最有价值的资产——数据!

5分羹大数据市场回顶部

分羹大数据市场

  大数据与我们以前所说快速增长的数据不同,首先,它源自于更加密集和更大规模的海量PB级存储,其次,它涉及到数据类型从模拟到数字的转换,以及利用新方法获取商业价值的需求。大数据是一个巨大市场,蕴涵了巨大的商机,也给存储厂商带来了全新的机会点。从一个IT企业的角度来看,这就是为什么大数据得以重视的原因所在。

IBM
大数据时代

  今年EMC在发布中国业务战略的同时,也具体谈到了Isilon和GreenPlum的定位和新产品发布:Isilon专为海量存储服务,并且已经应用到中国一些石油公司和大学,推出针对高性能的Isilon S系列,针对高容量的N系列以及综合二者的X系列;GreenPlum则将着眼点放在数据挖掘上,面向金融和电信等领域。EMC在用一系列行动来说明自己的立场:大数据有新的内涵和定义,是未来必然走向的趋势,EMC也将在这个市场上投入最大的关注。

  在存储领域,Oracle也是一个很有话语权的厂商。针对大数据方面,Oracle也推出了几款核心产品:Exadata、Exalogic和Sun SPARC Supercluster。Oracle在今年第一季度北京举办的存储峰会上,更是将将Exadata高性能数据库机作为一个重要主题,介绍了Exadata如何克服传统存储系统的局限性,解决海量数据处理中的难题。

  在这方面略有迟疑的当属惠普了,但是幸好迟疑的时间并不久。在今年2月的时候,HP宣布收购数据仓库及分析厂商Vertica,最终让HP也跨进了数据仓库市场和大数据阵营。

  与这几家相比,IBM很明显做出了更多的动作,今年“人机大战”的沸沸扬扬向人们展示了大数据、分析和负载优化系统的强大性能,通过由此名声大噪的超级电脑“沃森”来证明自己在海量数据处理中的实力。其实早在去年,IBM收购数据仓库厂商Netezza的时候就已经可以看出IBM涉足大数据的意图,而现在一系列针对大数据市场产品的发表更是把IBM的野心展现的淋漓尽致。

  大数据时代,各个竞争对手EMC、惠普和IBM现在利用“大数据”的理念,提醒潜在客户需要换个角度考虑PB级存储应用。因为大数据只会越来越大,事务也会不断积累而不会减少,高清、计算机图形增强的电影似乎也越来越大,降低每PB的存储和管理成本必将变得越来越重要。到底谁能在大数据市场站稳脚跟并争取到自己要的,只能靠自己的实力说话了。[返回频道首页]

为您推荐

加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
加载更多
热门排行

服务器论坛帖子排行

最高点击 最高回复 最新
最新资讯离线随时看 聊天吐槽赢奖品