由于云计算数据中心的兴起,刀片服务器因为密度高,占用空间少而越来越受到青睐。2010年服务器市场可谓风起云涌,除了传统意义上的刀片服务器更新,还涌现了包括国产龙芯刀片和惠普SL高可扩展性系统等“类刀片”服务器。本文将从服务器性能的各个方面对每一款产品进行详细的分析和测评
IBM x5架构独门刀片HX5
借助IBM第五代X架构技术(eX5),HX5刀片服务器不仅支持最新的英特尔至强处理器,而且还在很多方面超越了行业标准,提高了内存和虚拟化支持。
单个HX5刀片为双插槽服务器,最多配置2颗处理器。其支持的英特尔至强7500或6500处理器可以是4核、6核或者8核,最高主频为266GHz。单片HX5宽度为30毫米,拥有16个DDR-3 VLP DIMM插槽。每台刀片服务器共有8个I/O 端口(包括4个高速I/O端口),配备1个CIOv插槽(标准 PCI-e 子卡)和1个CFFh插槽(高速 PCI-e 子卡)。存储方面,HX5拥有2非热插拔托架,支持固态驱动器(最多100GB)。HX5还带有双千兆以太网端口的Broadcom 5709S板载网卡,支持TOE。
可扩展的刀片服务器,让您在同一个平台上同时满足双路和四路处理器的需求,实施标准化管理以便加快创收,同时在高密度环境中提供最佳性能和最高效率。
MAX5是介绍HX5时不得不说的技术。因为借助IBM MAX5内存扩展技术,HX5刀片服务器可提供高达640GB的内存容量。内存扩展后的好处就是,通过在每个系统上提供更多虚拟机以及更大,更快的数据库,实现了最佳服务器利用率。
MAX5是IBM对X86服务器架构进行的大胆创新,它将内存从传统的与服务器处理器紧密捆绑的局限位置中解脱出来,让内存的扩展可以独立于处理器。 MAX5的关键技术就是eX5芯片,其中包含内存控制器和探听过滤器。MAX5内存扩展带来的好处是显而易见的:无需增加处理器即可以增加内存,从而节省 处理器和软件许可成本;更多DIMM插槽,可混合使用并匹配更小、更便宜的DIMM,从而降低系统成本。
国产里程碑:曙光龙芯刀片
曙光公司于4月份宣布研制成功龙芯刀片服务器,这标志着国产处理器首次应用在了高密度刀片产品中,也是首次应用在高性能计算领域。正如龙芯总设计师胡伟武在曙光龙芯刀片服务器发布现场所言,“我最早认为龙芯是一个项目,后来认为这是一个产品,现在才发现龙芯其实是一个产业链。”风雨八年,龙芯之路,并不平坦!
龙芯系列处理器发展到现在即将有三大路线图,分别是面向服务器和高性能计算领域的“大CPU”龙芯3A(龙芯刀片),未来曙光6000将采用的龙芯3B处理器(8核心);另一条路线则是面向普通计算机和嵌入式应用的龙芯2系列处理器,已经发展到了龙芯2F和龙芯2G;最后一条产品线是面向移动和消费电子的嵌入式龙芯1系列处理器。
笔者认为,相比国外主流x86厂商在制程和主频工艺等领域疯狂攀升性能,龙芯走了另一条路(MIPS架构),并且在多核心封装方面具有x86所不具备的优势。未来的曙光6000将成为国内超算首次使用国产处理器的里程碑,意义空前。
国产SSI标准刀片:曙光TC3600
2010年6月份,曙光发布了基于TC3600模块式刀片系统的超级计算机“星云”,并在6月份的Top500中获得第二名(年底top500第三)。
曙光TC3600是基于SSI标准打造的模块化刀片服务器,10U机箱内最多可支持 10 个支持Intel 四核或六核CPU的计算刀片混插。此外,TC3600还提供了强大而又灵活的网络和IO扩展能力,用户可通过IO Blade实现IO扩展,为计算刀片提供更多的磁盘和标准PCI-E接口。
TC3600刀片服务器以高性能计算、Web基础架构、虚拟化为主要应用目标,融入了诸多先进的设计理念和技术特性,是业界领先的最新一代符合开放性 标准的刀片服务器产品。它拥有10个计算刀片,并且拥有曙光自行研发的弹性存储模块,最大单刀片可以使用12块25寸硬盘,并且拥有4个大功率冗余电源,支持N+1和N+N等方式冗余。此外,TC3600的背板设计很独特,拥有灵活的I/O刀片,可以插入10片存储模块(共20个25寸硬盘)或10个PCI-E扩展设备。网络交换方面,TC3600拥有两个低速模块,并支持DDR和QDR全速的Infiniband交换模块,使得最高吞吐量可以达到288Tb/s。
笔者认为,曙光TC3600是本年度最具特色的刀片服务器之一。不论是国内第一个采用SSI标准的刀片服务器,还是曙光在其上融合HPCSC双重标准,都打破了服务器厂商间互相割裂的“孤岛”局面未用户提供了更多产品选型空间。
惠普SL系列“类刀片”产品
惠普于2010年秋推出SL可扩展系统的最新服务器SL390s G7,可以在4U机箱里最多可放入8个1U双路节点,支持主流的至强5600处理器和NVIDIA GPU。
SL390s G7有两种机型,其中,1U半宽的版本主要针对通用高密度计算,就是上述的可以加入8个双路计算节点,使4U空间计算密度增加一倍。而另一种2U半宽版本 则针对专门需要GPU计算的用户,如科学计算模拟,不仅支持两颗CPU,还支持3块最新的NVIDIA Fermi GPU处理器,从而实现CPU+GPU的异构并行协同计算。
笔者认为,SL390s G7系列极大的彰显了惠普主导的“超可扩展”理念,两个版本分别适用于对计算密度敏感的应用以及时下开始愈发流行的GPU计算。最新一期Top500榜单中的日本东京工业大学TSUBAME 20即使用了这款系统的GPU版本,第四。