鸭脖(首页)最新网站地址·(中国)官方网站


宝德陈齐旺:混合架构是未来的发展方向

时间:2010-06-02来源:本站

【赛迪网讯】去年11月中旬,NVIDIA就先行宣布了基于Fermi新架构、面向高性能计算领域的Tesla 20系列计算处理器和计算系统。5月5日,终于有合作伙伴推出相关系统了,也实现了NVIDIA的发布进程规划。


上周,NVIDIA宣布,IBM已经为其最新款高性能计算(HPC)服务器配备了Fermi新架构的Tesla 20系列高性能计算处理器,这也是NVIDIA Tesla第一次出现在主流HPC系统中。


IBM的加入,让GPU服务器再次成为热点,然而国内厂商对此的态度又是如何呢?就该问题,我们采访到了宝德服务器高端产品经理陈齐旺,下面就来了解下来自宝德的观点吧。


请介绍一下您对NVIDIA Fermi系统的看法?

A:Fermi架构的出现,的确是图形领域和计算领域的一个里程碑,特别是针对HPC应用领域,有了巨大的飞跃,能够在降低成本降低功耗的情况下,提升计算能力。


GPU与CPU搭配的服务器是否会成为今后的主流?贵公司是否考虑推出Fermi系统?


A:GPU(或其他加速卡)与CPU结合进行数据处理和科学计算,将会成为今后科学计算领域的一个趋势,类似于我们以前286/386时代的协处理器概念,我们非常看好这个方向的发展,今后许多硬件和软件的设计,都可能围绕这样的结构进行。基于这个考虑,宝德公司向市场也推出了支持GPU/CPU混合架构的服务器PR4710NG/PR1762GT。


这2款服务器都是支持最新的Intel Xeon 5500/5600处理器和DDR3内存,并且支持NVIDIA的C1060和最新Fermi架构的M2050/M2070。其中PR4710NG主要面向个人超算用户,可以作为个人超算工作站使用;PR1762GT是1U机架式,主要面向大规模集群系统。


采用多GPU的服务器系统性能表现如何,功耗与兼容性方面是否还存在问题?


A:在一些针对GPU优化的应用程序上,采用GPU的服务器性能可以得到巨大的提升,比如分子动力学程序NAMD,4颗C1060 GPU的性能就可以和16颗CPU相当。在另外一个程序AMBER,1颗C1060 GPU卡的性能,甚至可以相当于8台双路Xeon的性能,如果改用新的Fermi架构GPU,相信性能还能得到更大的提升。


在功耗上,虽然Fermi单卡功耗较高,但是配合其能够提供的计算性能(单卡约515Gflops双精度,1Tflops单精度性能),平均下来性能功耗比还是非常突出,与传统的CPU处理器系统相比,有巨大的优势。

不过,GPU-CPU混合架构,还有一个巨大的挑战,就是程序的兼容性问题,之前大部分的应用程序都是基于传统的CPU架构开发,并未针对现代GPU架构进行优化,要想在GPU-CPU混合架构系统上运行和发挥性能,需要开发人员进行重新开发和验证,目前,移植到GPU上的应用程序,从数量上看,还有不足;但是,这是一个趋势,将慢慢改善。


GPU的优势在于多流处理器和超高的显存位宽以及频率,这些特点真的能够明显提升服务器性能吗?

A:图形处理的特点是并行度非常高,GPU的设计,也充分体现了这个特点,因此,不论是以前的C1060还是现在的Fermi架构GPU,流处理器的数量和显存带宽都非常高,但是非图形应用程序要发挥出这些性能,需要许多努力:从GPU卡的驱动、CUDA并行架构、编译器、应用程序等。


谈谈您对未来GPU系统的展望。

A:毋庸置疑的,GPU-CPU混合架构的系统,将是未来计算机发展的一个方向。

责任编辑:云中子


XML 地图