一年之后,即便Richard Dracott的身份已经是“前任英特尔高性能计算业务总经理”,他仍然来到中国参加ChinaGrid(中国教育科研网格),对英特尔在去全球超级计算机Top500里取得的成绩进行了一次整理:前十名有四个都使用了英特尔处理器,放大到整个榜单,这个数字可能更加“恐怖”:406套,基于至强5500的上榜系统为184套,排名前十的上榜系统中有4套是基于英特尔处理器。
去年11月我们还在津津乐道英特尔在Top500中什么时候能冲破80%的份额,今年6月,这一数字被轻松实现。在中国,在中国高性能计算Top100中有77%的系统使用了英特尔,而2007年这一数据只有50%。
然而就当大家为英特尔在HPC领域取得的份额惊叹的时候,他们却再一次提出改变:如果做大系统不是问题,那么英特尔在HPC领域,到底在追求什么?
英特尔新的HPC追求
“很多人都跟我说,英特尔新的处理器Nehalem似乎在Linpack测试上没有很大的提升,因为那不是英特尔的目标。我们追求的是在真实的应用程序上的系统性能。”Richard Dracott如此说道。
从实际的测试中看,基于Nehalem架构的产品确实没有在Linpack上有很大的性能提升,然而在真实的应用程序性能测试中却翻了两到三倍,现在的英特尔似乎已经走过了对Linpack值满目追高的“青春期”,现在的英特尔已经越来越能站在用户的角度上、站在实际应用的角度上来思考“下一个处理器该怎么做”。
所以,这也是为什么在这期Top500榜单中基于英特尔处理器的系统能取得靠前的位置。刚刚上任的英特尔公司高性能计算业务总经理Rajeeb Hazra介绍说,如果大家也跟踪过此前的Top500 的话就会发现,排名靠前的系统趋势已经从只跑一个应用、负载一个应用,到现在负载越来越多不同的应用。
也因为I/A架构系统跨多个应用程序的能力非常强,服务于多个不同应用特征程序能力非常强。随着TOP500排名靠前的系统会越来越多用于承载多应用,IA架构的系统应当呈现出上升的趋势。
从至强到众核:All In One
5月31日,英特尔宣布了英特尔集成众核架构(MIC)下的Knights Ferry处理器家族的诞生,这个多达50个内核的众核芯片随即引起了人们的诸多关注。尽管英特尔一直强调这个协处理器家族只针对高性能计算使用,却仍然难免招致疑问:它会被集成到CPU里去吗?它会针对什么样的应用呢?
Richard对此的解释是,英特尔希望能用众核处理器来覆盖一部分超级并行的程序,但仅仅是一部分,至强处理器仍然会面向绝大多数的高性能计算程序,这是一个牺牲——“把几个大核牺牲掉,用来做多个小核,这就是一种牺牲的途径,为什么?因为最终是选用至强还是选用集成众核的架构完全取决于应用程序的特征。”换句话说,这终究要归结到用户对于自己的应用和应用程序的了解程度上,这也正好呼应了上面Richard所说的“要以实际的应用性能为目的”。
实际上,Knights Ferry是一个软件开发平台,英特尔已经向小部分客户提供处理器原型来做测试。据了解,今年到明年英特尔将会把这个平台给一些核心客户,这被称为“种子计划”。所有这些内核仍然是IA架构的核心(48核单芯片云计算机发布时曾使用了32位的奔腾处理器,这个平台似乎也是相同的内核),其第一款成型的产品将会是一块PCI-E卡。
当然,除了硬件本身32个核、1.2GHz主频,适合高度并行的应用程序之外,对HPC用户说最关键在于软件。英特尔会提供高性能计算工具并且一起交回客户。英特尔希望无论对至强还是一个集成众核的架构的用户来说,用来进行代码优化、应用调优的是同一套工具,用来协调多核以及众核的任务,Richard认为,“只有软件这部分才是我们的核心价值,因为我们会帮助客户用集成众核的产品去适应高度并行的应用,并且在代码方面付出极少的代价。”
Knights的家族起始的形态都是PCIE卡,定位是协处理器。Richard称,英特尔从来没有把它定位成GPGPU,从编程角度来看,英特尔希望把这样的硬件看成普通处理器来做编程,“这与GPGPU是一个根本上的差别。核心的核心,我们保证不管是今天的多核还是未来的众核,大家工作在一起编程是非常容易的,工作是非常简单的。”
不管未来今后硬件的形态怎样变,英特尔会坚持的是一套工具会覆盖所有的多核以及众核的架构。
中国为何重要
“中国市场”对于外企来说始终是个关键词,对于英特尔来说尤其如此。
Knights Ferry的种子计划即将引进中国,第四季度可能会有新的进展,英特尔数据中心事业部中国及亚太区业务总监Jason Fedder介绍说,中国用户在 Top500里表现亮眼,无论政府还是企业的增长都很快,英特尔中国来说,目的就是要让这些有效的工具尽快走进中国用户。
Jason对于中国HPC用户的了解非常深入,在接受比特网(Chinabyte)专访时他表示,关于中国市场他看到了两个比较明显的差别,一个是在商用的高性能计算,主要是以制造业和石油等能源行业为主。真正在使用这种商务高性能计算里面,他认为客户衡量系统的方式方法对比政府和科研行业是完全不同的,因为商用高性能计算客户更加务实,他们对于高性能计算新产品的采用相对保守。
而对于政府和科研机构,这两年也会中国投资非常大,增长也非常快。从这个角度来说,政府也好,科研机构投资也好,一套大系统需要运行很多种不同的应用程序,这也导致了他们对于性能的追求的确非常激进。“在英特尔跟他们合作的过程中,他们也会给我们一些挑战,在未来政府、科研机构要解决更复杂问题的系统里,需要英特尔提供更强的产品,他们在拉动对我们英特尔产品更强的需求。”
面向真实的高性能计算应用程序,这是英特尔的宗旨,而他们带来的不止是硬件上的变化,从软件上也带来了简易的编程工具和编程模式,前面那些拉拉杂杂的文字其实也只是为了证明这句话:真实的应用性能和简单的编程,便是英特尔的追求。这并不代表没有一点问题,我们现在可能经常需要思考的是,英特尔有这样强大的技术,并且有成熟的生态链,进入一些领域的手法也颇多类似,尽管这被证明了无数次的成功,但是他们以后会再追求什么呢?