高性能云计算展望 (上)

10月28日,2011年全国高性能计算学术年会(HPC China 2011)在山东济南举行。在这一国内规格最高的HPC盛会上,HPC云计算成为一大热点,如何利用云的资源来实现高性能计算成为IT企业、科研院所和超算中心等会议代表广泛关注的话题。微软亚太研发集团服务器与开发工具事业部高性能云计算部门经理徐明强博士在会上做了《高性能云计算展望》的主题报告,提出云计算是继X86集群之后,高性能计算产业的第二个拐点,将进一步促进高性能计算的普及应用。以下是徐明强博士演讲速记。

大家好,我叫徐明强,非常感谢中国高性能计算2011年会给我们这样宝贵的机会,向各位领导、各位老师、同学们汇报,我们微软在高性能计算方面的工作。今天的汇报就是三句话。第一句话,微软在HPC领域坚持不懈。第二句话,我们相信高性能计算的未来是在云里。第三句话,我们愿意与大家共同携手,共创云计算的未来。

Slide2_thumb[1]

三句话讲完了。那么,我就该回到第一句话,首先讲到承诺呢,我告诉大家,只有一张幻灯片,为什么承诺只有一张幻灯片呢?我妻子给我上了非常重要的一课,她说,承诺你要记住八个字,那就是“简单明了,少说多做”。所以今天我就用一张幻灯片说明我们的承诺。首先,我相信在座同意对高性能计算的承诺,第一是对应用性能的承诺。张云泉老师经常说,Linpack是非常重要,但不能忽视应用性能。所以我们和诸多的应用厂商合作,经由他们测试的结果,Windows跟Linux性能是相匹敌的。除了对应用性能的承诺以外,还要对应用需要高性能I/O应用有一定的承诺。那么Windows 8基于InfinBand,我们实现了SMB这样一个RVMA,初期测试的结果非常令人欣喜,将来有机会向大家详细汇报,今天就不细讲了。

除了对传统HPC应用要支持,更重要的还是要对新兴的HPC应用,比如说Big Data处理的应用也要支持,很高兴的向大家宣布,我们马上就要发布一个叫LinQ to HPC这样一个工具。如果在座有.NET的程序员,就知道,LinQ是.NET当中应用非常广阔的数据。PlinQ就是用在多核上的LinQ工具。而LinQ to HPC,会将它扩展到集群上。所以基本上大多数程序只要将一行程序改动,就可以将多核当中的程序,变成集群上的应用。

Slide3_thumb[1]

第二句话,就是要看一看,到云当中我们的转型将会是什么样子。给大家看一个照片,来自于这张照片,我们都会同意我们所看见的是一个怪物,这样的东西能飞到云里,或者能飞到云里,还有哪些部件是必须的。很多人说,轮子可能需要用,但是不需要四个,可能只需要三个。也有人说这样的轮子没有办法落地。

Slide4_thumb[1]

还有人说,你这样赌云计算会落地吗?下面给大家讲三方面。

首先,要了解HPC产业如何转型,我们必须了解HPC产业的过去,现在和将来。过去有很多说法,虽然我原来是技术出身,架构师出身,但是现在更愿意从商业和市场方面进行探讨。大家所看见的这个图片,都不陌生。Cluster刚出来的时候,我记得很多人就说玩具而已!但是往往在IT领域,玩具枪最后就变成真枪了。你看在张云泉博士的报告当中,有多少个Beowulf Cluster?

我们就不仔细数了,但是就是Cluster的出现,使得原来的高性能计算冲破了国家实验室的封锁,冲破了先进国家的边界,到了大型企业里,到了世界各地。那么从人数上来说,所有7000万科学家和工程师当中,有1500万人能使用高性能计算机。但是在座的孙凝晖老师和我有一个共同的理想,那就是让每一个科学家和每一个工程师都可以访问高性能计算机资源。但是我们从这个图看出来,好像Beowulf Cluster的普及遇到了阻力,很多人把阻力归结为投行的错,金融风暴的错,所以我要告诫大家,千万不要当替罪羊,因为全世界的罪都要归在你头上。那么,我觉得还是要从我们产业本身内部找到原因。

Slide5_thumb[1]

云激发的HPC产业结构转型

下面要给大家看到的行业内部的结构,刚才一位院士讲到了国外在应用方面投入超过了硬件,正如这个图表示出来,在2010年,为什么用2010年的过时数据?是有原因的。因为我们现在看的产业结构,我们在一眨眼就会产生变化。那么在2010年的时候,应用是占用最多的,588亿美元的高性能计算总共的市场份额当中,占了近1/3,187亿美金。服务器硬件毫无疑问,处于第二,116亿。服务,78亿。以前所说的操作系统到底占多少呢?操作系统其实是占管理工具软件以及操作系统34亿当中的不到10%,只有2亿。所以我要告诉大家,操作系统是否会免费,不会影响最终用户在HPC上的投入。

Slide6_thumb[1]

讲完这些,大家会说,这个产业将怎样变革,这个变化将是翻天覆地的。借用一个在座爱美的女孩子所了解的一个说法,就是瘦身手术,是什么意思?瘦身手术,开刀之后,现有获得的财富或者价值,就会转移到新的Player,就叫做公有云运营商,一共要开多少刀呢?我粗略估计,不多,就五刀。

这五刀的第一刀就是开在服务器硬件这里。因为进入了云,许多的运营商采购服务器都是数以万计,所以这样就不是一个一个的买,而是一个机柜一个机柜这样去做的。所以规模效应必定让最终用户在硬件方面产生大量的节省。

第二,硬件的维护上,因为如果用户只用云的资源,他将不用再直接花费在维护上,运营商再次显示出规模效应,因为是标准的硬件,所以在维护上也会大打折扣,最终才会实现在用户开销节省上。

第三刀,砍在服务上,服务包括哪些?今天高性能计算的集群实施还是非常复杂的。不少的企业客户非要叫系统集成商帮助他们实施。如果他们只用云里的资源,那么这一部分的价值又再次转到了运营商那里去。

第四刀,开到微软自己身上,操作系统这边。就是说,以后用户也不会单独购买操作系统,如果使用云计算的话,操作系统的部分价值转移到运营商里。

最后一刀,很多人没有想到的一刀,没有地方再切了,就是切在应用上。应用怎么切?云计算运营商怎么会把应用的价值拿过去呢,并不是那么显然易见的。但是有做ISV的就会晓得,光看开销架构,发现一大部分是做在营销方面。如果在国外的话,中国必定要找代理商,这方面的开销非常大。将来云计算,昨天中计报首席记者和我聊,他觉得云计算将来会像黑洞的效应,他非常有洞见。将来云计算成为主要的资源提供商,必定会成为一个主要的应用渠道。因为在渠道方面,就像今天一个用上了Windows Marketplace,就可以免费得到全世界26个国家的免费广告,他们都意识到,将来应用的主要渠道就在云的Marketplace里面。

讲了这么多,虚线的箭头不代表简单的财富转移。公有云向用户收取的费用金额只是它为用户创造巨大节省当中的一小部分。所以,整个市场缩水了吗?其实并不如此。再谈到是否缩水之前,给大家看一下,转型之后会对产业链上各个角色带来的挑战和机遇。

第一,系统集成商,就可以变成云运营商,在英国我遇到两个系统集成商,他们说我们已经看清这个趋势了,必须要转移到云上,必须成为一个Hoster运营商,而为设计和渲染服务。

再往下,应用代理商,也是受影响的行业,他们可以在云上变成高附加值的SaaS Player,其实很多的ISV并不愿意想成为SaaS,因为他们并不是非常了解他们的最终用户,而只有应用代理商,做过培训的非常了解应用场景。

再往下,中间件市场要整合。我指的中间件,比如说作为调度器,最近IBM购买了Platform Computing。前一阵甲骨文购买了Sun。剩下的就不是很多了,也不会增多,因为这个市场将被整合。

最后,ODM,也将会加入OEM的队伍,为云计算运营商提供硬件。

待续

作者介绍:徐明强博士

现任微软亚太研发集团服务器与开发工具事业部的部门经理,领导高性能云计算中国团队,负责并行计算运行时系统、编程模式、管理和用户门户系统的设计和开发。2008年,徐明强博士回国担任微软亚太研发集团高性能计算首席架构师。2010年10月撰写出版《微软高性能计算服务器》一书,首次全面、系统地向集群用户、管理员和开发人员深入浅出地介绍微软高性能计算服务器的使用、管理和编程的各项技术及实战技能。徐明强博士拥有23年高性能计算领域专业经历,包括8年学术、政府实验室的研究和15年的业界经验。