关闭菜单 参考资料…… William & 玛丽
w m菜单 关闭 William & 玛丽

威廉玛丽公司是为百亿亿次计算的曙光做准备的精英组织的一部分

Toward exascale:
向exascale: Andreas Stathopoulos用一种简洁的类似回文的方式描述了他的角色:“我从事计算机科学工作,我专门研究科学计算。”他和物理学家Kostas Orginos正在合作准备在下一代超级计算设备上模拟大数据事件。约瑟夫·麦克莱恩摄

Andreas Stathopoulos是一个合作项目的成员,该项目致力于在一些有史以来最大的计算机上模拟物质的组成部分。

准确地说,这一努力将需要大量的计算机,一组足够大的处理器来解决人类可以提出的一些最大的问题。

Stathopoulos是威廉玛丽大学计算机科学系的教授。他是William & 玛丽公司一个名为ECP(百亿亿次计算项目)的大型项目的负责人。ECP是国家战略计算计划的一部分,该计划由奥巴马政府通过美国能源部发起。这是一项具有直接科学和国家安全应用的倡议。Stathopoulos说,ECP对许多商业应用也有影响。

Stathopoulos和他的合作者,William & 玛丽物理系教授Kostas Orginos是ECP合作项目的一部分,他们正在研究一个名为“核子和高能物理的百亿次晶格规范理论的机会和要求”的项目。他们的团队包括来自费米佳博体育、杰斐逊佳博体育、哥伦比亚大学、波士顿大学、石溪分校和其他研究机构的科学家。

“这是一个很大的财团。这个问题被称为点阵量子色动力学,也就是点阵量子色动力学。”这是一个关于强作用力的理论,夸克和胶子是如何相互作用使原子核聚集在一起的。他和Orginos已经在晶格QCD上合作了十年,Stathopoulos描述了他们合作的本质。

“我不是物理学家,”他说。“我在计算机科学系工作,我的专业是科学计算。这意味着我开发数学、代码和算法来解决物理、工程和一般科学领域的问题。”

ECP项目的第一轮资金总额为3980万美元,Stathopoulos和Orginos的晶格QCD小组从中获得了1000万美元。

“有15个项目获得了资助,几乎全部来自顶级研究机构。我们很自豪威廉玛丽是这样一个团体的一部分,”他说。“有一些大数据和统计应用,但超过一半是材料科学、理论物理和一些化学应用。”

在美国能源部的许多设施和欧洲核子研究中心的大型强子对撞机进行的实验都是基于奥基诺斯和其他理论物理学家的预测。Stathopoulos解释说,为QCD理论建模所需的计算远远超出了即使是最强大的计算机的能力。

“这个模型提出了无法解决的方程,至少在纸上无法解决。要在计算机上解决这些问题,你需要百亿亿次的资源,”他解释说。

“我来告诉你什么是百亿亿次:它意味着1018次失败。这是每秒1018次浮点运算,”他说。浮点运算是衡量计算机处理速度的标准标准。斯塔索普洛斯把大拇指伸过肩膀,指着他那台加强型台式麦金塔电脑。

“让我给你一个关于1018年的观点,”他说。“现在,这里的这台计算机,是一台非常强大的机器,每秒不能达到1010次以上。少了一个8的幂。我们需要一亿台这样的计算机才能达到百亿亿次!”

当你看到当今最先进的计算机和百亿亿次计算机之间的差距时,你会发现还有很多失误。目前最快的超级计算机是千万亿次计算机,其计算速度为每秒千万亿次浮点运算,即每秒1015次浮点运算。(IBM Jeopardy竞赛的冠军沃森(Watson)是一台每秒浮点运算1012次的计算机。)

Stathopoulos说,在可预见的未来,只有一种方法可以实现,甚至接近百亿亿次:并行计算。他说:“我们会给你更多的电脑,而不是更快的电脑。”

自20世纪60年代以来,并行计算的概念就已经出现了,但Stathopoulos说,它们仅限于高端计算。直到最近十年,随着多核个人计算机的普及,并行计算才引起了公众的注意。

“我们在办公桌上看到了这个,”他说。“你的笔记本电脑有几个内核?”每台电脑,每一个核心,都和你八年前的电脑没有太大的不同。但还有更强大的力量!这种力量从何而来?从并行性,以及其他方面。”

并行是“人多办事容易”这句格言的硅版本。一个操作被分割,以便它的不同部分可以同时在大量的处理器上运行。多核计算机本质上是多台计算机,但要达到百亿亿次的性能需要一组计算机。

“有多少?我们说的是接近50万或100万台电脑,”斯塔索普罗斯说。“连接在一起,形成一个非常非常快的网络。”

他说,建立这样一个网络将面临许多工程和建设方面的挑战——首先,一台百万计算机的百亿亿次计算机将需要自己的发电厂。

但是Stathopoulos说,为这样一个阵列制造单个机器的技术是成熟的。事实上,三个这样的百亿亿次设施正在计划中:一个在芝加哥的阿贡国家佳博体育,另一个在田纳西州的橡树岭国家佳博体育,第三个在加州的劳伦斯利弗莫尔国家佳博体育——所有这些都是能源部的设施。

“所以我们可以建造一个百亿亿次的机器。但我不会在上面运行Windows。我不想运行Word和powerpoint,”Stathopoulos说。“我想解决大问题。”

Stathopoulos和其他计算机科学家多年来一直在研究解决大型问题的算法,但这不仅仅是等待百亿亿次计算机建成的问题。

“并非所有算法都适合我们正在构建的这些架构。所以我们需要特殊的算法。”

首先,顺序处理侵蚀了并行计算架构的很多优势,Stathopoulos说。任务列表中的顺序指令需要来回传递,因为内核必须同步和通信。

“这是浪费时间,因为你不是在解决问题,而是在协调。这就像一个委员会,”他说。“为了解决这个问题,我们需要很多没有太多连续组件的算法。”

在某些情况下,Stathopoulos说,百亿亿次计算的并行架构将需要更糟糕的算法。

“是的,糟糕!他证实了这一点,并继续解释说,算法的创建遵循一个迭代的过程,在这个过程中,不断的改进,直到达到预期的结果。

“假设我的漂亮算法需要一千步——这是一个很棒的算法。但这是有顺序的。我必须一步一步地走,”他说。“我不可能将这个算法并行化。”

所以Stathopoulos将用他美丽,优雅,精心设计的千步算法,以百亿亿次并行的名义,用编码中的丑棒来打击它。

“所以我会给你一个愚蠢的算法,一个需要10万步的算法,但它们都是独立的,”他说。“现在,你可以把它推到十万个核上,一步就搞定了!”找到这两个极端之间的中间地带是我们研究的重点。”

第一轮获得支持的应用范围反映了百亿亿次计算能力的潜在用途范围。例如,Stathopoulos说,天文学家将能够使用百亿亿次的能力来模拟大数据情况,如与大爆炸有关的事件和星系间碰撞的建模。

“这需要大量的计算,因为每个星系都有数十亿颗恒星,”他说。“想象一下,试图在这里模拟数十亿颗恒星,在那里模拟数十亿颗恒星,以及所有的引力。”

Stathopoulos说,另一个将从百亿亿次计算中受益的领域是材料科学,它负责一系列的进步,包括智能手机等消费产品。

他说:“所有这些东西都是先在电脑上模拟出来的。”“大电脑。”

斯塔索普罗斯回忆说,上世纪90年代,他与材料科学家一起工作时,帮助完成了第一次量子点计算。

“我们需要一台Cray电脑运行几个小时,才能得到第一批图表,”他说。“现在量子点电视在百思买(Best Buy)上市了。”

他指出,技术从联邦政府资助的大型佳博体育涓滴而下,是现代生活的一个好处。

“最终,这些东西会出现在我们的台式机上,”他说。“这就像一级方程式赛车。我们的日常生活不需要f1,但最终所有的技术都会出现在你的现代或本田上。”