美国能源部新百亿亿次级计算研究所所长彼得·贝克曼表示,国际竞争对手正在努力取代美国成为第一
有一个建造一台百亿亿亿次超级计算机,该项目的负责人之一是美国能源部阿贡国家实验室顶级计算机科学家彼得·贝克曼。
贝克曼表示,美国能源部已经为百亿亿次级计算规划工作了两年,但实际建造这种强大系统的资金尚未获得批准。他说,除非美国推动百亿亿次级计算,否则这不会发生。百亿亿次级项目的预计成本将达到数十亿美元;该部门尚未公布确切成本。
当今最强大的系统以千万亿次浮点运算来衡量,这意味着它们每秒能够进行千万亿次运算。根据本月发布的最新 Top500 超级计算机列表,最快的系统是。百亿亿次级系统以每秒百亿亿次浮点运算来衡量;百亿亿次浮点运算是指每秒进行 1 千万亿次(或 1 百万万亿次)浮点运算。中国、欧洲和日本都在开发百亿亿次级计算平台。
贝克曼最近被任命为新成立的百亿亿次级技术和计算研究所以及阿贡领导力计算设施的主任,他接受了采访计算机世界关于未来的一些挑战。
目前百亿亿次级努力的成果如何?我们需要将硬件、软件和应用程序转移到新模型,这是认识或理解。能源部和其他机构正在寻求资金支持,但目前才刚刚开始提供初步规划资金。
我与杰克·唐加拉(Jack Dongarra,田纳西大学计算机科学教授,橡树岭国家实验室杰出研究员)共同领导的软件项目以及一些联合设计项目已经获得了启动资金,但下一步需要政府提出一个真正雄心勃勃的计划,并拿出一个真正有资金支持的计划来实现这一目标。
我相信您的读者和其他人都知道,现在的情况是,功率限制、预算、架构、时钟速度已经改变了计算各个层面的情况。过去,您只有一个 CPU,也许有两个,而现在,笔记本电脑有四个内核、八个内核,我们看到并行性将爆发式增长。我们必须调整算法和应用程序以利用这种并行性。
与此同时,从硬件和系统软件的角度来看,电源管理和数据中心问题正在发生巨大的变化——标准 Web 服务器领域发生的一切也正在高性能计算领域发生。但在高性能计算领域,我们展望未来三到五年。
把它想象成一台时光机。高性能计算中发生的事情,随后也会在高性能技术服务器中发生,最终出现在你的笔记本电脑上。
我们正在关注这一重大变化,并表示我们需要在硬件、软件和应用程序上做出真正有组织的努力来解决这个问题。不能只是一过去,供应商设计了一个新系统,然后从某种意义上说,它问世了,用户看到它并问:“我如何将我的代码移植到这个系统上?”或者“我们正在考虑改进该模型以进行‘共同设计’”——这一概念来自嵌入式计算领域,系统用户、硬件架构师和软件人员都聚在一起,权衡最佳优化的超级计算机将是什么样子,以回答科学问题。
最终,它是关于回答基础科学问题、设计更省油的汽车、设计更好的锂电池、了解我们的气候、新药等等。
进展到哪一步了?你现在处于哪个阶段?近十年来,我们一直在非正式场合进行这项工作。IBM 是阿贡国家实验室和劳伦斯利弗莫尔实验室的合作伙伴,我们共同设计了 Blue Gene/P 和 Blue Gene/Q。在合作期间,我们向 IBM 支付了资金,让其设计 Blue Gene/P 和 Q 的原型,然后我们所有的科学家都进行了持续的评估和权衡讨论。例如,我们宁愿拥有一个内存管理单元,而不是另一个核心?但我认为这只是小范围的。我们没有将其推广到更广泛的社区。
在百亿亿次计算领域,美国能源部表示将启动一系列联合设计中心,涵盖多个应用领域,包括聚变、材料、化学、气候等,这些社区将有权与设计平台的公司进行对话。
这是一项国家性还是国际性的努力?美国能源部的工作是一项全国性的工作,但杰克·唐加拉和我还领导着国际百亿亿次级软件项目 (IESP)。在这个项目中,我们召集了来自亚洲、欧洲和美国的代表,专注于软件。这是目前超越国界的事情。人们使用开源代码进行工作。
由于软件无处不在,而且在全球范围内真正实现了共享和改进,IESP 制定了一份百亿亿次级软件需求路线图。我们花了一年半的时间制定这份路线图,现在将注意力转向共同设计。这主要是协作努力的结果。
美国能源部已经资助了一个非常具体的项目,以启动百亿亿次级计算的规划。他们已经获得了规划资金。但在国会预算出台之前,该项目仍处于规划阶段。
是否担心无法获得百亿亿次级计算开发的资金?确实如此。预算紧张,政治变化,华盛顿代表权的变化,意味着计划中的事情现在必须重新考虑。有人担心,这项计划必须继续推进,必须获得资金,否则我们将失去领导地位。能源部过去几年一直在计划这件事,所以这不是什么新鲜事。
百亿亿次级计算的发展是否如人们所想的那样可预测?百亿亿次级计算系统会在 2018 年左右问世吗?从某种意义上说,我们变得如此可预测,但那只是因为我们投资了一个特定的目标。如果我们不在国内推动百亿亿次计算,那将不会发生。
达到千万亿次级所需的条件与达到百亿亿次级所需的条件有可比性吗?大约有 15 年的时间,世界上规模最大的系统的最大并行性水平实际上并没有发生太大变化。最大的系统拥有数万个处理器。而现在,我们正处于指数级增长……就像这样(他指向上方),Blue Gene 现在拥有 20 万个(或)30 万个核心;随着我们不断增加,下一个版本将拥有 100 万个核心。为了充分利用所有这些并行性,应用程序代码需要进行彻底改进。
是否有为其开发的编程语言?这是个大问题。如果你去问 10 个不同的大型应用程序开发人员,“你们未来的编程模型是什么?”你会发现他们表情中充满了担忧,而答案可能不太确定。收获所有这些并行性并将其付诸使用的途径尚不明确。
百亿亿次级系统能实现什么?人们关注的关键问题是从模拟和理解基本行为转向预测模拟。我们希望能够做的不仅仅是描述喷气发动机的特性并了解其燃烧工作原理,而是积极预测发动机的设计,使其燃油效率提高 20%,并减少碳排放。
当我们展望电动汽车时,所有的技术都取决于电池。如果我们能从基本的化学操作转向预测最佳的新电池设计,我们就能转向电动汽车经济。对我们日常生活的改变最大的影响就是我们能否消除对燃烧化石燃料的需求。
这对国家经济发展有什么帮助?我们是一个喜欢用创新方法解决问题的国家。当遇到问题时,我们喜欢找到一种有创意、有创意、新颖的解决方案。当我看到医疗保健、交通、发电、基础材料、化学时——我们希望成为一个为这些问题发明解决方案的国家。
所有这些事情都需要政府资助,因为它们涉及基础科学,比 100 年前的资助更多,对吗?这是许多人不理解的事情。[在早期]一个人实际上可以发明和做很多东西。现在,一个人仍然可以发明和做很多东西,但他处于一个金字塔上,金字塔上有数百万个社区开发的组件和其他他依赖的技术。
要取得真正的进步,要真正推动这一技术发展,你就必须依靠科学家的合作。科学与大学、实验室、行业和其他国家的人合作,取得了越来越多的成果,这确实需要政府的持续投资。
教育也是关键。寻找博士后和来我们实验室工作的学生变得越来越困难。
这是为什么?我们培养的高质量科学技术博士生不够多。当我们为某个计算机科学领域的专家开设博士后职位时,我们必须费尽心机寻找人才。这类人才并不多,只是个稀缺群体。
我最近在田纳西州参加了一个研讨会,一位博士生发表了演讲,之后我们几个人走上前来问道:“你决定好去哪里了吗?”午餐时,有三个人向他求爱,想让他来为他们工作。
在美国有多少人像您一样投入大量时间进行百亿亿次级计算的开发?对于全职致力于解决百亿亿次级问题的人员,我想说最多只有少数。
您希望看到明年发生什么事情来让您有信心继续向前发展?华盛顿必须理顺预算,才能真正资助这项百亿亿次级计划。然后我们必须迅速找到能够响应并与联合设计中心和软件部门合作完成这项计划的硬件合作伙伴。
是否存在与欧洲、亚洲的竞争?如果你看看中国正在发生的事情,你会发现很多国家都意识到,科学技术和工程领域的建设和教育才是10年后竞争力的关键。
那些在科技建设和教育方面取得胜利的国家将在未来占据竞争优势。如果你看看中国的情况,就会发现他们正以这一战略目标进行适当的投资。
如果你看看欧洲及其超级计算机中心的建设,从某种意义上说,他们已经将资金投入到了百亿亿次级计划中。如果你看看现在排名前十的超级计算机,你会发现其中一半都在国外。这对我们来说是新鲜事——排名前十的机器中有一半在其他地方。
通过这种竞争,现在是获得百亿亿次级资金的好时机吗?这可能是件好事。但是,我们似乎一直都是一个被动反应的国家,与其被动反应,还不如不陷入这种境地。但我愿意被动反应。
我们真正需要的是建立并继续保持设计和教育方面的专业知识,并将整个方案整合在一起。从某种意义上说,我不太关注购买部分的原因在于任何国家都可以购买[超级计算机]。
问题是,谁设计了这些技术、软件和应用程序?因为这对美国的科学技术工程来说至关重要。目前,我们仍然处于领先地位,但我们的竞争对手正在努力。