关闭菜单 参考资料…… William & 玛丽
w m菜单 关闭 William & 玛丽

使用CAREER奖推进Insight计算机体系结构佳博体育

Towards a better GPU:
迈向更好的GPU: Adwait Jog领导William & 玛丽计算机科学系的Insight计算机体系结构佳博体育,该佳博体育最近获得了美国国家科学基金会颁发的CAREER奖。Stephen Salpukas摄
The Insight Computer Architecture Lab:
洞察计算机体系结构佳博体育: Adwait Jog(左二)是计算机科学的助理教授,他领导的团队包括研究生Gurunath Kadam, Mohamed Ibrahim, Hongyuan Liu和(不在图中)Haonan Wang。Stephen Salpukas摄

gpu——图形处理单元——不再仅仅用于计算机图形了。

实际上,GPU早在一段时间以前就不再是中央处理器(CPU)的小兄弟了。Adwait Jog说,计算机架构师已经为gpu寻找非图形化的用途有十年左右了。

Jog是William & 玛丽计算机科学系的助理教授。他领导着Insight计算机体系结构佳博体育,致力于提高gpu的性能。他最近获得了美国国家科学基金会颁发的五年职业生涯奖,以继续研究并与学生一起研究下一代GPU架构。

美国国家科学基金会将职业基金授予“有潜力在研究和教育中成为学术榜样,并在其部门或组织的使命中引领进步的早期职业教师”。

Insight计算机体系结构佳博体育处理在努力设计将提供最佳性能的计算机硬件时经常出现的棘手权衡。你有时会以牺牲另一种品质为代价来提高一种品质。例如,延迟是指将数据从A点移动到b点所需的时间。延迟越低,处理速度越快。

然后是吞吐量——从A点移动到b点的数据量。低延迟/高吞吐量是目标。延迟和吞吐量的基本问题是通过将计算任务战略性地分配给最擅长的处理器来解决的。

Jog解释说,cpu对于速度(低延迟)是关键的操作来说是很好的。另一方面,gpu是为高吞吐量而设计的。最初设计gpu是为了处理导致用户在显示器上看到的内容不断刷新的一连串命令,gpu被用于与图形无关或几乎没有关系的计算任务。

如?

“比特币挖掘。这是当今人们使用gpu的一个很好的例子,”Jog说。

比特币挖矿是一种验证比特币交易的公开计算竞赛。为了完成验证过程,矿工必须解决一个复杂的数学问题,即工作量证明。工作量证明计算需要大量的计算能力,时间是非常重要的,因为第一个提交工作量证明解决方案的矿工将获得比特币奖励。

为了更快地解决问题,矿工们投资于越来越强大、高吞吐量的GPU,推高了图形处理单元的价格——这让视频游戏爱好者和其他GPU消费者感到烦恼。

Jog表示,对高级gpu感兴趣的远远不止比特币矿工和游戏玩家。

“如果你想做任何人工智能或目标检测,你会对gpu感兴趣,”他说。“gpu用于目标检测,因为它们非常快。”

他补充说,自动驾驶汽车是gpu用于目标检测的新兴应用的一个很好的例子。“特斯拉与英伟达有很好的合作,”他说,他指的是向他的佳博体育捐赠设备的美国gpu设计公司英伟达。

Jog和他的佳博体育正在为新一代能够进行百亿亿次计算的高性能计算机器设计gpu。计算性能以flops(每秒浮点运算次数)为单位表示。

百亿亿次gpu的目标是1018次失败。Jog指出,目前gpu的最高速度在1012 - teraflop的范围内。通往百亿亿次的道路充满了权衡,但有几件事是明确的。首先,单个大型GPU不能解决问题的实际原因是存在的。

“GPU的尺寸越来越成为一个迫在眉睫的问题,”Jog解释说,“因为芯片尺寸已经很大了。如果你把它做大了,它就坏了,或者出现了某种故障,你不得不把它扔掉,这就是一个大问题。”

Jog正在研究一个相反方向的想法。他没有设计又大又脆弱的芯片,而是追求业界所称的芯片技术。

“你制造微小的芯片,然后把它们组装在一起,”他说。“多个小芯片一起工作。”

许多小芯片可以组装成单个GPU。芯片方法代表了另一种通过在大量处理篮上分配计算蛋来改进gpu的方法。利用许多处理单元来分割一个计算任务被称为并行。

Jog表示,洞察计算机架构佳博体育拥有超过100万美元的外部资金,其中包括来自NSF CAREER奖的45万美元,该奖项将在五年内分配,以及英伟达的一些重要设备捐赠。CAREER奖将帮助支持在Insight计算机体系结构佳博体育与Jog一起工作的研究生:Mohamed Ibrahim, Gurunath Kadam, Hongyuan Liu和Haonan Wang。

Jog解释说,该佳博体育正在从四个角度接近GPU架构的需求。

“一个是纯粹的表现,”他说。“有了芯片技术,就有了数据移动的问题。您需要移动数据来对其进行计算。从能源、成本和性能的角度来看,数据移动都是昂贵的。”

Jog说,他的佳博体育正在开发最小化数据移动的技术,基本上是通过尝试将计算数据包定位到单个芯片上。他补充说,数据管理方面的问题可以通过软件和硬件来解决。

“我们专注于硬件,因为这是我的专长。我正在研究减少数据移动的不同方面。近似就是其中之一,”他说。

近似,或者说近似计算,是另一种权衡。它本质上是一种战略性的牺牲,牺牲一定程度的精度来获得更高的性能。

第二个角度是如何在具有挑战性但常见的情况下优化gpu资源,例如涉及多个用户和多个应用程序的情况(通常是基于云的情况)。

“从硬件的角度来看,如果有两三个人在玩游戏,我希望尽可能将他们放在同一个硬件上。所以,如果gpu更大,更多的人可以在同一个硬件上共存,”他说。

Jog承认,要满足和预测日益异构的计算公众的计算需求正变得越来越困难。延迟/吞吐量等式在优化讨论中很重要。

“从硬件的角度来看,很难确保所有用户都满意,”他说。“这非常具有挑战性,因为每个用户都有不同的需求。也许有人想要低延迟;也许有人想要高吞吐量。”

洞察号计算机体系结构佳博体育的第三个关注点是安全性。

“这是我做任何事情都要考虑的问题。我们希望确保通过我们gpu的数据是安全的,”Jog说,并补充说比特币就是一个很好的例子。“比特币内部有密钥。我想确保没有人偷它们。”

第四个问题,但并非最不重要的,是gpu的可靠性。该项目的这一部分是与Evgenia Smirni合作的,她是计算机科学系的S.P. Chockley教授。

“我们希望确保gpu不会经常出现故障,”Jog说。