Sun正在教COVID-19研究人员如何使用高性能AMD计算机
为了应对日益严重的COVID-19大流行,世界研究界的大部分人在2020年初重新集中精力。
生物化学家、流行病学家、分子生物学家、遗传学家和其他专家开始研究各种方法,利用最复杂的科学技术和方法,对新型冠状病毒进行建模、追踪和攻击。这些技术在本质上已经变得越来越需要计算密集型,需要高性能计算,但COVID研究社区并不总是可用。
跨国半导体公司AMD通过支持23个组织解决疫苗开发、基因测序和疫情建模等问题,参与了抗击COVID-19的斗争。AMD为研究人员提供高性能计算设备,特别是图形处理单元,由AMD Radeon开放计算(ROCm)平台支持。
AMD请来了一组指导者,其中包括威廉玛丽公司的孙一凡,以确保研究人员能够最大限度地利用每秒12千万亿次的计算能力。Sun和他的同事们正在举办一系列在线讲座和办公时间,以帮助COVID的研究人员加快图形处理单元(GPU)计算的速度,特别是所需的计算语言。
“甚至在COVID之前,我们就在写一本专为HIP程序语言设计的书,这是你需要与AMD gpu一起工作的,”William & 玛丽计算机科学系助理教授Sun说。“这本书还没有写完,但差不多写完了。因此,AMD的人召集了组件计算专家和研究专家,进行了为期10周的会议。”
孙老师说,有33个人上他的课。这是一个国际组织,由来自美国、意大利、德国、英国、印度、法国和加拿大研究机构的代表组成。
“他们是助理教授、研究人员、博士生,”他补充说。“其中5人来自AMD;我认为他们希望通过这门课程更好地了解如何为AMD GPU编程,以及如何提高GPU程序的性能。”
研究人员对高性能计算并不是新手,所以Sun说他和其他老师能够在最初的几周内开始介绍HIP语言。
“然后,稍后,我们会深入研究性能调优、调用库和其他工具,”他解释说。“这是一个高度专注的社区。他们关心的是业绩。他们关心的是他们能多快得到结果。”
研究人员自己开发他们的算法。孙说,许多与会者都对将高性能计算应用于蛋白质折叠建模、基因测序和比对等任务感兴趣。他补充说,基于gpu的计算在这种计算繁重的杂务中大放异彩。
Sun解释说,传统的计算机架构是基于CPU——中央处理器。一个CPU可以有许多核心,或者“大脑”,CPU核心可以有几十个,或者几百个。为了连接所有这些核心,CPU服务器在机架到机架的服务器之间进行通信。
“所以CPU内核之间的通信本质上是非常缓慢的,”孙解释说。“但在这个项目中,我们使用的是GPU设备。GPU是高度并行的,单个GPU中有数千个内核。”
他说,GPU架构要快得多,因为它具有并行特性,而且在单个设备上可以组装更多的核心。不需要像以太网电缆这样的慢速结构来进行计算机间的通信。孙说,这一结果大大加快了研究人员与导致全球大流行的病毒作斗争的计算速度。
“对于普通算法,gpu可以比cpu快数百到数千倍。对于更具体的算法,比如基因比对,我认为至少要快几十倍。”“你可以考虑将计算任务从10天减少到一天。这是很大的加速。”