基于OpenACC的Tesla K20与Xeon Phi 7110P性能可移植性评估

高性能计算中心大四学生秦强同学的毕业设计《基于OpenACC的Tesla K20与Xeon Phi 7110P性能可移植性评估》被华东理工大学推荐为优秀毕业论文。以下是论文摘要:


GPU 加速器与协处理器是当前主流的两种异构加速设备,其最新代表产品分别为
NVIDIA 的 Tesla K20/K20X 与 Intel 的 Xeon Phi 3/5/7 系,它们都有着精良的设计却是基于完全不同的体系架构,这给应用的性能移植带来很大的挑战,对二者的实际计算能力与发展潜力的评估已经成为高性能计算领域争论的焦点。OpenACC 是一种跨平台基于指令的隐式编程模式,致力于为应用的硬件平台切换提供支持,它很有可能成为未来异构计算编程的主流模式。同时,OpenACC 在两种加速设备上有着良好的兼容性,基于OpenACC 的加速应用对二者性能的可移植性评估非常具有说服力。利用 OpenACC 对两种加速设备进行性能比较,综合评估二者性能表现,对于充分发挥不同设备的计算潜力以及提高应用的性能可移植性都有着重要意义。本次评测使用 Tesla K20 与 Xeon Phi 7110P,选取并实现了不同层级、不同粒度、不同侧重的测试用例,从多个层面综合评估这两种加速设备的性能,分析二者性能的可移植性,最后进一步讨论了如何根据应用的自身特点选择合适的加速设备。

关键词:OpenACC,性能移植,Tesla K20,Xeon Phi 7110P

 

论文下载

上一条:[本科毕设]异构集群上的全基因组聚类程序优化

Copyright ©2013 SJTU Network & Information Center All rights reserved.