书目

高性能计算技术丛书:并行编程方法与优化实践

内容简介

《高性能计算技术丛书:并行编程方法与优化实践》是“并行计算与性能优化”系列的第2本,主要讲解了如何利用主流的C语言向量化扩展和并行库在X86、ARM和GPU平台上向量化代码,使软件开发人员跳出烦琐的Intel和ARM参考资料(通常无示例),了解其概要。第1本和第3本则涵盖了并行优化和并行计算相关的理论、算法设计及高层次的实践经验,以及科学计算与企业级应用的并行优化等重要主题,这些内容被许多顶级开发人员视为“不传之秘”。本书作者是国内顶尖的并行计算专家,曾任英伟达并行计算工程师和百度在线高级研发工程师,在该领域的经验和修为极为深厚,他毫不吝啬地将自己多年的积累呈现在了这3本书中,得到了百度深度学习研究院“杰出科学家”吴韧的高度评价和强烈推荐。《高性能计算技术丛书:并行编程方法与优化实践》8章,逻辑上分为四大部分:代码向量化优化本部分主要介绍常见的C语言的向量化库,主要是X86平台和ARM平台的向量化扩展,如IntelSSE/AVX指令集和ARMNEON指令集。并行程序设计语言本部分主要介绍目前主流的并行程序设计语言OpenMP、CUDA、OpenCL及OpenACC的并行编程语言或扩展的细节。主流的并行硬件平台的平台映射本部分主要介绍IntelHaswell、ARMA15、AMDGCNGPU和NVIDIAKepler/MaxwellGPU的架构及OpenCL程序如何在这些硬件上执行并行程序的映射。常见简单应用的向量化和并行化本部分主要介绍如何使用SSE/AVX、ARMNEON、OpenMP和CUDA等向量化扩展和并行语言来优化图像处理、线性代数应用的性能。

作者简介

刘文志,花名风辰,毕业于中国科学院研究生院,闻名于并行计算江湖,尤善异构并行计算(X86、ARM、GPU、APU、PHI)和大规模集群计算相关技术,有7年相关经验,涉及图像处理、计算机视觉、数据挖掘和石油勘探。曾任英伟达并行计算工程师(协助建立英伟达北京CUDA团队)、百度在线高级研发工程师(协助建立百度深度学习实验室异构计算团队)。

目录

丛书

高性能计算技术丛书

—  END  —