当前位置:首页>正文

大规模并行处理器程序设计(英文版 原书第3版) azw3 下载 fb2 在线 docx 2025 pdf kindle

免费下载书籍地址:PDF下载地址

精美图片

大规模并行处理器程序设计(英文版 原书第3版)书籍详细信息

  • ISBN:9787111668367
  • 作者:暂无作者
  • 出版社:暂无出版社
  • 出版时间:2023-02
  • 页数:568
  • 价格:136.20
  • 纸张:胶版纸
  • 装帧:平装-胶订
  • 开本:16开
  • 语言:未知
  • 丛书:暂无丛书
  • TAG:暂无
  • 豆瓣评分:暂无豆瓣评分

寄语:

并行编程领域之作,被图灵奖得主David Patterson誉为“天赐之书”,并被UIUC、MIT等名校用作教材

内容简介:

本书介绍并行编程和GPU架构的基本概念,详细探索了构建并行程序的各种技术,涵盖性能、浮点格式、并行模式和动态并行等主题,适合专业人士及学生阅读。书中通过案例研究展示了开发过程,从计算思维的细节着手,*终给出了高效的并行程序示例。新版更新了关于CUDA的讨论,包含CuDNN等新的库,同时将不再重要的内容移到附录中。新版还增加了关于并行模式的两个新章节,并更新了案例研究,以反映当前的行业实践。

书籍目录:

Preface Acknowledgements

CHAPTER.1 Introduction.1

1.1 Heterogeneous Parallel Computing..2

1.2 Architecture of a Modern GPU.6

1.3 Why More Speed or Parallelism?.8

1.4 Speeding Up Real Applications..10

1.5 Challenges in Parallel Programming ..12

1.6 Parallel Programming Languages and Models.12

1.7 Overarching Goals..14

1.8 Organization of the Book..15

References ..18

CHAPTER.2 Data Parallel Computing.19

2.1 Data Parallelism..20

2.2 CUDA C Program Structure.22

2.3 A Vector Addition Kernel .25

2.4 Device Global Memory and Data Transfer.27

2.5 Kernel Functions and Threading.32

2.6 Kernel Launch.37

2.7 Summary.38

Function Declarations.38

Kernel Launch.38

Built-in (Predefined) Variables .39

Run-time API..39

2.8 Exercises.39

References ..41

CHAPTER.3 Scalable Parallel Execution..43

3.1 CUDA Thread Organization.43

3.2 Mapping Threads to Multidimensional Data..47

3.3 Image Blur: A More Complex Kernel ..54

3.4 Synchronization and Transparent Scalability .58

3.5 Resource Assignment..60

3.6 Querying Device Properties..61

3.7 Thread Scheduling and Latency Tolerance.64

3.8 Summary.67

3.9 Exercises.67

CHAPTER.4 Memory and Data Locality .71

4.1 Importance of Memory Access Efficiency..72

4.2 Matrix Multiplication..73

4.3 CUDA Memory Types..77

4.4 Tiling for Reduced Memory Traffic..84

4.5 A Tiled Matrix Multiplication Kernel.90

4.6 Boundary Checks..94

4.7 Memory as a Limiting Factor to Parallelism..97

4.8 Summary.99

4.9 Exercises.100

CHAPTER.5 Performance Considerations.103

5.1 Global Memory Bandwidth..104

5.2 More on Memory Parallelism.112

5.3 Warps and SIMD Hardware..117

5.4 Dynamic Partitioning of Resources..125

5.5 Thread Granularity..127

5.6 Summary.128

5.7 Exercises.128

References ..130

CHAPTER.6 Numerical Considerations .131

6.1 Floating-Point Data Representation..132

Normalized Representation of M..132

Excess Encoding of E .133

6.2 Representable Numbers..134

6.3 Special Bit Patterns and Precision in IEEE Format..138

6.4 Arithmetic Accuracy and Rounding .139

6.5 Algorithm Considerations.140

6.6 Linear Solvers and Numerical Stability..142

6.7 Summary.146

6.8 Exercises.147

References ..147

CHAPTER.7 Parallel Patterns: Convolution .149

7.1 Background.150

7.2 1D Parallel Convolution—A Basic Algorithm .153

7.3 Constant Memory and Caching..156

7.4 Tiled 1D Convolution with Halo Cells.160

7.5 A Simpler Tiled 1D Convolution—General Caching.165

7.6 Tiled 2D Convolution with Halo Cells.166

7.7 Summary.172

7.8 Exercises.173

CHAPTER.8 Parallel Patterns: Prefix Sum..175

8.1 Background.176

8.2 A Simple Parallel Scan.177

8.3 Speed and Work Efficiency.181

8.4 A More Work-Efficient Parallel Scan.183

8.5 An Even More Work-Efficient Parallel Scan..187

8.6 Hierarchical Parallel Scan for Arbitrary-Length Inputs..189

8.7 Single-Pass Scan for Memory Access Efficiency.192

8.8 Summary.195

8.9 Exercises.195

References ..196

CHAPTER.9 Parallel Patterns Parallel Histogram Computation .. 199

9.1 Background.200

9.2 Use of Atomic Operations ..202

9.3 Block versus Interleaved Partitioning.206

9.4 Latency versus Throughput of Atomic Operations.207

9.5 Atomic Operation in Cache Memory .210

9.6 Privatization..210

9.7 Aggregation ..211

9.8 Summary.213

9.9 Exercises.213

Reference..214

CHAPTER.10 Parallel Patterns: Sparse Matrix Computation .215

10.1 Background..216

10.2 Parallel SpMV Using CSR.219

10.3 Padding and Transposition.221

10.4 Using a Hybrid Approach to Regulate Padding.224

10.5 Sorting and Partitioning for Regularization.227

10.6 Summary..229

10.7 Exercises..229

References ..230

CHAPTER.11 Parallel Patterns: Merge Sort.231

11.1 Background..231

11.2 A Sequential Merge Algorithm..233

11.3 A Parallelization Approach..234

11.4 Co-Rank Function Implementation..236

Contents

11.5 A Basic Parallel Merge Kernel ..241

11.6 A Tiled Merge Kernel..242

11.7 A Circular-Buffer Merge Kernel..249

11.8 Summary..256

11.9 Exercises..256

Reference.

作者介绍:

大卫·B. 柯克(David B. Kirk) 美国国家工程院院士,NVIDIA Fellow,曾任NVIDIA公司首席科学家。他领导了NVIDIA图形技术的开发,并且是CUDA技术的创始人之一。2002年,他荣获ACM SIGGRAPH计算机图形成就奖,以表彰其在把高性能计算机图形系统推向大众市场方面做出的杰出贡献。他拥有加州理工学院计算机科学博士学位。

胡文美(Wen-mei W. Hwu) 美国伊利诺伊大学厄巴纳-香槟分校电气与计算机工程系AMD Jerry Sanders讲席教授,并行计算研究中心首席科学家,领导IMPACT团队和CUDA卓越中心的研究工作。他在编译器设计、计算机体系结构、微体系结构和并行计算方面做出了卓越贡献,是IEEE Fellow、ACM Fellow,荣获了包括ACM SigArch Maurice Wilkes Award在内的众多奖项。他还是MulticoreWare公司的联合创始人兼CTO。他拥有加州大学伯克利分校计算机科学博士学位。

出版社信息:

暂无出版社相关信息,正在全力查找中!

书籍摘录:

暂无相关书籍摘录,正在全力查找中!

在线阅读/听书/购买/PDF下载地址:

在线阅读地址:大规模并行处理器程序设计(英文版 原书第3版)在线阅读

在线听书地址:大规模并行处理器程序设计(英文版 原书第3版)在线收听

在线购买地址:大规模并行处理器程序设计(英文版 原书第3版)在线购买

原文赏析:

暂无原文赏析,正在全力查找中!

其它内容:

书籍介绍

本书介绍并行编程和GPU架构的基本概念,详细探索了构建并行程序的各种技术,涵盖性能、浮点格式、并行模式和动态并行等主题,适合专业人士及学生阅读。书中通过案例研究展示了开发过程,从计算思维的细节着手,最终给出了高效的并行程序示例。新版更新了关于CUDA的讨论,包含CuDNN等新的库,同时将不再重要的内容移到附录中。新版还增加了关于并行模式的两个新章节,并更新了案例研究,以反映当前的行业实践。

书籍真实打分

故事情节:5分

人物塑造:7分

主题深度:9分

文字风格:7分

语言运用:3分

文笔流畅:6分

思想传递:8分

知识深度:8分

知识广度:3分

实用性:8分

章节划分:7分

结构布局:9分

新颖与独特:9分

情感共鸣:6分

引人入胜:9分

现实相关:7分

沉浸感:6分

事实准确性:4分

文化贡献:6分

网站评分

书籍多样性:4分

书籍信息完全性:5分

网站更新速度:7分

使用便利性:8分

书籍清晰度:3分

书籍格式兼容性:5分

是否包含广告:5分

加载速度:5分

安全性:9分

稳定性:9分

搜索功能:5分

下载便捷性:5分

下载点评

  • 内容齐全(504+)
  • 种类多(628+)
  • 一星好评(81+)
  • 下载快(296+)
  • 差评少(177+)
  • 情节曲折(293+)
  • 速度快(447+)
  • 傻瓜式服务(374+)
  • 无缺页(164+)
  • 藏书馆(631+)
  • 服务好(386+)

下载评价

网友 通***蕊:五颗星、五颗星,大赞还觉得不错!~~

网友 田***珊:可以就是有些书搜不到

网友 菱***兰:特好。有好多书

网友 孙***夏:中评,比上不足比下有余

网友 石***烟:还可以吧,毕竟也是要成本的,付费应该的,更何况下载速度还挺快的

网友 瞿***香:非常好就是加载有点儿慢。

网友 訾***雰:下载速度很快,我选择的是epub格式

网友 丁***菱:好好好好好好好好好好好好好好好好好好好好好好好好好

网友 石***致:挺实用的,给个赞!希望越来越好,一直支持。

网友 印***文:我很喜欢这种风格样式。

网友 堵***洁:好用,支持

网友 宫***玉:我说完了。

网友 林***艳:很好,能找到很多平常找不到的书。

网友 方***旋:真的很好,里面很多小说都能搜到,但就是收费的太多了

版权声明

1本文:大规模并行处理器程序设计(英文版 原书第3版)转载请注明出处。
2本站内容除签约编辑原创以外,部分来源网络由互联网用户自发投稿仅供学习参考。
3文章观点仅代表原作者本人不代表本站立场,并不完全代表本站赞同其观点和对其真实性负责。
4文章版权归原作者所有,部分转载文章仅为传播更多信息服务用户,如信息标记有误请联系管理员。
5本站一律禁止以任何方式发布或转载任何违法违规的相关信息,如发现本站上有涉嫌侵权/违规及任何不妥的内容,请第一时间联系我们申诉反馈,经核实立即修正或删除。


本站仅提供信息存储空间服务,部分内容不拥有所有权,不承担相关法律责任。

相关文章:

  • 初一-初中生心理自护 azw3 下载 fb2 在线 docx 2025 pdf kindle
  • 免疫学基础 azw3 下载 fb2 在线 docx 2025 pdf kindle
  • 实验设计和分析,狄恩著,世界图书出版公司,9787510005619 azw3 下载 fb2 在线 docx 2025 pdf kindle
  • Sepsis azw3 下载 fb2 在线 docx 2025 pdf kindle
  • 教材解读三年级上册语文部编人教版 2023秋小学教材解析三年级上 azw3 下载 fb2 在线 docx 2025 pdf kindle
  • 史记·前四史 azw3 下载 fb2 在线 docx 2025 pdf kindle
  • 数学期中期末满分冲刺卷 azw3 下载 fb2 在线 docx 2025 pdf kindle
  • 少女与霓裳 azw3 下载 fb2 在线 docx 2025 pdf kindle
  • 疫警时空 azw3 下载 fb2 在线 docx 2025 pdf kindle
  • 陶行知生活教育导读 azw3 下载 fb2 在线 docx 2025 pdf kindle