多重分派 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅

tbb::parallel_sort （和标准库串行的 std::sort ）加速比： 4.80 倍重新认识改进的并行缩并 • 其实之前提到“改进后的并行缩并”，也是一种分治法的思想：大问题一分为二变成小问题，分派到各个 CPU 核心上，问题足够小时直接串行求解。 • 他也可以通过 parallel_invoke 分治来实现：第 9 章：流水线并行案例：批量处理数据注意到这里的 for (auto

0 码力 | 116 页 | 15.85 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 09 CUDA C++ 流体仿真实战

迭代因为需要写入 pre 的同时读取 pre ，所以也要用双缓冲。投影部分：计算未消除的散度为了评估效果的好坏，额外加一个计算散度方差的核函数，看看是不是无散度（不可压缩流）了。多重网格法投影部分：多重网格实现投影部分：红黑高斯投影部分：计算残差投影部分：缩小一倍投影部分：清零数组投影部分：扩大一倍创建与导出主函数：创建场景导出 VDB ：调用接口导出

0 码力 | 58 页 | 14.90 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

GPU 红黑高斯 + 多重网格实战 • 继续锐评黄某勋 • 感兴趣的扣 1 • OpenMP 新特性（ parallel for 之外的） • SIMD 指令全解析（ mm 开头那堆） • 内存与缓存优化进阶（第七课的延伸） • 二分查找法优化案例（针对缓存行的） • eigen 、 glm 、 vectorclass 等常用库（可能） • CPU 红黑高斯 + 多重网格实战 • 继续锐评因特尔

0 码力 | 142 页 | 13.52 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

= “hel” • “hello”.substr(99, 3) = 抛出 std::out_of_range 异常 substr 切下一段子字符串 find 寻找子字符串 • find 拥有众多重载，我们一个个来看。 • size_t find(char c, size_t pos = 0) const noexcept; • size_t find(string_view svt, size_t 操作来去除开头的任意部分，所以要让 len 控制尾部的部分；而 string 类型可以自身进行 resize 操作来去除尾部的任意部分，所以用 len 控制开头的部分。 • 为了一点点破性能，弄这么多重载，不过这些都已经无所谓了，因为 C++17 中有更为直观的 string_view ，要切片只需 substr ，例如： • s.append(“world”, 3) 改成 s += string_view(“world”)

0 码力 | 162 页 | 40.20 MB | 1 年前
3

共 4 条前往

页

C++高性性能高性能并行编程优化课件 06 09 08 15

分类

语言

格式

C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅

C++高性能并行编程与优化 - 课件 - 09 CUDA C++ 流体仿真实战

C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串