C++高性能并行编程与优化 -  课件 - 06  TBB 开启的并行编程之旅tbb::parallel_sort (和标准库串行的 std::sort )加速比: 4.80 倍 重新认识改进的并行缩并 • 其实之前提到“改进后的并行缩并”,也是一 种分治法的思想:大问题一分为二变成小 问题,分派到各个 CPU 核心上,问题足够 小时直接串行求解。 • 他也可以通过 parallel_invoke 分治来实现 : 第 9 章:流水线并行 案例:批量处理数据 注意到这里的 for (auto0 码力 | 116 页 | 15.85 MB | 1 年前3
 C++高性能并行编程与优化 -  课件 - 09 CUDA C++ 流体仿真实战迭代因为需要写入 pre 的同时读取 pre ,所以也要用双缓冲。 投影部分:计算未消除的散度 为了评估效果的好坏,额外加一个计算散度方差的核函数,看看是不是无散度(不可压缩流)了。 多重网格法 投影部分:多重网格实现 投影部分:红黑高斯 投影部分:计算残差 投影部分:缩小一倍 投影部分:清零数组 投影部分:扩大一倍 创建与导出 主函数:创建场景 导出 VDB :调用接口 导出0 码力 | 58 页 | 14.90 MB | 1 年前3
 C++高性能并行编程与优化 -  课件 - 08 CUDA 开启的 GPU 编程GPU 红黑高斯 + 多重网格实战 • 继续锐评黄某勋 • 感兴趣的扣 1 • OpenMP 新特性( parallel for 之外的) • SIMD 指令全解析( mm 开头那堆) • 内存与缓存优化进阶(第七课的延伸) • 二分查找法优化案例(针对缓存行的) • eigen 、 glm 、 vectorclass 等常用库(可能) • CPU 红黑高斯 + 多重网格实战 • 继续锐评因特尔0 码力 | 142 页 | 13.52 MB | 1 年前3
 C++高性能并行编程与优化 -  课件 - 15 C++ 系列课:字符与字符串= “hel” • “hello”.substr(99, 3) = 抛出 std::out_of_range 异常 substr 切下一段子字符串 find 寻找子字符串 • find 拥有众多重载,我们一个个来看。 • size_t find(char c, size_t pos = 0) const noexcept; • size_t find(string_view svt, size_t 操作来去除开头的 任意部分,所以要让 len 控制尾部的部分;而 string 类型可以自 身进行 resize 操作来去除尾部的任意部分,所以用 len 控制开头 的部分。 • 为了一点点破性能,弄这么多重载,不过这些都已经无所谓了,因 为 C++17 中有更为直观的 string_view ,要切片只需 substr ,例 如: • s.append(“world”, 3) 改成 s += string_view(“world”)0 码力 | 162 页 | 40.20 MB | 1 年前3
共 4 条
- 1
 













