发布说明 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 16 现代 CMake 模块化项目管理指南

• （用于伺候 Ubuntu 喜欢把库文件套娃在 /usr/lib/x86_64-linux-gnu 目录下） https://zhuanlan.zhihu.com/p/60479441 举例说明 find_package 搜索路径 • 例如你是 64 位的 Linux 系统， find_package(Qt5 REQUIRED) 会依次搜索： • /usr/lib/cmake/Qt5/Qt5Config cmake • /usr/Qt5/lib/x86_64-linux-gnu/Qt5/Qt5Config.cmake • /usr/Qt5/share/Qt5/Qt5Config.cmake 举例说明 find_package 搜索路径 • 例如你是 64 位的 Windows 系统， find_package(Qt5 REQUIRED) 会依次搜索： • C:/Program Files/Qt5Config Files/Qt5/lib/x86_64-windows-gnu/Qt5/Qt5Config.cmake • C:/Program Files/Qt5/share/Qt5/Qt5Config.cmake 举例说明 find_package 搜索路径 • 还有一点，可以有额外后缀，且不分大小写（无论 Linux 还是 Windows ），例如： • C:/Program Files/Qt5/cmake/Qt5Config

0 码力 | 56 页 | 6.87 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

上执行。 • 不过调用 kernel 时，不能直接 kernel() ，而是要用 kernel<<<1, 1>>>() 这样的三重尖括号语法。为什么？这里面的两个 1 有什么用？稍后会说明。 • 运行以后，就会在 GPU 上执行 printf 了。 • 这里的 kernel 函数在 GPU 上执行，称为核函数，用 __global__ 修饰的就是核函数。没有反应？同步一下！ kernel 好像没有执行过一样，只有 CPU 上的代码被执行了。指定多个版本号 • 可以指定多个版本号，之间用分号分割。 • 运行时可以自动选择最适合当前显卡的版本号，通常用于打包发布的时候。 • 不过这样会导致 GPU 编译器重复编译很多遍，每次针对不同的架构，所以编译会变得非常慢，生成的可执行文件也会变大。 • 通常在自己的电脑上用时，同学们只要根据自己显卡的指定一个版本号即可。中的特殊变量之一，只有在核函数里才可以访问。 • 可以看到线程编号从 0 开始计数，打印出了 0 ， 1 ， 2 。这也是我们指定了线程数量为 3 的缘故。 • 等等，为什么后面有个 .x ？稍后再说明。获取线程数量 • 还可以用 blockDim.x 获取当前线程数量，也就是我们在尖括号里指定的 3 。 • 可是为什么叫 blockDim ？我觉得应该叫 threadNum 才比较合理？

0 码力 | 142 页 | 13.52 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理

com 。（不要用 baidu.com ，那个是搜广告用的） • 如果感兴趣，我可以增添一节专门讲动态多态。回家作业！ • 已经发布到： https://github.com/parallel101/hw02 • 仓库的 README.md 里有详细的作业要求和说明。请按要求修改其中的代码，使得双向链表类 List 的拷贝构造函数能正常工作，且内存能够安全释放。 • 通过 pull request

0 码力 | 96 页 | 16.28 MB | 1 年前
3
Zadig 产品使用手册

优势传统 Jenkins 方案 GitLab + Jenkins + 脚本化运行效率低，管理维护成本高方案局限性大，安全性风险高无法支持敏捷交付模式支持从需求到发布全流程敏捷交付。尤其面向多服务并行部署发布，云原生构建环境和运行环境，基础设施对接及企业级 SSO/ 权限管理等运维管理类平台蓝鲸 Rainbond KubeSphere KubeVela 面向资源管理的运维工具集 Gitee 平台 GitLab 平台局限性大、全流程安全性低维护成本高支持多个服务并行构建部署、产品级发布，可灵活安全接入多个代码仓及周边工具链开发 Zadig 核心特性：运维真正意义的持续交付：以工程师体验为核心，价值交付为理念，完成需求到发布的全路径。测试发布洞察一堆复杂脚本、维护成本极高员工手工操作费时费力易出错手动更新服务、手动打包、交付付效率低下、占据大量研发时间层级越高、对产研状态越模糊管理低效、延误战机少量配置、快速拉起环境、稳定性有保障、减少 90% 手工操作、赋能开发、员工成就感高碎片化：手工协作 + 复杂工具链工程化：一个平台一键发布工作流、环境配置自动更新、高效调试、消除手工操作、精准快速迭代、研发生产力 / 幸福感提升自助运行、系统化管理、自动化程度高、测试有效性提升、质量有保障、横向赋能、技能提升随时调用工程基线提供的能力、

0 码力 | 52 页 | 22.95 MB | 1 年前
3
Zadig 面向开发者的云原生 DevOps 平台

代码编写 | 构建 | 测试 | 部署 | 发布服务二：设计 | 代码编写 | 构建 | 测试 | 部署 | 发布服务三：设计 | 代码编写 | 构建 | 测试 | 部署 | 发布以前：面向代码片段的串行交付现在：面向多个服务编排的产品级自动化并行交付构建 | 部署 | 测试 | 发布服务二：服务定义 | 构建 | 部署 | 测试 | 发布服务三：服务定义 | 构建 | 部署 | 测试 | 发布代码一：代码编写 | 构建 | 部署 | 测试 | 发布代码二：代码编写 | 构建 | 部署 | 测试 | 发布代码三：代码编写 | 构建 | 部署 | 测试 | 发布特点： ● 重复流程自动化 ● 边开发、边验证 ● 服务全生命周期而非只关注代码 ● 每天多次提交提早验证 Zadig 采用「云原生产品级交付」设计理念数字化产研协同 • 环境 -

0 码力 | 59 页 | 81.43 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 11 现代 CMake 进阶指南

（会安装到 /opt/openvdb-8.0/lib/libopenvdb.so ） • cmake -B build -DCMAKE_BUILD_TYPE=Release • ↑ 设置构建模式为发布模式（开启全部优化） • cmake -B build ← 第二次配置时没有 -D 参数，但是之前的 -D 设置的变量都会被保留 • （此时缓存里仍有你之前定义的 CMAKE_BUILD_TYPE CMAKE_BUILD_TYPE 构建的类型，调试模式还是发布模式 • CMAKE_BUILD_TYPE 是 CMake 中一个特殊的变量，用于控制构建类型，他的值可以是： • Debug 调试模式，完全不优化，生成调试信息，方便调试程序 • Release 发布模式，优化程度最高，性能最佳，但是编译比 Debug 慢 • MinSizeRel 最小体积发布，生成的文件比 Release 更小，不完全优化，减少二进制体积更小，不完全优化，减少二进制体积 • RelWithDebInfo 带调试信息发布，生成的文件比 Release 更大，因为带有调试的符号信息 • 默认情况下 CMAKE_BUILD_TYPE 为空字符串，这时相当于 Debug 。各种构建模式在编译器选项上的区别 • 在 Release 模式下，追求的是程序的最佳性能表现，在此情况下，编译器会对程序做最大的代码优化以达到最快运行速度。另一方

0 码力 | 166 页 | 6.54 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 14 C++ 标准库系列课 - 你所不知道的 set 容器

计算个数而不是直接返回 bool… 因为他们考虑到接口的泛用性，毕竟 multiset 就不去重。对于能去重的 set ， count 只可能返回 0 或 1 。 • 个数为 0 就说明集合中没有该元素。个数为 1 就说明集合中存在该元素。 • 因为 int 类型能隐式转换为 bool ，所以 != 0 可以省略不写。 • size_t count(int const &val) const; set 中删除指定元素 • set.erase(x) 可以删除集合中值为 x 的元素。 • erase 返回一个整数，表示被他删除元素的个数。 • 个数为 0 就说明集合中没有该元素，删除失败。 • 个数为 1 就说明集合中存在该元素，删除成功。 • 这里的“个数”和 count 的情况很像，因为 set 中不会有重复的元素，所以 erase 只可能返回 0 或 1 ，表示是否删除成功。

0 码力 | 83 页 | 10.23 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

写的数据，并标记为脏（ dirty ）。 • 当读和写创建的新条目过多，缓存快要塞不下时，他会把最不常用的那个条目移除，这个现象称为失效（ invalid ）。如果那个条目是被标记为脏的，则说明是当时打算写入的数据，那就需要向主内存发送写入请求，等他写入成功，才能安全移除这个条目。 • 如有多级缓存，则一级缓存失效后会丢给二级缓存。连续访问与跨步访问 • 如果访问数组时，按一定的间距跨步访问，则效率如何？缺点是必须保证数量是 1024 的整数倍，而且因为要两次指标索引，随机访问比较烦。 • 这里的 1024 并非随意选取，而是要让每个属性 SOA 数组的大小为一个页（ 4KB ）才能最高效，原因稍后会说明。 AOSOA ：注意，内部 SOA 的尺寸不宜太小如果内部 SOA 太小，内部循环只有 16 次连续的读取， 16 次结束后就会跳跃一段，然后继续连续的读取。这会导致 CPU 预取机制失效，无法预测下 • 指令的文档可以看这个网站： • https://www.intel.com/content/www/us/en/docs/intrinsics-guide/index.html • 里面有详细说明每个指令对应的汇编，方便理解的伪代码，延迟和花费的时钟周期等。第 4 章：循环合并法两个循环体 • 原始的代码第一个循环体执行 a[i] = a[i] * 2 ，等乘法全部结束了以后，再来一个循环体执行

0 码力 | 147 页 | 18.88 MB | 1 年前
3
谈谈MYSQL那点事

16G 16G 的服务器进行的合理设置的服务器进行的合理设置服务优化服务优化 MySQL MySQL 配置原则配置原则服务优化服务优化公共选项公共选项选项缺省值推荐值说明 max_connections 100 1024 MySQL 服务器同时处理的数据库连接的最大数量 query_cache_size 0 ( 不打开） 128M 查询缓存区的最大长度，按照当前需求，一为所有线程打开表的数量。增加该值能增加 mysqld 要求的文件描述符的数量。 MySQL 对每个唯一打开的表需要 2 个文件描述符。服务优化服务优化 MyISAM MyISAM 选项选项选项缺省值推荐值说明 key_buffer_size 8M 512M 用来存放索引区块的缓存值 , 建议 128M 以上，不要大于内存的 30% read_buffer_size 128K 64M 用来做 MyISAM myisam_sort_buffer_size 16M 128M 设置 , 恢复 , 修改表的时候使用的缓冲大小，值不要设的太大服务优化服务优化 InnoDB InnoDB 选项选项选项缺省值推荐值说明 innodb_buffer_pool_size 32M 10G InnoDB 使用一个缓冲池来保存索引和原始数据 , 这里你设置越大 , 你在存取表里面数据时所需要的磁盘 I/O 越少，一般是内存的一半，不超过

0 码力 | 38 页 | 2.04 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型

然而这样会严重影响性能，锁和原子多了，就根本并行不起来。教科书式的解决：二次判断法这样如果 block 已经非空，则可以不用上锁，减少上锁次数。如果 block 为空，则上锁；再次检测是否为空，空则分配内存，非空说明其他线程已经帮我分配好了，直接退出。结果反而还变慢了……所以有时候教科书（如 Concurrency in Action ）不一定就是完美解决方案，要根据实际情况判断。真正的解决： tbb::spin_mutex 定点数的好处：用 int16_t 表示 • 转成定点数的一大好处就是可以用任意大小的整数来存储。这样就节省了一半带宽，从而加速了 2 倍。能不能再小一点：用 int8_t 表示 • 发现结果不对了……说明 int8_t 太小了（可以容纳 - 128 到 127 ），容纳不下 97*100 这么大的数，发生了溢出导致结果错误。试图解决：用 uint8_t 表示，定点数系数调小到 2 • 注历史记录。如果发现用户写入的地址是他曾经 malloc 过的地址区间，则执行实际的内存分配，并标记该段内存为“可用”，下次访问就不会再产生缺页中断了；而如果用户写入的地址根本不是他 malloc 过的地址，那就说明他确实犯错了，就抛出段错误（ segmentation fault ）。 • 当一个尚且处于“不可用”的 malloc 过的区间被访问，操作系统不是把整个区间全部分配完毕，而是只把当前写入地址所在的页面（

0 码力 | 102 页 | 9.50 MB | 1 年前
3

共 19 条前往

页

C++高性性能高性能并行编程优化课件 16 08 02 Zadig 产品使用手册使用手册面向开发开发者原生 DevOps 平台 11 14 07 MySQL 10

分类

语言

格式

C++高性能并行编程与优化 - 课件 - 16 现代 CMake 模块化项目管理指南

C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理

Zadig 产品使用手册

Zadig 面向开发者的云原生 DevOps 平台

C++高性能并行编程与优化 - 课件 - 11 现代 CMake 进阶指南

C++高性能并行编程与优化 - 课件 - 14 C++ 标准库系列课 - 你所不知道的 set 容器

C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

谈谈MYSQL那点事

C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型