声明文件 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 01 学 C++ 从 CMake 学起

a.out 这个文件中，（称为可执行文件）。 • > ./a.out • 之后执行该命令，操作系统会读取刚刚生成的可执行文件，从而执行其中编译成机器码，调用系统提供的 printf 函数，并在终端显示出 Hello, world 。厂商 C C++ Fortran GNU gcc g++ gfortran LLVM clang clang++ flang 多文件编译与链接 • 单文件编译虽然方便，但也有如下缺点：单文件编译虽然方便，但也有如下缺点： 1. 所有的代码都堆在一起，不利于模块化和理解。 2. 工程变大时，编译时间变得很长，改动一个地方就得全部重新编译。 • 因此，我们提出多文件编译的概念，文件之间通过符号声明相互引用。 • > g++ -c hello.cpp -o hello.o • > g++ -c main.cpp -o main.o • 其中使用 -c 选项指定生成临时的对象文件选项指定生成临时的对象文件 main.o ，之后再根据一系列对象文件进行链接，得到最终的 a.out ： • > g++ hello.o main.o -o a.out 为什么需要构建系统（ Makefile ） • 文件越来越多时，一个个调用 g++ 编译链接会变得很麻烦。 • 于是，发明了 make 这个程序，你只需写出不同文件之间的依赖关系，和生成各文件的规则。 • > make a.out •

0 码力 | 32 页 | 11.40 MB | 1 年前
3
《深入浅出MFC》2/e

1 《深入浅出MFC》2/e 电子书开放自由下载声明致亲爱的大陆读者我是侯捷（侯俊杰）。自从华中理工大学于1998/04 出版了我的《深入浅出MFC》 1/e 简体版（易名《深入浅出Windows MFC 程序设计》）之后，陆陆续续我收到了许多许多的大陆读者来函。其中对我的赞美、感谢、关怀、殷殷垂询，让我非常感动。《深入浅出MFC》2/e 早已于1998/05 于台湾出版。之所以迟迟没有授权给大题大家可以对照原文比较一下。 3. 附录、无责任书评那个文件没有转(估计看到那个地方的时候，你手里也该有一本纸板的了)。 2 因此，此书虽已出版两年，鉴于仍具阅读与技术上的价值，鉴于繁简转译制作上的费时费工，鉴于我对同胞的感情，我决定开放此书内容，供各位免费阅读。我已为《深入浅出MFC 》2/e 制作了PDF 格式之电子文件，放在 http://www.jjhou.com 供自由下载。北京http://expert net/jjhou 有侯捷网站的一个GBK mirror，各位也可试着自该处下载。我所做的这份电子书是繁体版，我没有精力与时间将它转为简体。这已是我能为各位尽力的极限。如果（万一）您看不到文件内容，可能与字形的安装有关- 虽然我已尝试内嵌字形。anyway，阅读方面的问题我亦没有精力与时间为您解决。请各位自行开辟讨论区，彼此交换阅读此电子书的solution。请热心的读者告诉我

0 码力 | 1009 页 | 11.08 MB | 1 年前
3
现代C++ 教程：高速上手C++11/14/17/20

(hi[at]changkun.de) 最后更新 2023 年 5 月 7 日- ff6ee89 注意此 PDF 的内容可能过期，请检查本书网站以及 GitHub 仓库以获取最新内容。版权声明本书系欧长坤著，采用“知识共享署名-非商业性使用-禁止演绎 4.0 国际许可协议 (CC BY-NC-ND)”进行许可。https://creativecommons.org/licenses/by-nc-nd/4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 if/switch 变量声明强化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 初始化列表 . . . . . 进一步阅读的参考资料 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 第 8 章文件系统 75 8.1 文档与链接 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

0 码力 | 83 页 | 2.42 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

里直接加你的 .cu 文件，和 .cpp 一样。 https://www.nvidia.cn/docs/IO/51635/NVIDIA_CUDA_Programming_Guide_1.1_chs.pdf CUDA 编译器兼容 C++17 • CUDA 的语法，基本完全兼容 C++ 。包括 C+ +17 新特性，都可以用。甚至可以把任何一个 C++ 项目的文件后缀名全部改成 .cu ，都能编 CUDA 的一大好处， CUDA 和 C++ 的关系就像 C++ 和 C 的关系一样，大部分都兼容，因此能很方便地重用 C++ 现有的任何代码库，引用 C++ 头文件等。 • host 代码和 device 代码写在同一个文件内，这是 OpenCL 做不到的。编写一段在 GPU 上运行的代码 • 定义函数 kernel ，前面加上 __global__ 修饰符，即可让他在 GPU device ； device 可以调用 device 。声明为内联函数 • 注意， inline 在现代 C++ 中的效果是声明一个函数为 weak 符号，和性能优化意义上的内联无关。 • 优化意义上的内联指把函数体直接放到调用者那里去。 • 因此 CUDA 编译器提供了一个“私货”关键字： __inline__ 来声明一个函数为内联。不论是 CPU 函数还是 GPU 都可以使

0 码力 | 142 页 | 13.52 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 03 现代 C++ 进阶：模板元编程

作为虚函数。然后定义： Numeric *twice(Numeric *t) { return t->multiply(2); } 且不说这样的性能问题，你忍得住寂寞去重复定义好几个，然后每个运算符都要声明一个纯虚函数吗？而且， Float 的乘法应该是 multiply(float) ，你也去定义好几个重载吗？定义为 multiply(Numeric *) 的话依然会违背你们的开 - 闭原则：比如模板参数：整数也可以作为参数 • template • 可以声明类型 T 作为模板尖括号里的参数。除了类型，任意整数也可以作为模板参数： • template • 来声明一个整数 N 作为模板参数。 • 不过模板参数只支持整数类型（包括 enum ）。 • 浮点类型、指针类型，不能声明为模板参数。自定义类型也不可以，比如： • template 文件里。 • 但也正因如此，如果过度使用模板，会导致生成的二进制文件大小剧增，编译变得很慢等。 boost 编译慢的原因找到了……因为他们用了大量的模板。模板的应用：编译期优化案例 • 在右边这个案例中，我们声明了一个 sumto 函数，作用是求出从 1 到 n 所有数字的和。 • 用一个

0 码力 | 82 页 | 12.15 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 16 现代 CMake 模块化项目管理指南

com/263032155 找不到头文件怎么办呀 CMake Cookbook 小彭老师建议 : ~~-·~·~-·~ -~·-·~·- 第一章：文件 / 目录组织规范基于 CMake 的 C/C++ 项目，如何优雅地、模块化地组织大量源文件？推荐的目录组织方式 • 目录组织格式： • 项目名 /include/ 项目名 / 模块名 .h • 项目名 /src/ 模块名 .cpp ries( 项目名 PUBLIC include) • 源码文件中写： • #include < 项目名 / 模块名 .h> • 项目名 :: 函数名 (); 完整案例请看源码仓库： https://github.com/parallel101/course/tree/master/16/00 推荐的目录组织方式 • 头文件（项目名 /include/ 项目名 / 模块名 .h ）中写：）中写： • #pragma once • namespace 项目名 { • void 函数名 (); • } • 实现文件（项目名 /src/ 模块名 .cpp ）中写： • #include < 项目名 / 模块名 .h> • namespace 项目名 { • void 函数名 () { 函数实现 } • } 完整案例请看源码仓库： https://github.com/pa

0 码力 | 56 页 | 6.87 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化

写，即函数链接表。链接器会查找其他 .o 文件中是否定义了 _Z5otheri 这个符号，如果定义了则把这个 @PLT 替换为他的地址。对 PLT 感兴趣？看 https://www.cnblogs.com/pannengzhi/p/2018-04-09-about-got-plt.html 编译器优化： call 变 jmp 多个函数定义在同一个文件中如果 _Z5otheri 定义在同一个文件中，编译器会直接调用，没有只有定义在同一个文件的函数可以被内联！否则编译器看不见函数体里的内容怎么内联呢？为了效率我们可以尽量把常用函数定义在头文件里，然后声明为 static 。这样调用他们的时候编译器看得到他们的函数体，从而有机会内联。内联：当编译器看得到被调用函数（ other ）实现的时候，会直接把函数实现贴到调用他的函数（ func ）里。局部可见函数： static 因为 static 声明表示不会暴露给其他文件，而且 func 也已经内联了 other ，所以编译器干脆不定义 other 了。 inline 关键字？不需要！编译的结果完全一致？结论：在现代编译器的高强度优化下，加不加 inline 无所谓编译器不是傻子，只要他看得见 other 的函数体定义，就会自动内联内联与否和 inline 没关系，内联与否只取决于是否在同文件，且函数体够小要性能的，定义在头文件声明为 static

0 码力 | 108 页 | 9.47 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - Zeno 中的现代 C++ 最佳实践

拷贝，然后对对象本身和他的拷贝都调用一次 eatFood 虚函数。 • 代码如下，这要怎么个封装法呢？你可能会想，是不是可以把拷贝构造函数也声明为虚函数，这样就能实现了拷贝的多态？不行，因为 C++ 规定“构造函数不能是虚函数”。模板函数？未免有些差强人意 • 索性把 eatTwice 声明为模板函数的确能解决问题，但模板函数不是面向对象的思路，并且如果 cat 和 dog 是在一个 IObject 的指针里就会编译出错，例如右图的带有构造函数和解构函数的类 • 实际上，只需定义一个带有构造函数和解构函数的类（这里的 Helper ），然后一个声明该类的全局变量（ helper ），就可以保证： • 1. 该类的构造函数一定在 main 之前执行 • 2. 该类的解构函数一定在 main 之后执行 • 该技巧可用于在程序退出时删除某些文件之类。 • 这就是小彭老师的静态初始化 (static-init) 大法。静态初始化用于批量注册函数访问到他们，从而 catFunc 和 dogFunc 甚至不需要在头文件里声明（只需要他们的函数签名一样即可放入 function 容器）。静态初始化的顺序是符号定义的顺序决定的，若在不同文件则顺序可能打乱 • 你可能已经兴冲冲地把 dogFunc 和 catFunc 挪到另一个文件，然后把 functab 声明为 extern std::map<...> functab;

0 码力 | 54 页 | 3.94 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理
封装。 • 各个成员之间相互正交，比如数学矢量类 Vec3 ，就没必要去搞封装，只会让程序员变得痛苦，同时还有一定性能损失：特别是如果 getter/setter 函数分离了声明和定义，实现在另一个文件时！ C++ 思想： RAII （ Resource Acquisition Is Initialization ）资源获取视为初始化，反之，资源释放视为销毁 C++ 除了用于初始化的构造函数（如果想要让编译器不要自动生成拷贝构造函数，可以用 = delete 语法删除： • 注： = delete 和 = default 是一对。如果你不确定某个函数有没有被编译器默认生成，可以都用这两个显式地声明一下。编译器默认生成的特殊函数：拷贝赋值函数 • 除了拷贝构造函数外，编译器默认还会生成这样一个重载’ =’ 这个运算符的函数： • Pig &operator=(Pig const &other); ，但是对应着某种资源 • std::vector
objs; // STL 容器，但存了不安全的对象成员都是安全的类型：五大函数，一个也不用声明 • 如果你的类所有成员，都是安全的类型，那么五大函数都无需声明（或声明为 = default ），你的类自动就是安全的。 • 最好的判断方式是：如果你不需要自定义的解构函数，那么这个类就不需要担心。 • 因为如果用到了自定义解构函数，往往意味着你的类
0 码力 | 96 页 | 16.28 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

解决办法就是，我们也用 stream 指令，这样就可以和标准库优化过的 memset 一样快了。 Intel Intrinsics Guide • _mm 系列指令出自头文件。 • 指令的文档可以看这个网站： • https://www.intel.com/content/www/us/en/docs/intrinsics-guide/index.html • 里标准库的 new 和 malloc ：只保证 16 字节对齐 • 还有 _mm_malloc(n, aalign) 可以分配对齐到任意 a 字节的内存。他在这个头文件里。是 x86 特有的，并且需要通过 _mm_free 来释放。 • 还有一个跨平台版本（比如用于 arm 架构）的 aligned_alloc(align, n) ，他也可以分配对齐到任意对齐，他底层也是基于 aligned_alloc 实现的。案例：临时创建的数组 • 临时创建的数组，每次调用 func 都会重复内存分配一次（进入一次内核态），非常浪费时间。解决：手动池化 • 声明为 static 变量，这样第二次进入 func 的时候还是同一个数组，不需要重复分配内存。 thread_local 表示如有多个线程，每个线程保留一个 tmp 对象的副本，防止多线程调用

0 码力 | 147 页 | 18.88 MB | 1 年前
3
共 28 条
- 1
- 2
- 3
前往
页
相关搜索词
C++高性性能高性能并行编程优化课件 01 深入深入浅出MFC 现代教程高速上手 11 14 17 20 08 03 16 04 02 07
关于我们文库协议联系我们意见反馈免责声明

本站文档数据由用户上传或本站整理自互联网，不以营利为目的，供所有人免费下载和学习使用。如侵犯您的权益，请联系我们进行删除。

IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70

分类

语言

格式

C++高性能并行编程与优化 - 课件 - 01 学 C++ 从 CMake 学起

《深入浅出MFC》2/e

现代C++ 教程：高速上手C++11/14/17/20

C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

C++高性能并行编程与优化 - 课件 - 03 现代 C++ 进阶：模板元编程

C++高性能并行编程与优化 - 课件 - 16 现代 CMake 模块化项目管理指南

C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化

C++高性能并行编程与优化 - 课件 - Zeno 中的现代 C++ 最佳实践

C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理

C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化