inline - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化

所以编译器干脆不定义 other 了。 inline 关键字？不需要！编译的结果完全一致？结论：在现代编译器的高强度优化下，加不加 inline 无所谓编译器不是傻子，只要他看得见 other 的函数体定义，就会自动内联内联与否和 inline 没关系，内联与否只取决于是否在同文件，且函数体够小要性能的，定义在头文件声明为 static 即可，没必要加 inline 的 static 纯粹是为了避免多个，不要脑内模拟 inline 在现代 C++ 中有其他含义，但和内联没有关系，他是一个迷惑性的名字 “ 大厂面试官”笑话 • 同样沦为笑柄的还有 register 关键字，号称：可以让一个变量使用寄存器存储，更高效。 • 都能把等差数列求和优化成 5050 的编译器笑着看着你，说道：还要你提醒吗？ • 所以，如果某“面试官”试图“考考”你 register 和 inline 的所谓“优化技巧”，你直接把小彭

0 码力 | 108 页 | 9.47 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

device ； device 可以调用 device 。声明为内联函数 • 注意， inline 在现代 C++ 中的效果是声明一个函数为 weak 符号，和性能优化意义上的内联无关。 • 优化意义上的内联指把函数体直接放到调用者那里去。 • 因此 CUDA 编译器提供了一个“私货”关键字： __inline__ 来声明一个函数为内联。不论是 CPU 函数还是 GPU 都可以使用，只要你用的编译器相应的私货则是 __attribute__((“inline”)) 。 • 注意声明为 __inline__ 不一定就保证内联了，如果函数太大编译器可能会放弃内联化。因此 CUDA 还提供 __forceinline__ 这个关键字来强制一个函数为内联。 GCC 也有相应的 __attribute__((“always_inline”)) 。 • 此外，还有 __noinline__

0 码力 | 142 页 | 13.52 MB | 1 年前
3
Working with Asynchrony Generically: A Tour of C++ Executors

compute = [=](int i) -> unifex::task { co_await ex::schedule(sched) | unifex::complete_inline(); co_return compute_intensive(i); }; ex::sender auto work = ex::when_all(compute(0) ctrl_c_handler { struct pending { virtual void complete() = 0; virtual ~pending() {} }; static inline std::atomic pending_{nullptr}; static BOOL WINAPI consoleHandler(DWORD signal) {

0 码力 | 121 页 | 7.73 MB | 6 月前
3
C++高性能并行编程与优化 - 课件 - 03 现代 C++ 进阶：模板元编程

里都可以在编译期求值，将他前面也标上 constexpr 即可。 • 注意： constexpr 函数不能调用 non-constexpr 函数。而且 constexpr 函数必须是内联（ inline ）的，不能分离声明和定义在另一个文件里。标准库的很多函数如 std::min 也是 constexpr 函数，可以放心大胆在模板尖括号内使用。模板的难题：移到另一个文件中定义 • 如果

0 码力 | 82 页 | 12.15 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 16 现代 CMake 模块化项目管理指南

七、只有头文件，没有源文件的情况 • 有时我们会直接把实现直接写在头文件里，这时可以没有与之对应的源文件，只有一个头文件。 • 注意：在头文件里直接实现函数时，要加 static 或 inline 关键字。八、每新增一个功能模块，需要创建两个文件 • 添加一个新功能模块 Carer 时，同时添加同名的源文件和头文件。 • 头文件中的声明和源文件中的实现一一对应。九、一个模块依赖其他模块，则应导入他的头文件

0 码力 | 56 页 | 6.87 MB | 1 年前
3

共 5 条前往

页

C++高性性能高性能并行编程优化课件 04 08 Working with Asynchrony Generically Tour of Executors 03 16

分类

语言

格式

C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化

C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

Working with Asynchrony Generically: A Tour of C++ Executors

C++高性能并行编程与优化 - 课件 - 03 现代 C++ 进阶：模板元编程

C++高性能并行编程与优化 - 课件 - 16 现代 CMake 模块化项目管理指南