C++高性能并行编程与优化 - 课件 - 09 CUDA C++ 流体仿真实战度的特点: div v = 0 • 上式对时间求导,即 d(div v)/dt = div dv/dt = 0 ;带入 dv/dt = -p 得 div grad p = 0 。 • 因此为了模拟不可压缩流我们要求保证 p 满足 div grad p = 0 ? • 不妨假设现在 div v ≠ 0 ,然后想办法如何通过修正压强来消除他,即让 div grad p = -div v 。0 码力 | 58 页 | 14.90 MB | 1 年前3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程--use_fast_math 选项,那么所有对 sinf 的调用都会自动被替换成 __sinf 。 • --ftz=true 会把极小数 (denormal) 退化为 0 。 • --prec-div=false 降低除法的精度换取速度。 • --prec-sqrt=false 降低开方的精度换取速度。 • --fmad 因为非常重要,所以默认就是开启的, 会自动把 a * b + c 优化成乘加0 码力 | 142 页 | 13.52 MB | 1 年前3
共 2 条
- 1













