任务管理功能 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理

分为前半段和后半段，前半段主要介绍现代 C++ ，后半段主要介绍并行编程与优化。 1.课程安排与开发环境搭建： cmake 与 git 入门 2.现代 C++ 入门：常用 STL 容器， RAII 内存管理 3.现代 C++ 进阶：模板元编程与函数式编程 4.编译器如何自动优化：从汇编角度看 C++ 5.C++11 起的多线程编程：从 mutex 到无锁并行 6.并行编程常用框架： OpenMP 编译器默认生成的构造函数：拷贝构造函数 • 除了无参和初始化列表构造函数外，编译器默认还会生成这样一个特殊的构造函数： • Pig(Pig const &other); • 可见他的参数是一个 Pig 类型，他的功能就是拷贝 Pig 对象，故称为拷贝构造函数。 • 调用方式如下：拷贝构造函数：用户自定义 • 除了编译器可以自动生成拷贝构造函数外，如果有需要，用户也可以自定义拷贝构造函数。 • 比如：们来点（相对）简单的作为饭后甜点吧！ C++98 ：令人头疼的内存管理 • 在没有智能指针的 C++ 中，我们只能手动去 new 和 delete 指针。这非常容易出错，一旦马虎的程序员忘记释放指针，就会导致内存泄露等情况，更可能被黑客利用空悬指针篡改系统内存从而盗取重要数据等。 RAII 解决内存管理的问题： unique_ptr • 似曾相识的情形……是的，和我们刚刚提

0 码力 | 96 页 | 16.28 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 16 现代 CMake 模块化项目管理指南

现代 CMake 模块化项目管理指南彭于斌（ @archibate ）课件 & 源码： https://github.com/parallel101/course 往期录播： https://space.bilibili.com/263032155 找不到头文件怎么办呀 CMake Cookbook 小彭老师建议 : ~~-·~·~-·~ -~·-·~·- 第一章：文件 / 有时我们会直接把实现直接写在头文件里，这时可以没有与之对应的源文件，只有一个头文件。 • 注意：在头文件里直接实现函数时，要加 static 或 inline 关键字。八、每新增一个功能模块，需要创建两个文件 • 添加一个新功能模块 Carer 时，同时添加同名的源文件和头文件。 • 头文件中的声明和源文件中的实现一一对应。九、一个模块依赖其他模块，则应导入他的头文件 • 如果新模块（ Carer include 功能 • 和 C/C++ 的 #include 一样， CMake 也有一个 include 命令。 • 你写 include(XXX) ，则他会在 CMAKE_MODULE_PATH 这个列表中的所有路径下查找 XXX.cmake 这个文件。 • 这样你可以在 XXX.cmake 里写一些你常用的函数，宏，变量等。十三、你知道吗？ CMake 也有 include 功能 •

0 码力 | 56 页 | 6.87 MB | 1 年前
3
Zadig 产品使用手册

+ Jenkins + 脚本化运行效率低，管理维护成本高方案局限性大，安全性风险高无法支持敏捷交付模式支持从需求到发布全流程敏捷交付。尤其面向多服务并行部署发布，云原生构建环境和运行环境，基础设施对接及企业级 SSO/ 权限管理等运维管理类平台蓝鲸 Rainbond KubeSphere KubeVela 面向资源管理的运维工具集面向开发者，需结合 CI/CD Jenkins 或 CI/CD 工具搭建流程串接胶水平台局限性大扩展性差内部推广难度极高做完后价值难被证明通用性、可扩展性、技术先进性强，可以灵活广泛接入各种技术和业务场景基于代码管理的 DevOps 方案 Gitee 平台 GitLab 平台局限性大、全流程安全性低维护成本高支持多个服务并行构建部署、产品级发布，可灵活安全接入多个代码仓及周边工具链开发 Zadig 程制定上、各方能力受限、无法快速响应市场需求层级越高、对产研状态越模糊管理低效、延误战机少量配置、快速拉起环境、稳定性有保障、减少 90% 手工操作、赋能开发、员工成就感高碎片化：手工协作 + 复杂工具链工程化：一个平台一键发布工作流、环境配置自动更新、高效调试、消除手工操作、精准快速迭代、研发生产力 / 幸福感提升自助运行、系统化管理、自动化程度高、测试有效性提升、质量有保障、横向赋能、技能提升

0 码力 | 52 页 | 22.95 MB | 1 年前
3
Zadig 面向开发者的云原生 DevOps 平台

面向开发者的云原生 DevOps 平台角色：产品 / 架构开发测试运维运维 / 开发技术支持事件需求设计架构设计拆任务、写代码代码集成 xN 单元测试验证 xN 代码扫描 xN 自测、联调 xN 集成验证 xN 写测试用例系统验证 xN 自动化测试 xN 性能测试 xN 安全测试 xN 数据变更 xN 部署预发环境 xN 部署生产环境 xN 部署 / 灰度上线 xN 监控 / 告警 xN 版本归档 xN 交付追踪 xN 数据度量 xN 服务、工单管理事件、缺陷管理想法用户运行阶段需求阶段研发阶段现代软件交付挑战：开发 5 分钟，上线 2 小时服务一：设计 | 代码编写 | 构建 | 服务全生命周期而非只关注代码 ● 每天多次提交提早验证 Zadig 采用「云原生产品级交付」设计理念数字化产研协同 • 环境 - 统一开发者协作平面 • 工作流 - 统一交付变更通道 • 异构支持 - 统一产研运管理平面重视开发者体验，工程师不再做脏活累活传统 DevOps 体系 Zadig 云原生 DevOps 平台高人效低人效低人效 / 低质量 / 低效率 / 高成本：人淹没在系统的海洋里，无数平台手工切换

0 码力 | 59 页 | 81.43 MB | 1 年前
3
基于 Rust Arrow Flight 的物联网和时序数据传输及转换工具霍琳贺

是一款开源、云原生的时序数据库（ Time Series Database ），专为物联网、工业互联网、金融、 IT 运维监控等场景设计并优化，具有极强的弹性伸缩能力。同时它还带有内建的缓存、流式计算、数据订阅等系统功能，能大幅减少系统设计的复杂度，降低研发和运营成本，是一个极简的时序数据处理平台。采用关系型数据库模型  需要建库、建表，  为提升写入和查询效率，要求一个数据采集点一张表 TDengine - 业务模式开源版企业版云服务版核心功能开源 • SQL 支持 • 无模式写入 • 缓存 • 流计算 • 数据订阅 • 集群、高可用高可靠、线性扩展 + 专业技术服务 • 边云数据复制 • 跨云 / 异地数据复制 • 增量备份 • 多级存储 • 工业数据接入全托管时序数据管理云服务平台 • 全托管服务 • VPC 对等连接 • 多云部署（模块之间关联性不高但模块组成复杂，可维护性差 • 大量设备大量数据归集存储，存储压力大 • 数据总线 / 消息队列消息接入，定制化程度要求高 • 数据业务逻辑自定义需求强 • 一定的实时数据分析能力 taosX - 功能路线图集群运维数据接入流式处理流式处理数据分享开放平台 • Backup/Restore • Replication • Migration • Data Sources

0 码力 | 29 页 | 2.26 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

1>>>() 后，并不会立即在 GPU 上执行完毕，再返回。实际上只是把 kernel 这个任务推送到 GPU 的执行队列上，然后立即返回，并不会等待执行完毕。 • 因此可以调用 cudaDeviceSynchronize() ，让 CPU 陷入等待，等 GPU 完成队列的所有任务后再返回。从而能够在 main 退出前等到 kernel 在 GPU 上执行完。定义在 GPU 当前板块的编号： blockIdx • 总的板块数量： gridDim • 线程 (thread) ：并行的最小单位 • 板块 (block) ：包含若干个线程 • 网格 (grid) ：指整个任务，包含若干个板块 • 从属关系：线程＜板块＜网格 • 调用语法： <<>> 区分板块和线程有点麻烦？“扁平化”他们！ • 你可能觉得纳闷，既然已经有线程可以并行了 glDispatchComputeIndirect 的 API 和这个很像，但毕竟没有 CUDA 可以直接在核函数里调用核函数并指定参数这么方便…… 不过，这个功能同样需要开启 CUDA_SEPARABLE_COMPILATION 。第 2 章：内存管理如何从核函数里返回数据？ • 我们试着把 kernel 的返回类型声明为 int ，试图从 GPU 返回数据到 CPU 。 • 但发现这样做会在编译期出错，为什么？

0 码力 | 142 页 | 13.52 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 05 C++11 开始的多线程编程

分为前半段和后半段，前半段主要介绍现代 C++ ，后半段主要介绍并行编程与优化。 1.课程安排与开发环境搭建： cmake 与 git 入门 2.现代 C++ 入门：常用 STL 容器， RAII 内存管理 3.现代 C++ 进阶：模板元编程与函数式编程 4.编译器如何自动优化：从汇编角度看 C++ 5.C++11 起的多线程编程：从 mutex 到无锁并行 6.并行编程常用框架： OpenMP 每个线程共享同样的内存空间，开销比较小。 • 每个进程拥有独立的内存空间，因此开销更大。 • 对于高性能并行计算，更好的是多线程。为什么需要多线程：无阻塞多任务 • 我们的程序常常需要同时处理多个任务。 • 例如：后台在执行一个很耗时的任务，比如下载一个文件，同时还要和用户交互。 • 这在 GUI 应用程序中很常见，比如浏览器在后台下载文件的同时，用户仍然可以用鼠标操作其 UI 界面。类的成员函数 join() 来等待该进程结束。 std::thread 的解构函数会销毁线程 • 作为一个 C++ 类， std::thread 同样遵循 RAII 思想和三五法则：因为管理着资源，他自定义了解构函数，删除了拷贝构造 / 赋值函数，但是提供了移动构造 / 赋值函数。 • 因此，当 t1 所在的函数退出时，就会调用 std::thread 的解构函数，这会销毁

0 码力 | 79 页 | 14.11 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

• 这样一次随机访问之后会伴随着 64 次顺序访问，能被 CPU 检测到，从而启动缓存行预取，避免了等待数据抵达前空转浪费时间。页对齐的重要性 • 为什么要 4KB ？原来现在操作系统管理内存是用分页（ page ），程序的内存是一页一页贴在地址空间中的，有些地方可能不可访问，或者还没有分配，则把这个页设为不可用状态，访问他就会出错，进入内核模式。 • 因此硬件出于安全，预取不能跨越页边界，否则可能会触给数组分配内存，是内核执行内存分配的这个动作，花费了额外的时间。而第二次因为内存已经被分配上了，所以再次访问也不会触发缺页中断，所以看起来比第一次快很多。进一步：分配是按页面（ 4KB ）来管理的 • 当一个尚且处于“不可用”的 malloc 过的区间被访问，操作系统不是把整个区间全部分配完毕，而是只把当前写入地址所在的页面（ 4KB 大小）给分配上。也就是说用户访问 a[0] 以后只分配了可以看到应用了分块 + 预取 + 直写的 x_blur ，和直写的拷贝一样快了。虽然这里 loadu 重复加载了同样的地址可能还有可优化之处，但既然唯一的瓶颈已经变成了内存带宽，那我们的缓存优化任务应该是完成了。 Y 方向的插桩比 X 方向慢好多 • 为什么会这样？ • 因为 X 方向的插桩所读取的数据，在内存中是连续的。 • 而 Y 方向的插桩所读取的数据，在内存看来表现为跳跃 nx

0 码力 | 147 页 | 18.88 MB | 1 年前
3
Rust 异步并发框架在移动端的应用 - 陈明煜

Asynchronous Rust 异步并发框架是许多大型应用、系统具备的底层能力。区别于多线程编程模型，它带来以下优势：  任务调度颗粒度更小，充分利用线程资源  更可控的线程数  单个任务资源占用：几十 KB -> 几百 Byte  任务切换时间 : 10 微秒 -> 100 纳秒 Rust 语言并没有提供异步并发框架，只提供异步所需的基本特性：  Future  的运行时库，与 tokio 类似支持异步 IO ，目前已经半废弃 async-std 更轻量化的调度框架，功能被拆分到其他多个库中， IO 密集场景性能不如 Tokio smol Rayon 并非异步运行时。它通过同步多线程模型提供了并行迭代器功能，适用于处理 CPU 密集型计算任务 rayon 现有框架无法完美适配移动端（一） Core Thread Thread Worker 拥有一个任务队列 • 但线程拥有相同优先级 • Worker 只持有一个本地 FIFO 队列移动端诉求：优先级 • 任务区分优先级： UI 显示 vs 后台下载 • 大小核调度 Incompatibility of the third party Runtime with Mobile 现有框架无法完美适配移动端（二）移动端诉求：易用性 • IO 密集性任务与 CPU 密集型任务融合

0 码力 | 25 页 | 1.64 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅

分为前半段和后半段，前半段主要介绍现代 C++ ，后半段主要介绍并行编程与优化。 1.课程安排与开发环境搭建： cmake 与 git 入门 2.现代 C++ 入门：常用 STL 容器， RAII 内存管理 3.现代 C++ 进阶：模板元编程与函数式编程 4.编译器如何自动优化：从汇编角度看 C++ 5.C++11 起的多线程编程：从 mutex 到无锁并行 6.并行编程常用框架： OpenMP 度算法，轮换着执行着不同的线程，看起来就好像是同时运行一样，其实每一时刻只有一个线程在运行。目的：异步地处理多个不同的任务，避免同步造成的阻塞。 • 并行：多核处理器，每个处理器执行一个线程，真正的同时运行。目的：将一个任务分派到多个核上，从而更快完成任务。举个例子 • 并发：某互联网公司购置了一台单核处理器的服务器，他正同时处理 4 个 HTTP 请求，如果是单线程的上一课的案例代码：基于标准库基于 TBB 的版本：任务组 • 用一个任务组 tbb::task_group 启动多个任务，一个负责下载，一个负责和用户交互。并在主线程中等待该任务组里的任务全部执行完毕。 • 区别在于，一个任务不一定对应一个线程，如果任务数量超过 CPU 最大的线程数，会由 TBB 在用户层负责调度任务运行在多个预先分配好的线程，而不是由操作系统负责调度线程运行在多个物理核心。

0 码力 | 116 页 | 15.85 MB | 1 年前
3

共 30 条前往

页

C++高性性能高性能并行编程优化课件 02 16 Zadig 产品使用手册使用手册面向开发开发者原生 DevOps 平台霍琳 2023RustChinaConf Rust 08 05 07 陈明煜 06

分类

语言

格式

C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理

C++高性能并行编程与优化 - 课件 - 16 现代 CMake 模块化项目管理指南

Zadig 产品使用手册

Zadig 面向开发者的云原生 DevOps 平台

基于 Rust Arrow Flight 的物联网和时序数据传输及转换工具霍琳贺

C++高性能并行编程与优化 - 课件 - 08 CUDA 开启的 GPU 编程

C++高性能并行编程与优化 - 课件 - 05 C++11 开始的多线程编程

C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

Rust 异步并发框架在移动端的应用 - 陈明煜

C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅