C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化## AMD # 从汇编角度看编译器优化 by 彭于斌 (@archibate) 往期录播:https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码:https://github.com/parallel101/course  ## 高性能并行编程与优化 - 课程大纲 • 分为前半段和后半段,前半段主要介绍现代 C++,后半段主要介绍并行编程与优化。 1. 课程安排与开发环境搭建:cmake 与 git 入门 2. 现代 C++ 入门:常用 STL 容器,RAII 内存管理 3. 现代 C++ 进阶:模板元编程与函数式编程 4. 编译器如何自动优化:从汇编角度看 C++ 5. C++11 起的多线程编程:从 起的多线程编程:从 mutex 到无锁并行 6. 并行编程常用框架:OpenMP 与 Intel TBB 7. 被忽视的访存优化:内存带宽与 cpu 缓存机制 8. GPU 专题:wrap 调度,共享内存,barrier 9. 并行算法实战:reduce,scan,矩阵乘法等 10. 存储大规模三维数据的关键:稀疏数据结构 11. 物理仿真实战:邻居搜索表实现 pbf 流体求解 120 码力 | 108 页 | 9.47 MB | 2 年前3
《玩转webpack》第五章 进阶篇: webpack 构建速度和体积优化策略基础篇:webpack 基础用法 03 | 基础篇:webpack 进阶用法 04 | 进阶篇:编写可维护的webpack 构建配置 05 | 进阶篇:webpack 构建速度和体积优化策略 06 | 原理篇:通过源码掌握webpack 打包原理 07 | 原理篇:编写 Loader 和插件 08 | 实战篇:React 全家桶 和webpack 开发商城项目 error(stats.toString("errors-only")); } console.log(stats); }); 颗粒度太粗,看不出问题所在 ## 速度分析:使用 speed-measure-webpack-plugin ## 代码示例 const SpeedMeasurePlugin = require("speed-measure- sass-loader took 24.012 secs module count = 192 coffee-loader took 5.337 secs module count = 29 ## 速度分析插件作用 分析整个打包总耗时 每个插件和loader的耗时情况 ## webpack-bundle-analyzer 分析体积 ## 代码示例 const BundleAnalyzerPlugin0 码力 | 36 页 | 8.13 MB | 2 年前3
1.2.2 GoLLVM 编译探索GO CN GoLLVM编译探索 马春辉 字节跳动程序语言团队工程师 目录 团队与个人 01 GoLLVM 背景 02 GoLLVM现状 03 GoLLVM问题解决 04 阶段性的成果 05 未来与展望 06 第一部分 团队与个人 ’ alt=‘OCR图片’/> 团队与个人 字节跳动程序语言团队 go 编译器/Runtime/GC 优化 基础库、性能分析工具、java、python 基础库、性能分析工具、java、python 马春辉 十多年的编译器领域相关工作经验 先后就职于HP编译器组,IBM jvm组,华为虚拟机实验室,字节跳动程序语言团队 ’ alt=‘OCR图片’/> 第二部分 GoLLVM背景 ’ alt=‘OCR图片’/> GoLLVM背景 · 字节内有大量的go微服务 性能要求 在原生Go SDK上的一些传统编译优化收益超过几十万核 PSM CPU Latency GoLLVM背景 传统编译优化在go compiler上的实现 Inline 策略调整 栈大小调整 Fast path inline Aggressive BCE ’ alt=‘OCR图片’/> GoLLVM背景 ·两条路 继续在原生Go SDK上开发 优化pass少 SSA比较简陋,缺少一些优化的基础设施 探索利用LLVM的优化能力:语言团队与STE-编译器组联合探索0 码力 | 25 页 | 3.99 MB | 1 月前3
Greenplum 编译安装和调试## Greenplum 编译安装和调试 本文先介绍如何从源代码编译安装Greenplum、初始化Greenplum集群。然后介绍SQL在Greenplum中的典型执行路径,最后介绍一些调试技巧。 源代码使用 Greenplum 开源社区最新源代码 6X_STABLE 分支: https://github.com/greenplum-db/gpdb,内核代码基于PostgreSQL 9. com/greenplum-db/gpdb-postgres-merge。 ### 1. 从源代码编译 Greenplum Greenplum 目前官方支持 Redhat/Centos/SuSE/Ubuntu 等 Linux 系统。大量开发人员包括我自己使用 Mac 系统,但是不在官方支持列表中。 ### 1.1 在 Mac 系统上编译 首先需要关闭苹果操作系统的 SIP 特性,否则无法初始化集群。 1. 重启操作系统 python get-pip.py $ sudo pip install psutil lockfile paramiko setuptools epydoc // 需要安装 openssl,否则无法编译 $ brew install openssl && brew link openssl --force $ CPPFLAGS="-I/usr/local/include/0 码力 | 15 页 | 2.07 MB | 2 年前3
Rust并行编译的挑战与突破Rust并行编译的挑战与突破 李原 2022年5月28日 ## 目录 - 相关浅谈 - Rust并行编译的挑战与突破 - 从并行编译到并行程序设计 - Rust社区与并行编译  ## 相关浅谈 ## Rust编译速度之殇 ## ## 编译器设计造成编译速度缓慢  · 单态化 · 借用检查 · 宏展开 · MIR优化 Rust规模编译速度慢于C++  ## Rust编译速度之殇 ## 提升编译效率成为近年社区重点工作  2017-2021,Rust编译速度已提升一倍以上 编译器的方案 AST = Abstract Syntax Tree抽象语法树 SSA = Single Static Assignment单静态赋值 IR = Intermediate Representation中间表示0 码力 | 36 页 | 1.63 MB | 1 月前3
VMware vSphere:优化和扩展# vmware $ ^{®} $ EDUCATION SERVICES # VMware vSphere:优化和扩展 ## 培训方式 • 讲师指导培训 · 实时在线培训 ## 课程用时 • 为期五 (5) 天的讲师指导课堂培训 - 听课时间占 60%,动手实验时间占 40% ## 目标学员 经验丰富的系统管理员和系统集成人员 ## 课程适用对象 区管理员 □ 专家 ☒ $ ^{TM} $ 5.0 讲授。 ## 课程目标 课程结束后,您应能胜任以下工作: - 配置和管理大型成熟企业的 ESXi 网络和存储系统。 • 管理 vSphere 环境变更。 • 优化所有 vSphere 组件的性能。 ● 排除操作故障并找出造成这些故障的根本原因。 - 使用 VMware vSphere $ ^{®} $ ESXi $ ^{™} $ Shell 和 VMware 将虚拟机从标准交换机迁移到分布式交换机 - 了解分布式交换机的功能特性,例如 PVLAN、VMware vSphere $ ^{®} $ 网络 I/O 控制、端口镜像和 NetFlow ## 网络优化  • 了解网络适配器的性能特点 -0 码力 | 2 页 | 341.36 KB | 2 年前3
Greenplum上云与优化# Greenplum上云与优化 — ApsaraDB for Greenplum介绍 主办单位:Alibaba Group 阿里巴巴集团 战略合作伙伴:intel 杭州 张广舟(明虚) 阿里云高级专家 ## 目录 ApsaraDB for GP的定位 ApsaraDB for GP的内核优化 未来的规划 # ApsaraDB for GP的定位 ## ApsaraDB for GP的定位 GP的定位 GP的优势? 与其他技术的对比? 为什么上云? ## ApsaraDB for GP的定位 MPP + 列存压缩 ApsaraDB for GP = 复杂SQL + 查询优化器 本地高效存储 + 高速网络 + 预置稳定资源 = 简单、高效解决大数据分析需求 ### GP vs. RDS? MPP处理举例 ## Select count(*) from customer group [Image](/uploads/documents/f/2/6/d/f26d9043d030148cb59ffb98d820fd24/p9_3.jpg) ### GP vs. Hadoop? Orca优化器 SQL Runtime # >5-30倍的性能优势 本地存储 ### ApsaraDB for GP vs. AWS Redshift? ## “有史以来卖的最好的云服务” |对比项目|ApsaraDB0 码力 | 26 页 | 1.13 MB | 2 年前3
HBase最佳实践及优化## cloudera ## HBase最佳实践及优化 陈飚 cb@cloudera.com Cloudera ## 关于我 陈飚 Cloudera售前技术经理、资深方案架构师 http://biaobean.pro  原Intel 原Intel Hadoop发行版核心开发人员, 成功实施并运维多个上百节点Hadoop大数据集群。 – 曾在Intel编译器部门从事服务器中间件软件开发,擅长服务器软件调试与优化,与团队一起开发出世界上性能领先的XSLT语言处理器 – 2010 年后开始Hadoop 产品开发及方案顾问,先后负责Hadoop 产品化、HBase 性能调优,以及行业解决方案顾问 ## HBase的历史 HBase是Google 分布式的多层次映射表结构(key-value形式,value有多个) - 固定一个数据模型(固定数据模型能得到高性能,同时满足应用需求) - 无数据类型 ## HBase的实现特性 - 非常高的数据读写速度,为写特别优化 - 高效的随机读取 – 对于数据的某一个子集能够进行有效地扫描 - 具有容错特性,能够将数据持久化的非易失性存储中 – 使用HDFS做底层存储,可利用Hadoop的压缩Codec等减少空间占用0 码力 | 45 页 | 4.33 MB | 2 年前3
PostgreSQL 查询优化器解析0 码力 | 37 页 | 851.23 KB | 1 年前3
共 1000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 100
相关搜索词
C++高性性能高性能并行编程优化课件04WebpackBundleAnalyzerPluginspeed-measure-webpack-pluginTree-shakingScope HoistingGoLLVM编译优化Inline策略GC精确式栈扫描ABI转换Greenplum编译安装初始化集群SQL执行流程调试技巧Rust并行编译共享数据结构编译器性能社区工作组并行程序设计Go编译器编译器工作流程ARM64硬件除法器词法分析vSphere 优化ESXivCenter ServervSphere Auto DeployvSphere Storage DRSApsaraDB for GreenplumAWS RedShiftMPP列存压缩性能优化HBaseRegionServerCompaction吞吐率GCPostgreSQL查询优化器执行计划规划阶段预处理













