Oracle 和 MySQL 性能优化感悟f7196cc12c191/p1_1.jpg) QCon 全球软件开发大会 INTERNATIONAL SOFTWARE DEVELOPMENT CONFERENCE # 移动APP性能监测实践(iOS篇) 杨凯 # 国 0 码力 | 19 页 | 3.82 MB | 2 年前3
Go性能优化概览-曹春晖## GCN ## 业务性能优化概览  By Xargin 《Go 语言高级编程》合著者 Go contributor  ## 目录 优化的前置知识 ___ 01 生产环境的优化 ___ 02 Continuous profiling ___ 03 ## 第一部分 优化的前置知识 ## Latency numbers every programmer should know |Event|Latency|Scaled| |---|---|---| |1 CPU |Hardware (HW) virtualization system boot|40 s|4 millennia| |Physical system reboot|5 m|32 millennia| ## 优化的前置知识 • 要能读得懂基本的调用栈 • 了解 Go 语言内部原理(runtime,常用标准库) • 了解常见的网络协议(http、pb) https://github.com/bagder/http2-explained0 码力 | 40 页 | 8.69 MB | 2 年前3
4 Python机器学习性能优化f0055537d7f9feafcf0f03f1/p1_2.jpg) PYTHON 30th ## Python机器学习性能优化 以BERT服务为例,从1到1000 刘欣 ## 目录 1. 优化的哲学 2. 了解你的资源 3. 定位性能瓶颈 4. 动手优化  PYTHON 30th ### 1. 优化的哲学 ## "There ain't no such thing as a free lunch" ## Ahmad's Law - 系统整体的优化,取决于热点部分的占比和该部分的加速程度 $$ Speedup=\frac{time_{old}}{t unc_{cost}} $$ ## No Free Lunch · 定位热点 & 热点加速 · 对于项目开发周期: 1. 先做出效果 2. 确定整体pipeline 3. 再考虑优化 · 对于人工智能项目:迭代周期更长,更是如此 ## 以BERT服务为例 • BERT: TODO: 一句话解释 · 横扫多项NLP任务的SOTA榜 ·惊人的3亿参数  # 性能优化之无分支编程  Branchless Programming by uppercase,对于排序过的数据明显比乱序时高效。 - 无分支的方法对于乱序和有序的数据一样高效,性能吊打了传统的分支方法。 - 对于传统分支的做法,为什么排序了的更高效?既然无分支更高效,我要怎样优化才能让我的程序变成无分支的呢?那就来看本期性能优化专题课吧! ## 分支预测成败对性能的影响 ||Nanoseconds (ns)|Microseconds (μs)|Milliseconds 冲突的可以同时进行,节省时间。 例如洗脸需要眼睛嘴巴手,刷牙需要嘴巴手那么洗脸和刷牙不能同时进行。但是烧开水只需要占用煤气灶,和洗脸刷牙不冲突,所以可以一边烧开水一边洗脸刷牙。 所以让小彭老师来优化的话,可以只需要 $ 5 + 5 + 10 + 20 = 40 $ 分钟,比你快一倍多。 |任务|时间|占用资源| |---|---|---| |洗脸|5 分钟|眼睛,嘴巴,手| |烧开水|100 码力 | 47 页 | 8.45 MB | 2 年前3
IPC性能极致优化方案-RPAL落地实践## GCN ## I PC性能极致优化方案-RPAL落地实践  谢正尧 字节跳动 研发工程师  2.本地基础组件:mesh bb5037c4c50541f0ff9d02a06a91/p8_1.jpg) 常见的本地通信方案:回环 IP、UDS、共享内存IPC ## 方案诞生的背景 以性能较优的 IPC 方案 share memory ipc 为例分析性能瓶颈: 0 码力 | 39 页 | 2.98 MB | 2 年前3
云原生数据库PieCloudDB 性能优化之路## PostgreSQL ## 第12届PostgreSQL中国技术大会 ## — 安全可靠 ✗ 突破 ✗ 进化 ## 云原生数据库PieCloudDB 性能优化之路 郭峰 拓数派 ## OpenPie 拓数派 ## 打造立足于国内 基础数据计算领域的世界级高科技创新驱动机构   # 深入浅出访存优化 by 彭于斌 (@archibate) 往期录播:https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码:https://github.c f)); } benchmark::DoNotOptimize(a); } } ## 写入 1 比写入 0 更慢? - 很简单,因为写入 0 被编译器自动优化成了 memset,而 memset 内部利用了 stream 指令得以更快写入。 |Benchmark|Time|CPU|Iterations| |---|---|---|---| |BM\_write0|22502422 ize(a); } } BENCHMARK(BM_write1); ## 写入 1 比写入 0 更慢?解决 - 解决办法就是,我们也用 stream 指令,这样就可以和标准库优化过的 memset 一样快了。 void BM_write1(benchmark::State &bm) { for (auto _: bm) { #pragma0 码力 | 147 页 | 18.88 MB | 2 年前3
The JavaScript HandbookConclusion ## Preface The JavaScript Handbook follows the 80/20 rule: learn in 20% of the time the 80% of a topic. In particular, the goal is to get you up to speed quickly with JavaScript. This book is written Enjoy! ## The JS Handbook - 1. Introduction to JavaScript - 2. A little bit of history - 3. Just JavaScript - 4. A brief intro to the syntax of JavaScript - 4.1. White space - 4.2. Case sensitive Introduction to JavaScript JavaScript is one of the most popular programming languages in the world. I believe it's a great language to be your first programming language ever. We mainly use JavaScript to create0 码力 | 56 页 | 577.92 KB | 2 年前3
C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化## AMD # 从汇编角度看编译器优化 by 彭于斌 (@archibate) 往期录播:https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码:https://github.com/parallel101/course  ## 高性能并行编程与优化 - 课程大纲 • 分为前半段和后半段,前半段主要介绍现代 C++,后半段主要介绍并行编程与优化。 1. 课程安排与开发环境搭建:cmake 与 git 入门 2. 现代 C++ 入门:常用 STL 容器,RAII 内存管理 3. 现代 C++ 进阶:模板元编程与函数式编程 4. 编译器如何自动优化:从汇编角度看 C++ 5. C++11 C++11 起的多线程编程:从 mutex 到无锁并行 6. 并行编程常用框架:OpenMP 与 Intel TBB 7. 被忽视的访存优化:内存带宽与 cpu 缓存机制 8. GPU 专题:wrap 调度,共享内存,barrier 9. 并行算法实战:reduce,scan,矩阵乘法等 10. 存储大规模三维数据的关键:稀疏数据结构 11. 物理仿真实战:邻居搜索表实现 pbf 流体求解0 码力 | 108 页 | 9.47 MB | 2 年前3
绕过conntrack,使用eBPF增强 IPVS优化K8s网络性能0 码力 | 24 页 | 1.90 MB | 2 年前3
共 1000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 100













