性能数据 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型

从稀疏数据结构到量化数据类型 by 彭于斌（ @archibate ）往期录播： https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码： https://github.com/parallel101/course 本课涵盖：稀疏矩阵、 unordered_map 、空间稀疏网格、位运算、浮点的二进制格式、内存带宽优化面向人群：图形学、形怪状也不会浪费内存。这些被写入的部分被称为激活元素 (active element) ，反之则是未激活 (inactive) 。这就是稀疏的好处，按需分配，自动扩容。分块则是利用了我们存储的数据常常有着空间局域性的特点，减轻哈希表的压力，同时在每个块内部也可以快乐地 SIMD 矢量化， CPU 自动预取之类的。第 2 章：位运算稀疏的好处：坐标可以是负数这样即使坐标为负数，或是负数，则得到的模也是负数。 Python 的 % 就没问题 • 7 % 4 = 3 • -7 % 4 = 1 • Python 的模运算 a % b 的值始终是 [0, b) 区间内的正数，非常方便。对稀疏数据结构造成的问题 • 如果这里的 x 是负数，则 x % B 也是负数，会造成对 m_block 的越界访问。 • 因此 % 会返回负数对 CFD 用户来说是个很大的坑点，很多人想当然地用 % 做循环边界，

0 码力 | 102 页 | 9.50 MB | 1 年前
3
新一代分布式高性能图数据库的构建 - 沈游人

新一代分布式高性能图数据库的构建北京海致星图科技有限公司 2023-06-18 沈游人数据库与大数据专场海致简介—企业级知识图谱开创者专业顶尖技术团队支撑超 700 人团队，其中 80% 为技术人员，创始团队在完成全球第一个中文知识图谱网站研发后，探索知识图谱技术在企业领域的应用。 2021 年，海致院士专家工作站成立，站内清华大学计算机博士生占比达 90% 以上。企业级数据解决方案专家为建行、工行、交行、招行、上交所、深交所、中国人寿等 70+ 银行证券保险企业、公安部、上海市公安局、武汉市公安局等 100+ 公安机构，国家电网、国信通产业集团等电力能源行业提供数据智能产品解决方案及长期服务。海致专注为政府、金融、能源等客户提供大数据处理、分析、挖掘服务，在互联网技术基础上，打造专业、易用的企业级大数据实战应用产品及解决方案。北京中关村总部专注于数据智能技术赋能中国数字经济发展海致高性能图计算院士专家工作站郑纬民 - 海致科技首席科学家中国工程院院士、清华大学计算机科学与技术系教授、中国计算机学会前理事长，中国计算机系统结构的学科带头人，我国高性能计算和存储系统等方面的泰斗和先行者。 2021 年 3 月 25 日，海致科技与清华大学计算机科学与技术系共同建设高性能图计算院士专家工作站。高性能图计算是高

0 码力 | 38 页 | 24.68 MB | 1 年前
3
Go性能优化概览-曹春晖

业务性能优化概览 By Xargin 《Go 语⾔⾼级编程》合著者 Go contributor ⽬录优化的前置知识 01 ⽣产环境的优化 02 Continuous profiling 03 优化的前置知识第⼀部分 Latency numbers every programmer should know https://colin-scott.github.io/p go#L930 内存占⽤过⾼-堆分配导致内存过⾼ https://github.com/golang/go/pull/42036#issuecomment-715046540 怎么样说服官⽅接受性能优化的 PR 内存占⽤过⾼-goroutine 数量太多导致内存占⽤⾼这些内存的构成部分： 1. Goroutine 栈占⽤的内存(难优化，⼀条 tcp 连接⾄少对应⼀个 goroutine) 了)，可以使⽤下列库进⾏优化 • evio • gev • gnet • easygo • gaio • netpoll ⼀定要⽤⾃⼰的真实业务场景做压测不要相信 readme ⾥的压测数据总结⼀下 • CPU 使⽤太⾼ • 应⽤逻辑导致 • JSON 序列化 • 使⽤优化的 JSON 库替换标准库 • 使⽤⼆进制编码⽅式替代 JSON 编码 • 同物理节点通信，使⽤共享内存

0 码力 | 40 页 | 8.69 MB | 1 年前
3
4 Python机器学习性能优化

Python机器学习性能优化以BERT服务为例例，从1到1000 刘欣⽬目录 CONTENTS 1. 优化的哲学 2. 了解你的资源 3. 定位性能瓶颈 4. 动⼿优化 1. 优化的哲学 "There ain't no such thing as a free lunch" Ahmdal’s Law • 系统整体的优化，取决于热点部分的占⽐比和该部分的加速程度 No Free Flask Production Server • gunicorn 多进程解决多核利利⽤用率问题 • gevent 协程替代多线程⽹网络模型 • 更更⾼高效的序列列化lib 3 定位性能瓶颈 Profile before Optimizing Python Profilers • time.time() • cProfile • line profiler • pyflame 放个截图 cProfile • 倒序打印 & graph pyflame • 插桩 or 采样 • 放个flamegraph • 开源地址 wrk • 制造压⼒力力 • 挖掘整体性能瓶颈 • 实现⾮非常精妙的压⼒力力⼯工具，强烈烈安利利（要不不要写个py binding） 4 动⼿优化多线程服务器的问题 • 每个请求单独进GPU，利利⽤用率不不⾼高 • ⼤大量量请求并⾏行行，CUDA会爆

0 码力 | 38 页 | 2.25 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 性能优化之无分支编程 Branchless Programming

性能优化之无分支编程 Branchless Programming by 彭于斌（ @archibate ）两种代码写法：分支 vs 三目运算符两种使用方式：排序 vs 不排序测试结果（均为 gcc -O3 ）测试结果可视化图表比较：分支 vs 无分支分支无分支 0 0.01 0.02 0.03 耗时（越低越好）乱序有序 • 传统的分支方法实现的传统的分支方法实现的 uppercase ，对于排序过的数据明显比乱序时高效。 • 无分支的方法对于乱序和有序的数据一样高效，性能吊打了传统的分支方法。 • 对于传统分支的做法，为什么排序了的更高效？既然无分支更高效，我要怎样优化才能让我的程序变成无分支的呢？那就来看本期性能优化专题课吧！分支预测成败对性能的影响排序为什么对有分支的版本影响那么大为什么需要流水线 • 为了高效， CPU 等待烧完开水才开始刷牙，而是针对性地为“没烫伤”的那个剧本优化。把刷牙、看比站和烧开水同时进行，但刷牙、看比站在烧完开水前都处于“虚”的状态，也就是虽然在做但是不写到日记里（提前执行数学计算，但不实际写回数据到内存）。直到烧完开水确认没有被烫伤后，才实际把刷牙、看比站的操作写到日记本里（ CPU 确认执行这条分支，才会真正写回内存，产生副作用）。洗脸刷牙烧开水吃饭看比站拉粑粑 5

0 码力 | 47 页 | 8.45 MB | 1 年前
3
对 Go 程序进行可靠的性能测试

对 Go 程序进行可靠的性能测试 Changkun Ou https://changkun.de/s/gobench/ Go 夜读系列｜talkgo.org｜Talk Go｜第 83 期 March 26, 2020 # Go 1.13 / 1.14 2020 © Changkun Ou · Go 夜读 · 对 Go 程序进行可靠的性能测试主要内容 ● 可靠的测试环境 ● benchstat 对代码块进行性能调优 ○ 例2: Benchmark 的正确性分析 ○ 例3: 其他的影响因素 ● 假设检验的原理 ● 局限与应对措施 ● 总结 2020 © Changkun Ou · Go 夜读 · 对 Go 程序进行可靠的性能测试教科书式的性能测试方法论 3 在《Software Testing: Principles and Practices》一书中归纳的性能测试方法论：搜集需求 2. 编写测试用例 3. 自动化性能测试用例 4. 执行性能测试用例 5. 分析性能测试结果 6. 性能调优 7. 性能基准测试（Performance Benchmarking） 8. 向客户推荐合适的配置可靠的测试环境 2020 © Changkun Ou · Go 夜读 · 对 Go 程序进行可靠的性能测试什么是可靠的性能基准测试环境 5 影响测试环境的软硬件因素

0 码力 | 37 页 | 1.23 MB | 1 年前
3
2.7 Golang与高性能DSP竞价系统

专业DSP解决⽅方案供应商 Golang与⾼高性能DSP竞价系统 By @QLeelulu 专业DSP解决⽅方案 © ⼲⼴广州舜⻜飞信息科技有限公司 All Right ReservedAll Right Reserved • RTB: Real-time Bidding，实时竞价，允许⼲⼴广告买家根据活动⺫⽬目标、⺫⽬目标⼈人群以及费⽤用⻔门槛等因素对每⼀一个⼲⼴广告及每次⼲⼴广告展⽰示的费⽤用进⾏行竞价。 http包的HelloWorld性能测试为什么选择Golang Via: http://www.cnblogs.com/QLeelulu/archive/2012/08/12/2635261.html 专业DSP解决⽅方案 © ⼲⼴广州舜⻜飞信息科技有限公司 All Right ReservedAll Right Reserved • ⾼高性能、天⽣生并发⽀支持 • 性能敏感的模块可以直接使⽤用C编写（当时是这么认为的）性能敏感的模块可以直接使⽤用C编写（当时是这么认为的） • 编译为本地机器码，部署⽅方便 • 快速上⼿手，学习成本低 • 标准库基本够⽤用 • 带GC（当时不了解GC的性能问题） • ⾃自带单元测试、性能测试、性能分析⼯工具 • 开发效率不低为什么选择Golang 专业DSP解决⽅方案 © ⼲⼴广州舜⻜飞信息科技有限公司 All Right ReservedAll Right Reserved

0 码力 | 51 页 | 5.09 MB | 1 年前
3
IPC性能极致优化方案-RPAL落地实践

IPC性能极致优化方案-RPAL落地实践谢正尧字节跳动研发工程师目录方案诞生的背景 01 全进程地址空间共享与保护 02 用户态进程切换 03 高效的Go Event Poller 04 RPC框架Kitex集成 05 性能收益与业务展望 06 方案诞生的背景第一部分方案诞生的背景几种常见的同机通信场景： 1. 微服务合并部署（亲和性部署、sidecar IP、UDS、共享内存IPC 方案诞生的背景以性能较优的 IPC 方案 share memory ipc 为例分析性能瓶颈：注：方案 github 地址：https://github.com/cloudwego/shmipc-go 方案诞生的背景方案诞生的背景 IPC 的性能瓶颈有哪些: 1. 系统特权级切换； 2. 异步线程唤醒/休眠（事件通知）； 3. 数据拷贝（序列化/反序列化）；方案诞生的背景方案诞生的背景能不能把库函数调用的高性能优势做到 IPC 里面，降低进程间的事件通知和数据拷贝开销？以go-go微服务 RPC 通信场景为例，该问题可以抽象为，如何高效地在两个 go runtime 间进行函数调用？方案诞生的背景基于以上问题，我们最终引入了 RPAL（Run Process As Library）方案，基于跨进程虚拟地址共享，复用 epoll 网络模型，实现了纯

0 码力 | 39 页 | 2.98 MB | 1 年前
3
高性能高可用机票实时搜索系统

⾼性能⾼可⽤机票实时搜索系统去哪⼉⺴梁启康议题系统诉求海海量量数据设计思路路搜索框架报价引擎待解问题系统诉求 • 全⽹网价最低 • 航线报价最全 • 实时性最好 • 产品最丰富 • 预定最流畅⾯面临问题航班舱位时刻变动供应商规则调整密集航司政策各有不不同供应商的office权限不不⼀一致运价规则变化繁多 GDS数据成本不不菲 GDS数据成本不不菲低价缺失报价不不全变价海海量量数据 • 规则量量 • 供应商规则量量2亿+ • 运价规则1亿+ • 报价量量 • 国内国际航线28万 * 航班数 * 产品个数 * 供应商个数 * 180天 = 1500亿 + • 搜索量量 • 航线搜索+航班搜索：3k+qps • 每秒计算产品数：搜索qps * 航班数 * 供应商个数 * 产品个数 = 1500万 App WWW Touch 分销 Cache Redis MQ MQ 航班数据运价数据应⽤用层聚合层报价源基础数据搜索框架遇到问题解决⽅方案 • 报价数量量多，内存问题 • 报价源多，不不稳定 • 响应时间要求苛刻 • 搜索条件有热点 • 缓存报价不不准 • 尽量量⽤用原⽣生数据类型，编码 • 回数⽐比例例，异步搜索更更新 • 分批回数 • ⼀一致性哈希，负载均衡

0 码力 | 26 页 | 1.94 MB | 1 年前
3
性感的PHP - 现代化高性能的PHP开发

0 码力 | 38 页 | 3.56 MB | 1 年前
3

共 697 条前往

页

分类

语言

格式

C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型

新一代分布式高性能图数据库的构建 - 沈游人

Go性能优化概览-曹春晖

4 Python机器学习性能优化

C++高性能并行编程与优化 - 课件 - 性能优化之无分支编程 Branchless Programming

对 Go 程序进行可靠的性能测试

2.7 Golang与高性能DSP竞价系统

IPC性能极致优化方案-RPAL落地实践

高性能高可用机票实时搜索系统

性感的PHP - 现代化高性能的PHP开发