分布式计算 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Rust分布式账务系统 - 胡宇

第三届中国 Rust 开发者大会 Rust 构建分布式账务系统在 Fintech 公司落地 Rust 项目的经验分享 Airwalle x 胡宇 Airwallex 我们是一家跨境支付领域的 Fintech 独角兽关于我们 E2 轮 Fintech 独角兽，业务遍布全球关于我们： Airwallex 墨尔本新加坡伦敦深圳香港北京旧金山上海东京提供高效，低成本的数字银行服务关于我们： Airwallex 从设计架构到实现细节项目介绍分布式账务系统 Fintech 互联网正确性 bug= 资损 bug 不可怕，快速迭代可靠性丢数据 = 资损允许数据丢失性能超低延迟 + 高吞吐超高吞吐交易日志审计，监管调试使用分布式账务系统 Fintech 领域中的软件与互联网软件的不同需求分析支付处理： ● 转账高可用：在部分节点失效的情况下，依旧可以提供正确的服务超低延迟：实时交易，超低响应延迟水平扩展性：利用分布式事务实现钱包集群的的水平扩展，应对高达 100 万 TPS 的流量可演化性：业务逻辑与底层 API 解耦，当业务发生改变时，底层 API 不用改变分布式账务系统设计理念 - Rust 是我们可靠的基石分布式账务系统存算分离 API 解耦读写分离层级账号 Rust ● 事务层与账户层分

0 码力 | 27 页 | 12.60 MB | 1 年前
3
新一代分布式高性能图数据库的构建 - 沈游人

新一代分布式高性能图数据库的构建北京海致星图科技有限公司 2023-06-18 沈游人数据库与大数据专场海致简介—企业级知识图谱开创者专业顶尖技术团队支撑超 700 人团队，其中 80% 为技术人员，创始团队在完成全球第一个中文知识图谱网站研发后，探索知识图谱技术在企业领域的应用。 2021 年，海致院士专家工作站成立，站内清华大学计算机博士生占比达 90% 以上。专注于数据智能技术赋能中国数字经济发展海致高性能图计算院士专家工作站郑纬民 - 海致科技首席科学家中国工程院院士、清华大学计算机科学与技术系教授、中国计算机学会前理事长，中国计算机系统结构的学科带头人，我国高性能计算和存储系统等方面的泰斗和先行者。 2021 年 3 月 25 日，海致科技与清华大学计算机科学与技术系共同建设高性能图计算院士专家工作站。高性能图计算是高性能计算、图计算两项技术融合产生的新的技术方向，满足人们对更大规模、更复大规模、更复杂数据的实时处理和存储需求，是计算机领域竞争新战略制高点。产学结合、协同创新，打造全球领先的国产自研图数据库 AtlasGraph ，培育世界级的图计算软硬件生态体系，保持对全球科技竞争的战略均衡。海致高性能图计算院士专家工作站海致获得“ 2021 年 CCF 科学技术奖科技进步卓越奖” CCF 科学技术奖被认为是计算机科学与技术领域最具影响力的专业奖项之一，其中科技进步卓越奖是

0 码力 | 38 页 | 24.68 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 12 从计算机组成原理看 C 语言指针

从计算机组成原理看 C 语言指针 by 彭于斌（ @archibate ）往期录播： https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码： https://github.com/parallel101/course 请问下面这三段代码有什么错误？ • float x = -3.14; • printf(“%f\n”, abs(x)); 如果你没看出来（哪怕是其中一个），那就要好好上小彭老师的课哦！字节（ byte ）和位（ bit ）有什么区别 • 众所周知，计算机是二进制的，存储的实际上是一个个 0 和 1 。 • 每个存储 0 或 1 的空间称为一个位（ bit ），一位可以存储 0 或 1 两个可能的值。 • 现在的计算机都会把 8 个位打包成一个字节（ byte ），也就是说： 1 字节 = 8 位。 • 一字节可以表示 0 到类型。不同位数的计算机，字（ word ）的大小也不一样 • 刚刚说把 2 个字节（ byte ）拼成一个字（ word ），实际上是 16 位计算机的做法。 • 16 位计算机得名就是因为他的字由 16 个位组成，早期的 8086 系列 CPU 就是 16 位的。 • 在 32 位计算机上会把 4 个字节拼成一个字，字由 32 个位组成。 • 在 64 位计算机上会把 8 个字节拼成一个字，字由

0 码力 | 128 页 | 2.95 MB | 1 年前
3
CeresDB Rust 生产实践任春韶

协议支持  基于 InfluxDB 单机引擎研发分布式方案  OpenTSDB 协议  内存时序数据库  存储计算分离架构  分级存储  永久代  CeresDB 开源 2022.6 2023.3  开源版本 CeresDB 开始研发 2023.6  1.2.2 版本发布  优化了写入性能  优化了分布式方案 CeresDB – 目标解决时间线高基数问题解决时间线高基数问题 • 能高效处理好 APM 型时序数据 • 同时能高效处理好高基数时间线场景提供原生分布式方案 • 大规模部署 • 提供高可用、高可靠的服务 • 支持水平扩容 • 支持高效的分布式查询 - Tokio Preemption - Future Cancellation Rust 生产实践生产实践 – Tokio 为什么使用 Tokio ？ 1. 业界使用最广泛，测试齐全。 spawn(task0) runtime.spawn(task1) runtime.spawn(task2) 生产实践 – Async lock 总结： Async lock: 按需使用，如果是纯内存计算的时候，使用 blocking mutex 比较好。生产实践 – Mixed workload Write Read Compact Runtimes 问题： CeresDB 监控写

0 码力 | 22 页 | 6.95 MB | 1 年前
3
Await-Tree Async Rust 可观测性的灵丹妙药 - 赵梓淇

GitHub 4.5k Stars • “Materialized View” • 计算：分布式流计算任务，实时增量维护 • 存储： S3 上的 Shared-storage 存储状态和数据 Await Tree 在 RisingWave 中的应用 • 技术挑战 • 计算任务需长期执行，稳定性要求高 • 算子逻辑复杂，计算与存储读写穿插，强依赖 Async • Await-Tree 的应用 • 数次帮助解决棘手的

0 码力 | 37 页 | 8.60 MB | 1 年前
3
GPU Resource Management On JDOS

常规的容器服务，使用 gpu 的 zone ，自行设定相应的镜像即可，有完善的周边服务训练服务 • 提供基于 kubeflow 的分布式训练方案 – 界面化操作，用户提供代码地址和执行命令即可 – 系统内建支持安装 pip 依赖 – 自制存储插件支持分布式文件系统存储用户数据 – 支持官方镜像，不需要 JDOS 提前协助制作镜像 – 提供 tensorboard 作为训练监控实时查看训练状态

0 码力 | 11 页 | 13.40 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

• 通常来说，并行只能加速计算的部分，不能加速内存读写的部分。 • 因此，对 fill 这种没有任何计算量，纯粹只有访存的循环体，并行没有加速效果。称为内存瓶颈（ memory-bound ）。 • 而 sine 这种内部需要泰勒展开来计算，每次迭代计算量很大的循环体，并行才有较好的加速效果。称为计算瓶颈（ cpu- bound ）。 • 并行能减轻计算瓶颈，但不减轻内存瓶颈，故后者是优化的重点后者是优化的重点。浮点加法的计算量 • 冷知识：并行地给浮点数组每个元素做一次加法反而更慢。 • 因为一次浮点加法的计算量和访存的超高延迟相比实在太少了。 • 计算太简单，数据量又大，并行只带来了多线程调度的额外开销。 • 小彭老师经验公式： 1 次浮点读写 ≈ 8 次浮点加法 • 如果矢量化成功（ SSE ）： 1 次浮点读写 ≈ 32 次浮点加法 • 如果 CPU 有 4 Main RAM read 的时间指的是读一个缓存行（ 64 字节）所花费的时间。 • 根据计算： 125/64*4≈8 • 即从主内存读取一次 float 花费 8 个 cycle ，符合小彭老师的经验公式。 • “right” 和“ wrong” 指的是分支预测是否成功。多少计算量才算多？ • 看右边的 func ，够复杂了吧？也只是勉勉强强超过一点内存的延迟了，但在 6

0 码力 | 147 页 | 18.88 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

，内存管理与对象生命周期 ASCII 码第 1 章计算机如何表达字符 https://zh.wikipedia.org/wiki/ASCII 计算机如何表达字符 • 众所周知，计算机只能处理二进制整数，字符要怎么办呢？ • 于是就有了 ASCII 码表，他规定，每个英文字符（包括大小写字母、数字、特殊符号）都对应着一个整数。在计算机里只要存储这个的整数，就能代表这个字符了。 • 代表空格， 48 代表 ‘ 0’ ， 65 代表 ‘ A’ ， 97 代表 ‘ a’…… • 32~126 这些整数就用于是表示这些可显示字符 (printable character) 的。计算机如何表达字符 • 除了可显示字符 (printable character) 外， ASCII 还规定了一类特殊的控制字符 (control character) ： • 0 表示空字符（‘ Enter 键一样，按 Ctrl+H 的效果和退格键一样。 • 这是因为 ASCII 表中规定 ^I 就是 ‘ \t’ ， ^J 就是 ‘ \ n’ ， ^H 就是 ‘ \b’ ，所以以前原始的计算机键盘上其实还没有 Enter 键，大家都是按 Ctrl+J 来换行的… … • 不过，如果直接在控制台输入 ‘ ^’ 和 ‘ C’ 两个字符并没有 Ctrl+C 的效果哦！因为 ‘ ^C’ 是

0 码力 | 162 页 | 40.20 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型

Compressed Row Storage ） http://www.netlib.org/linalg/html_templates/node91.html 第 1 章：稀疏网格稠密网格计算粒子经过的格点数量改用更小的 char 存储只用一个 bit 存储，一个 char 可以存储 8 个 bit 用 map 来存储读取：如果不存在，则读到 0 写入：如果不存在，则创建该表项，从而避免负方向上出错。然而这还是避免不了 a < -b 时的出错。 • 正确的写法是： (a % b + b) % b • 如果 b 是常数且为 2 的幂次方，编译器会检测到，并替换为更高效的位运算，反而减少了计算量。 • 此外如果 b 一定是 2 的幂次方，那么 (unsigned)a % b 也可以（先转换成无符号的取模）。高效的解决：位运算 & • 如果 b 是 2 的幂次方，即： 2, 4 没有重合时可以用高效的加法：位运算 | • 如果可以保证 a 和 b 满足 a & b = 0 ，如： • 1011000 和 0000110 • 则： a + b = a | b | = 位运算 << ：快速计算 2 的幂次方 • pow(2,n) = 1 << n • pow(2,n+1) = 2 << n • 以后你们 CFDer 不要再让我看见 pow(2,n) 了…… • 或者至少用 powf(2

0 码力 | 102 页 | 9.50 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化

xmm0 为什么需要 SIMD ？单个指令处理四个数据 • 这种单个指令处理多个数据的技术称为 SIMD （ single-instruction multiple-data ）。 • 他可以大大增加计算密集型程序的吞吐量。 • 因为 SIMD 把 4 个 float 打包到一个 xmm 寄存器里同时运算，很像数学中矢量的逐元素加法。因此 SIMD 又被称为矢量，而原始的一次只能处理 1 个 float register 和 inline 的所谓“优化技巧”，你直接把小彭老师这两页 ppt ，贴到他脸上即可。 • 明明实验一下就知道的事，还在照着上世纪谭某强教材念。古有纸上谈兵，今有脑内编程。 • 计算机编程又不是量子物理广义相对论，我们每个人都有电脑，做一下实验很容易，可总有所谓的“老师”就不肯动动手敲几行命令（写 doc 文件倒挺勤的），在那里传播假知识。 • 在线做编译器实验推荐这个网站：：四个 int 的加法 movdqa ：加载四个 int 从 0 到 1024 填充： SIMD 加速（续）看不懂？小彭老师解析一下。右边是方便大家理解的伪代码：一次写入 4 个 int ，一次计算 4 个 int 的加法，从而更加高效但这样有个缺点，那就是数组的大小必须为 4 的整数倍否则就会写入越界的地址！如果不是 4 的倍数？边界特判法看不懂？很简单，假设 n = 1023 ：

0 码力 | 108 页 | 9.47 MB | 1 年前
3

共 25 条前往

页

分类

语言

格式

Rust分布式账务系统 - 胡宇

新一代分布式高性能图数据库的构建 - 沈游人

C++高性能并行编程与优化 - 课件 - 12 从计算机组成原理看 C 语言指针

CeresDB Rust 生产实践任春韶

Await-Tree Async Rust 可观测性的灵丹妙药 - 赵梓淇

GPU Resource Management On JDOS

C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

C++高性能并行编程与优化 - 课件 - 15 C++ 系列课：字符与字符串

C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型

C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化