双副本集群版 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

KubeCon2020/大型Kubernetes集群的资源编排优化

0 码力 | 27 页 | 3.91 MB | 1 年前
3
Zadig 面向开发者的云原生 DevOps 平台

发布 AI 增强解决方案企业开放性、 A I 能力增强产品发展历程高频极速迭代： Zadig 开源 29 个月共迭代 21 个版本 “ ” 开发者常处于今天发版、明早升级嗷嗷待哺状态 Zadig 优势、使用场景、解决问题域 Zadig 解决问题域 Zadig 云原生开放性：极简、 0 负担接入 Zadig 业务架构 Zadig 系统架构 1 Zadig Zadig 行业方案对比分析职能传统 DevOps 方案 ZadigX 云原生 DevOps 方案降本提效组织能力提升业务负责人研发不透明，规划凭感觉： • 发版时间靠运气 • 团队熬夜冲进度研发透明化：不同项目清晰可见的效率、质量、进度进度管理：根据团队客观数据，预测和确定项目规划迭代进度一目了然项目从无到有可核算管理有数据科学依据解放管理，更多时间花在 YAML/Chart 模板管理数百微服务 • 每个技术栈抽象一套构建模板 • 运维统一工作流规范，开发自主使用 • 跨多项目复用模板扫码查看易快报案例强大免运维的模板库 • 系统纬度：集群、项目、服务、环境、工作流 • 项目纬度：构建、测试、部署， DevOps 指标 • 迭代纬度：需求到发布效率、质量分析 • 效能度量：耗时分析、通过率统计、趋势分析客观精准的效能洞察 •

0 码力 | 59 页 | 81.43 MB | 1 年前
3
新一代分布式高性能图数据库的构建 - 沈游人

Processing ，高性能图计算引擎，预置 20 余种图计算算法，可扩展的分析引擎支持更复杂的数据挖掘和机器学习场景 MPP Massively Parallel Processing 架构，大规模集群分布式存储及并行计算， Shared Nothing 模式支持存储计算分离高性能基于 Rust 开发的分布式存储引擎及图计算引擎，精细的内存管理设计，内置索引系统，支持毫秒级的并发查询响应速度副本管理 CRAQ 图原生存储索引 LSM-Tree 容灾保障（ BR ）元数据层事务管理 MVOCC 计算层 Cypher AST 优化器图计算内存加速引擎服务接口 HTTP/RPC Spark 连接器 Python UDF 执行器索引管理一致性存储 RAFT 分片管理元数据集群管理用户权限针对大规模图优化的存算引擎 - 配合 Atlas 图平台，实现无代码图分析 - Query 性能分析模块，启发式提示优化 - 内置多种分析函数，面向分析师友好 -MVOCC 保证事务一致性 - 多副本管理保证数据服务高可用 - 在线备份提供容灾保障高速易用可靠 Why Rust ？ Performance • Blazingly fast and memory-efficient

0 码力 | 38 页 | 24.68 MB | 1 年前
3
基于 Rust Arrow Flight 的物联网和时序数据传输及转换工具霍琳贺

Visualization Tool Grafana Web Based Management Tool 21,400+ 4,600+ 18,500+ 社区版开源 2019.07.12 集群版开源 2020.08.03 云原生版开源 2022.08.13 注 : GitHub 为截止 2023 年 5 月数据 TDengine 的核心代码全部开源 www.github TAGS ( `groupid` INT, `location` VARCHAR(24)) TDengine - 业务模式开源版企业版云服务版核心功能开源 • SQL 支持 • 无模式写入 • 缓存 • 流计算 • 数据订阅 • 集群、高可用高可靠、线性扩展 + 专业技术服务 • 边云数据复制 • 跨云 / 异地数据复制 • 增量备份 • 多级存储 • 工业数据接入差 • 大量设备大量数据归集存储，存储压力大 • 数据总线 / 消息队列消息接入，定制化程度要求高 • 数据业务逻辑自定义需求强 • 一定的实时数据分析能力 taosX - 功能路线图集群运维数据接入流式处理流式处理数据分享开放平台 • Backup/Restore • Replication • Migration • Data Sources • IoT Protocols

0 码力 | 29 页 | 2.26 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

a[i + 1] + a[i - 1]; // 假装是 jacobi • swap(a, b); // 交换双缓冲 • for (i=0...n) b[i] = a[i + 1] + a[i - 1]; // 假装是 jacobi • swap(a, b); // 交换双缓冲 • // 不断反复 ... • 但是这样每个循环体内只有 1 次加法，明显就是我们所说的 mem-bound 解决：手动池化 • 声明为 static 变量，这样第二次进入 func 的时候还是同一个数组，不需要重复分配内存。 thread_local 表示如有多个线程，每个线程保留一个 tmp 对象的副本，防止多线程调用 func 出错。 • 返回时（或者进入时）调用 tmp.clear() 清除已有数据。由于 vector 的特性，他只会把 size() 标记为 0 并调用其成员的解构函数，而不会实际释放内存（

0 码力 | 147 页 | 18.88 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型

包括他的 data() 也是不对的。第 6 章：量化浮点类型使用 double ：每个占据 8 字节 • 很多 CFD 玩家喜欢用 double 表示浮点数。 • 然而 double 是双精度浮点数，会占据 8 字节！虽然精度更高，但是在不需要精度的图形学应用中，就非常浪费内存带宽。使用 float ：每个占据 4 字节 • 可以用单精度的 float ，只占据 4 字节。 0.1 加上去没有任何变化），是因为第一个数太大了，要表示 1234000.01 需要 9 位有效位数。 • 而单精度浮点数 float 的底数有 23 位，指数有 8 位（图 1 ）。 • 双精度浮点数 float 的底数有 52 位，指数有 11 位（图 2 ）。 double: float: http://c.biancheng.net/view/314.html 以求最大值为案例 32 位的 float ，不能更小了。 • 那么有没有不用定点数就能减小浮点数占用空间的存储方式，比如 16 位浮点呢？ double: float: 更小的浮点类型： float16 （大底数版） • 这就是 half 类型，他只有 5 位指数， 10 位底数，总共占据 16 位，所以又称 float16 。精度很低，但是节省内存空间！ • 然而只有 GPU （比如 CUDA ）支持

0 码力 | 102 页 | 9.50 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化

xmm 的最低位进行运算；也可以是 p 表示矢量 (packed) ，一次对 xmm 中所有位进行运算。 3. 第二个 s 表示单精度浮点数 (single) ，即 float 类型；也可以是 d 表示双精度浮点数 (double) ，即 double 类型。 • addss ：一个 float 加法。 • addsd ：一个 double 加法。 • addps ：四个 float 加法。 • 如果没有重叠，则跳转到 SIMD 版本高效运行。 2. 如果重叠，则跳转到标量版本低效运行，但至少不会错。 SIMD 版标量版循环中的矢量化：解决指针别名所以，让我们加上 __restrict 关键字，打消编译器的顾虑！这下只需要生成一个 SIMD 版本了，没有了运行时判断重叠的焦虑。 SIMD 版循环中的矢量化： OpenMP 强制矢量化除了可以用 __restrict 让编译器放心做 SIMD 测试一下加速了多少倍？优化前：优化后：测试结果 SOA + unroll 的方案，比优化前快了 5 倍！并行情况下最快的也是 SOA 。单线程的 SOA + unroll 甚至略微超过了并行版的 AOS ！可见 OpenMP 并非万能膏药，单线程的程序认真优化后一样打败无脑并行。结论： SOA 是针对这个案例最高效的数据排布格式第 7 章： STL 容器 std::vector

0 码力 | 108 页 | 9.47 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理

核心开发规范 ](https://github.com/isocpp/CppCoreGuidelines/blob/master/CppCoreGuidelines.md) - [LearnCpp 中文版 ](https://learncpp-cn.github.io/) - [C++ 并发编程实战 ](https://www.bookstack.cn/read/Cpp_Concurrency_In_Action/README 移动进阶：交换两者的值 • 除了 std::move 可以把 v2 移动到 v1 外， • 还可以通过 std::swap 交换 v1 和 v2 。 • swap 在高性能计算中可以用来实现双缓存（ ping-pong buffer ）。 swap 可能是这样实现的：还有哪些情况会触发“移动” • 这些情况下编译器会调用移动： • return v2

0 码力 | 96 页 | 16.28 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 09 CUDA C++ 流体仿真实战

：最接近的那个点作为值（右图）烟雾仿真系统：封装 • 我们统一通过 unique_ptr 来管理对象，这样尽管 CudaSurface 对象是不可移动的，我们仍可以通过移动其指针的方式来实现双缓冲（ std::swap ）。对流部分对流部分：计算对流后位置（ RK3 ） • 这里我参考了 Taichi 官方案例中的 stable_fluid.py 代码（二维定常流仿真），主要由 blockDim 为 8x8x8=512 。 • 如果在 resample_kernel 需要读取 clr ，然后再写入 clr ，并且读写是不同的坐标位置。 • 因此对 clr 和 vel 使用了双缓冲，写入 clrNext 的同时读取 clr 没有冲突，写入完毕后对调 clrNext 和 clr 。投影部分投影部分 • 我们要模拟的流体是不可压缩的，因此有着无散度的特点： div v 投影部分：速度减去压强的梯度投影部分：初步实现 • 现在调用这些内核，让 jacobi 迭代 400 次，看看效果。 • 当然， jacobi 迭代因为需要写入 pre 的同时读取 pre ，所以也要用双缓冲。投影部分：计算未消除的散度为了评估效果的好坏，额外加一个计算散度方差的核函数，看看是不是无散度（不可压缩流）了。多重网格法投影部分：多重网格实现投影部分：红黑高斯投影部分：计算残差

0 码力 | 58 页 | 14.90 MB | 1 年前
3
C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅

6GHz • 一个由双核组成的 3GHz 的 CPU 实际上提供了 6GHz 的处理能力，是吗？ • 显然不是。甚至在两个处理器上同时运行两个线程也不见得可以获得两倍的性能。相似的，大多数多线程的应用不会比双核处理器的两倍快。他们应该比单核处理器运行的快，但是性能毕竟不是线性增长。 • 为什么无法做到呢？首先，为了保证缓存一致性以及其他握手协议需要运行时间开销。在今天，双核或者四核机器在

0 码力 | 116 页 | 15.85 MB | 1 年前
3

共 20 条前往

页

分类

语言

格式

KubeCon2020/大型Kubernetes集群的资源编排优化

Zadig 面向开发者的云原生 DevOps 平台

新一代分布式高性能图数据库的构建 - 沈游人

基于 Rust Arrow Flight 的物联网和时序数据传输及转换工具霍琳贺

C++高性能并行编程与优化 - 课件 - 07 深入浅出访存优化

C++高性能并行编程与优化 - 课件 - 10 从稀疏数据结构到量化数据类型

C++高性能并行编程与优化 - 课件 - 04 从汇编角度看编译器优化

C++高性能并行编程与优化 - 课件 - 02 现代 C++ 入门：RAII 内存管理

C++高性能并行编程与优化 - 课件 - 09 CUDA C++ 流体仿真实战

C++高性能并行编程与优化 - 课件 - 06 TBB 开启的并行编程之旅