基于Go的大数据平台-党合萱多种上下游适配 - 高吞吐/低延迟问题探究 - 高可用与水平扩展 - 自动化运维 - Go的应用 ## 系统设计分析与架构 ## 构建系统的挑战 每天数千亿数据点 任务切分粒度 每天百TB数据量 1 高吞吐量 4 水平扩展 机器扩容 高峰期每分钟近200GB数据量 master节点failover 5 高可用 分钟级数据延迟 ② 低延迟 server节点无状态 7/1/6/b/716b45ba07ae342152eb1f7952269e99/p10_3.jpg) Sinker 云存储导出模型 ## 高吞吐/低延迟问题探究 ## 简单·可信赖 ## 困难 高吞吐 1、资源利用率低 2、上下游吞吐能力不匹配  • 大量客户需要私有化云服务器部署(云更新) • 需求变更频繁,不适合关系型数据库 ## 目前服务器架构  • 上线和运维 - 对运行环境的依赖 - 对库(动态库)的依赖 ## 后台程序编程的难点 ## • 内存的管理 -C程序中很大比例的Bug和内容有关 • 分布式/高并发的处理 -10年前还是一个很hot的话题;目前也还没有普遍掌握 –CPU资源的调度:Process/Thread/Event -数据的封装和互斥访问; - 并行运算逻辑的同步 ## C vs [Image](/uploads/documents/b/6/7/f/b67feeef329677168cf0f86a902dbe8e/p15_1.jpg) ## 为什么重写BFE ## · 现存问题 - 修改成本高 · 事件驱动的编程模型:编码和调试难度大 • C语言本身的难度和开发效率 - 配置管理方式落后 · 为单产品线设计,无法支持平台化要求 • 配置变更(修改、重载、验证)能力差 -变更和稳定性的矛盾 ## GC带来的问题 -GC是个好东西,但也有问题 -难以避免的延迟(几十到几百ms) ·经验公式:10万对象1ms扫描时间 -1个tcp连接,约10个对象=>1万连接,1ms gc延迟 • GO-BFE的实时需求 - 请求的处理延迟 平均1ms以内,最大10ms · 实测 -100万连接,400ms gc延迟 ## GC优化思路 • Go的gc算法(go1.3) –Mark0 码力 | 35 页 | 730.17 KB | 2 年前3
华为云 KubeCon China KubeEdge Demo Session0 码力 | 10 页 | 836.76 KB | 1 年前3
2 使用Python训练和部署低精度模型 张校捷3bbe1f6675c3cec959e1f224b976c60/p1_2.jpg) PYTHON 30th ## 使用Python训练和部署低精度模型 (TensorFlow版) 张校捷 2019/9/21 ## 目录 >> 低精度的概念和意义 TensorFlow的FP16模型 >> TensorRT的FP16/Int8模型 总结  FP16: E8M7 (TPU, tf.bfloat16) FP16: E5M10 (GPU, tf.float16) Int8 ## 低精度浮点数的优点 ### 1. 节约 节约内存/显存的使用(FP16为原来的1/2,int8为原来的1/4) 2. 特殊的硬件专门用于低精度浮点数的计算加速(TensorCore) FP16 storage/input Full precision product Sum with FP32 accumulator Convert to FP32 result 指的是给一个key设置一个有效期,到期后key0 码力 | 30 页 | 2.42 MB | 1 年前3
APISEVEN 和Kong EE 的性能评测企业版7 3-GigaOm API负载测试设置9 API 压力测试9 测试环境10 单节点10 环境清单10 软件版本信息11 4-测试结果12 图2. 空转时的压力测试 API 的基线延迟12 图3. API7与Kong EE在20,000 rps时的对比13 图4. API7与Kong EE在10,000 rps时的JWT对比。13 图5. API7与Kong EE在10,000 高性能和可用性。在本文中,我们将“高性能”定义为每秒负载超过1000个交易且在整个API环境中最大延迟小于30毫秒。对公司而言,对性能的需求和对管理的需求一样,因为公司依靠API交易速率来跟上业务发展速度。 API管理解决方案不能成为性能瓶颈。许多公司都在寻找跨多个API端点的负载均衡和高交易量吞吐的解决方案。如果业务每秒有1000个交易,一个月内就会有30亿次API调用。拥有大流量的公司通常每月 EE。在每秒10,000个请求的情况下,99.99%的情况API7的延迟比Kong EE低14倍。API7和Kong EE二者百分比越高延迟差异越明显。在我们所有的测试中,最大延迟差异体现得最明显的是达到99.9%和99.99%的请求时。 云上测试软硬件是非常具有挑战性的。在可用性、虚拟机处理器、内存、最佳输入/输出的存储、网络延迟、软件和操作系统版本以及负载这些方面的配置可能会有利于其中一方。更0 码力 | 14 页 | 1.11 MB | 2 年前3
万亿级数据洪峰下的消息引擎 Apache RocketMQ## CONTENTS 01 阿里消息中间件的演变历史 双11万亿级数据洪峰的挑战 ■ 历年双11消息数量变化 ■ 消息中间件核心链路 ■ 低延迟存储 ■ 容量保障 ■ 熔断机制 ■ 多副本高可用 03 Apache RocketMQ 未来展望 ## 历年双11消息数量变化 } $ MTBF: Mean time between failure. MTTR: recover. MTTR = 1 seconds Availability = $ \frac{60*60*24 - 1}{(60*60*24)} = 99.999\% $ ## 双十一当天高可用标准 1. 每秒支撑千万级消息发布 2. 每条消息发布最大响应时间 不超过20ms 3. 每条消息发布平均响应时间 不超过3ms  QCon 全球软件开发大会 INTERNATIONAL SOFTWARE DEVELOPMENT CONFERENCE BEIJING 2017 # 高性能高可用机票实时搜索系统 去哪儿网 梁启康 ## 议题 系统诉求 海量数据 设计思路 搜索框架 报价引擎 待解问题 ## 系统诉求 - 全网价最低 • 航线报价最全 - 实时性最好 • ## 索引 ## 报价引擎 — 组织索引 • 规则库 => 索引库 - 规则库写入量大,集群峰值达20K TPS · 要求同步延迟很低,不超过60s - 保持顺序一致性,如果先删后插变成先插后删,数据会不一致 · 数据最终一致 · 系统高可用 规则库 供应商 A 供应商 B DB Sync 供应商 M 索引库 北京 | 上海 成都 | 杭州 广州 | 郑州 表 DataSync Canal Pipeline 解析 拆分 分配 入队 PEK-SHA CAN-NNG ZK Diff 按航线分表 ## 报价引擎 一 同步系统高可用 DB主主DB主 DB备B备备 Canal 主 Canal 土 Canal 备 Canal 备 DataSync DataSync DataSync DataSync ZK0 码力 | 26 页 | 1.94 MB | 2 年前3
共 1000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 100













