高可用分布式流数据存储设计-李玥## 高可用分布式流数据存储设计 李玥 京东集团 技术架构部 架构师 ## TGO鲲鹏会 汇聚全球科技领导者的高端社群 全球12大城市 850+高端科技领导者 使命 Mission 为社会输送更多优秀的 科技领导者 ## 愿景 Vision 构建全球领先的有技术背景 优秀人才的学习成长平台  ## 自我介绍 ## 李玥 京东集团 技术架构部 架构师 负责主导设计新一代京东消息中间件系统,专注于流数据的一致性分发和可靠存储、分布式实时计算和高可用分布式系统架构等技术领域。 从事互联网研发、架构10余年,曾在浪潮集团、当当网等公司从事架构相关工作。2017年加入京东,期间提升京东商城相关系统的性能和吞吐量数倍。 能与开源。 Why 有什么用? What 如何定位?如何融入生态系统? How 如何实现?如何优化? ## 目录 ## WHY ## 为什么需要流数据存储? ## 那些年的服务 单体应用 烟筒式 SOA 微服务 ## 这些年的数据 Services ## ☐ → ☐ Data Hive ES HBase HDFS KV ## 我们的愿景 Services ## O0 码力 | 36 页 | 6.02 MB | 2 年前3
OpenShift Container Platform 4.14 存储### OpenShift Container Platform 4.14 ## 存储 在 OpenShift Container Platform 中配置和管理存储 Powered by TCPDF (www.tcpdf.org) 在 OpenShift Container Platform 中配置和管理存储 ## 法律通告 Copyright $ ^{©} $ 2023 Red Hat owners. ## 摘要 本文档提供了使用不同存储后端配置持久性卷以及通过 pod 管理动态分配存储的信息。 ## 目录 第1章 OPENSHIFT CONTAINER PLATFORM 存储概述 ..... 4 1.1. OPENSHIFT CONTAINER PLATFORM 存储的常见术语表 ..... 4 1.2. 存储类型 ..... 6 1.3. CONTAINER 1.4. 动态置备 ..... 6 第2章 了解临时存储 ..... 7 2.1. 概述 ..... 7 2.2. 临时存储的类型 ..... 7 2.3. 临时存储管理 ..... 7 2.4. 监控临时存储 ..... 8 第3章 了解持久性存储 ..... 10 3.1. 持久性存储概述 ..... 10 3.2. 卷和声明的生命周期 ....0 码力 | 215 页 | 2.56 MB | 2 年前3
OpenShift Container Platform 4.8 存储### OpenShift Container Platform 4.8 ## 存储 在 OpenShift Container Platform 中配置和管理存储 Powered by TCPDF (www.tcpdf.org) 在 OpenShift Container Platform 中配置和管理存储 ## 法律通告 Copyright $ ^{©} $ 2023 Red Hat owners. ## 摘要 本文档提供了使用不同存储后端配置持久性卷以及通过 pod 管理动态分配存储的信息。 ## 目录 第1章 OPENSHIFT CONTAINER PLATFORM 存储概述 ..... 4 1.1. MODULES/OPENSHIFT-STORAGE-COMMON-TERMS.ADOC ..... 4 1.2. 存储类型 ..... 6 1.3. CONTAINER 1.4. 动态置备 ..... 6 第2章 了解临时存储 ..... 7 2.1. 概述 ..... 7 2.2. 临时存储的类型 ..... 7 2.3. 临时存储管理 ..... 7 2.4. 监控临时存储 ..... 7 第3章 了解持久性存储 ..... 9 3.1. 持久性存储概述 ..... 9 3.2. 卷和声明的生命周期 ..... 90 码力 | 118 页 | 1.60 MB | 2 年前3
高性能 Kubernetes 元数据存储 KubeBrain 的设计思路和落地效果-许辰ss 节跳动高性能 K8s 元信息存储 许搬 字节跳动资深研发工程师 企业数字化传播一站式服务. InfoQ 企业会员是为满足企业在中国开发者群体中的品牌曝光需求而推出的一款和矩阵化资源包。可为企业提供 包括“ 企业号服务 "、“ 企业动态宣发 ”、” 品牌展示通道 ”在内的多项专属权益与服务,助力企业高效触达开发 者群体,提升数字化时代影响力。 企业号服务 企业动态宣发 KubeGateway/ KubeZoo 等多个项目的发起人 大纲 . 背景介绍 , 设计思路 。性能优化 。落地效果 。未来演进 呈 各 Kubernetes 规模增大 10 倍以上 公司业务快速发展 存储、大数据、机器学习等场景云原生化 新场景对 Kubernetes 性能要求更高 离线场景,Pod 生命周期短、变更频率高 如何扩展 Kubernetes 集群 多个集群横向扩展 Kubernetes | apiserwEF 中心化架构 随着规模增大存储系统成为瓶颈 所有组件通过 apisever 交互 etcd 存在性能问题 Summt etcd 人存在的问题 1 Expensive Read 存在大量内存持贝0 码力 | 60 页 | 8.02 MB | 2 年前3
Curve 分布式存储设计## Curve 分布式存储设计 程义 — Curve Maintainer   Curve块存储 和 Curve文件存储  第四 Curve社区 ## Curve的由来 1. 代码复杂/代码量大 2. 运维难度高 3. 无法满足高的性能需求 ## Curve的设计目标 1. Curve云原生软件定义存储 2. Curve块存储 3. Curve文件存储 4. 高性能,易运维,云原生  ## Curve块存储 ## 研究现状 1. 高性能分布式共享数据库场景 2. Curve块存储提供底层分布式共享存储 3. Polardb for0 码力 | 20 页 | 4.13 MB | 1 年前3
Raft在Curve存储中的工程实践raft在Curve存储中的工程实践 D I G I T A L S A I L 陈威 Curve Maintaner 网易资深服务端开发工程师 01 Curve介绍 项目背景 | Curve架构 | 使用场景 | Curve社区 raft和braft raft协议介绍 | braft介绍 raft在Curve中的应用 raft in Curve块存储 | raft curve文件存储 | 配置变更 Curve对raft的优化 优化点1 | 优化点2 05 Q&A 答疑 ## 项目背景 ## Curve是一个高性能、更稳定、易运维的云原生分布式存储系统,支持块存储和文件存储 Curve块存储和文件存储均采用raft协议 ## 2021 ~2022 Curve文件存储 ## 2018 ~2021 Curve块存储 • 基于Openstack构建云计算平台 基于Openstack构建云计算平台 • 底层存储使用Ceph块存储 • 稳定性挑战 • 算力平台kubernetes的迅速发展 AI/大数据业务的快速增长 • 存储使用Ceph文件存储/HDFS • 成本/性能挑战 ## 整体架构 0 码力 | 29 页 | 2.20 MB | 1 年前3
数据迁移## 数据迁移 ## 存量 MySQL 迁移到 TiDB 服务 UDTS 产品支持 MySQL(5.5/5.6/5.7/8.0) 到 TiDB 的全量数据迁移,及增量数据同步。可协助用户在不停机的情况下轻松将业务从 MySQL 切换至 TiDB。 ## 自建 TiDB 迁移到 TiDB 服务 UDTS 产品支持 TiDB 全量数据迁移至 TiDB 服务。用户在源 TiDB 开启 Pump, Drainer 可进行数据增量同步。UDTS 与源端 Pump, Drainer 一起可协助用户在不停机的情况下轻松将业务从自建 TiDB 切换至 TiDB 服务。 ## 为 TiDB 服务建立 MySQL 从库 UDTS 产品支持 TiDB 全量数据迁移至 MySQL 数据库。用户在 TiDB 服务上开启 Binlog 可将数据增量同步至下游 MySQL。UDTS 与 TiDB Binlog Binlog 服务一起可协助用户轻松建立 MySQL 从库。 ## 为 TiDB 服务建立 TiDB 从库 UDTS 产品支持 TiDB 全量数据迁移至 TiDB 数据库。用户在源 TiDB 服务上开启 Binlog 可将数据增量同步至下游 TiDB。UDTS 与 TiDB Binlog 服务一起可协助用户轻松建立 TiDB 从 库。0 码力 | 2 页 | 42.01 KB | 1 年前3
陈宗志:大容量redis存储方案--Pika## 大容量redis存储方案--Pika 陈宗志 360基础架构组技术经理 ## 简介 ## • 13年入职360 基础架构组 – Bada – Pika – Zeppelin – Mario, Pink, slash, floyd • https://github.com/Qihoo360 ## 概要 - 存在问题 - 分析问题 - 解决问题 - Pika vs redis 协议, 用户不需要修改任何代码进行迁移 ## Pika User • Redis实例数量:6000+个 • 日访问量:5000+亿 • Pika数据数量:1000+个 • 日访问量:1000+亿 • 覆盖率:80%以上业务线 • 单份数据体积:6.8T ## UserList  关注InfoQ官方信息 及时获取QCon软件开发者大会演讲视频信息 动态置备持久性卷声明存储类FlexVolumeContainer Storage Interface (CSI)持久性卷KubeBrainetcd分片消息顺序水平扩展Curve块存储Curve文件存储高性能云原生分布式存储Raft协议Curve存储ChunkServerCopyset快照机制UDTS数据迁移增量同步TiDBMySQLPikaRedis大容量持久化存储主从切换OzoneHadoop小文件问题元数据管理分布式KV存储系统节点高可用异地容灾服务可用性数据迁移优化













