数据同步 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

Redis 多数据中心双向同步祝辰

## 携程技术沙龙 Redis 多数据中心双向同步祝辰 ## 讲师介绍 ![Image](/uploads/documents/f/f/e/f/ffef9c17379b473925db673ac826312c/p2_2.jpg) ## 祝辰 • 携程框架架构部门 • 资深研发工程师 - 专注于 Redis 高可用系统的研发工作 • 对分布式存储系统有所涉猎 ## 目录 CONTENTS CONTENTS 1 开篇 2 携程的Redis架构 3 分布式理论 4 双向/多向同步的问题 5 CRDT ## 开篇 ## 19 世纪的通讯 ![Image](/uploads/documents/f/f/e/f/ffef9c17379b473925db673ac826312c/p5_2.jpg) “At 12:30 am on April 4th, 1841 President Geographical Society, 1881. ## 21 世纪的通讯同样的一张地图在今天, 仅仅需要毫秒级别的时间, 一条消息可以被全世界共享起来互联网的规模也从单独一个数据中心的部署方式转变为多数据中心, 甚至是跨区域的部署模式 ![Image](/uploads/documents/f/f/e/f/ffef9c17379b473925db673ac826312c/p7_2

0 码力 | 45 页 | 1.74 MB | 2 年前
3
携程 Redis 多数据中心双向同步实践祝辰

## 携程 Redis 多数据中心双向同步实践祝辰 ## 祝辰目前任职携程框架架构部门资深研发工程师负责框架Redis团队的开发工作目录 1 业务背景 2 双向同步 3 CRDT 4 高可用 ## 开篇 & 背景 ## Redis 在携程的规模 25,000,000 QPS ## 跨公网同步 Console SHANGHAI Data CANADA 海外用户和国内用户查询同一份数据 - 需要向供应商付费2次仓位信息供应商国内 ## 业务痛点 - 单向同步可以解决海外重复收费的问题 - 无法解决上海重复收费的问题国内 ## 业务痛点 - 我们希望可以通过Redis的双向同步解决重复收费的问题 ## 双向同步 ## Redis双向同步 SHA FRA APP APP APP APP datadata data 双向同步 Redis 家族病史：___ 其他备注：___ ## Redis双向同步 slaveof命令 - redis变成slave，同步数据 • Slave无法写入 1. slaveof 2. Sync data ## Redis双向同步 - 新的命令 “peerof” 同步数据继续保持Master的角色 1. peerof

0 码力 | 33 页 | 2.15 MB | 2 年前
3
数据迁移

## 数据迁移 ## 存量 MySQL 迁移到 TiDB 服务 UDTS 产品支持 MySQL(5.5/5.6/5.7/8.0) 到 TiDB 的全量数据迁移，及增量数据同步。可协助用户在不停机的情况下轻松将业务从 MySQL 切换至 TiDB。 ## 自建 TiDB 迁移到 TiDB 服务 UDTS 产品支持 TiDB 全量数据迁移至 TiDB 服务。用户在源 TiDB 开启 Pump, Drainer 可进行数据增量同步。UDTS 与源端 Pump, Drainer 一起可协助用户在不停机的情况下轻松将业务从自建 TiDB 切换至 TiDB 服务。 ## 为 TiDB 服务建立 MySQL 从库 UDTS 产品支持 TiDB 全量数据迁移至 MySQL 数据库。用户在 TiDB 服务上开启 Binlog 可将数据增量同步至下游 MySQL。UDTS 与 TiDB Binlog Binlog 服务一起可协助用户轻松建立 MySQL 从库。 ## 为 TiDB 服务建立 TiDB 从库 UDTS 产品支持 TiDB 全量数据迁移至 TiDB 数据库。用户在源 TiDB 服务上开启 Binlog 可将数据增量同步至下游 TiDB。UDTS 与 TiDB Binlog 服务一起可协助用户轻松建立 TiDB 从库。

0 码力 | 2 页 | 42.01 KB | 1 年前
3

SQLite 数据转 Mysql

# SQLite 数据转 Mysql #### I nsMsgServer 3.7.6 ## 当前 InHgServer 环境以下过程在 win7 sp1 x64 系统下完成, 如果您的系统不能运行以下相关程序, 请将服务器的 db/ 目录下的 IMBase.dat 文件复制到 win7 sp1 x64 系统下完成 ![Image](/uploads/documents/8/3/a/e/ p1_2.jpg) ## 利用 InHgServer 生成 Mysql 数据库确保 mysql 数据库中没有 IM 相关库 ![Image](/uploads/documents/8/3/a/e/83ae2e54cc4ee64710cafd653e8413de/p2_1.jpg) 调整使用 Mysql 作为数据库，并点击启动 ![Image](/uploads/documents /8/3/a/e/83ae2e54cc4ee64710cafd653e8413de/p2_2.jpg) 确认启动后数据库正确建立

InsMsgServer Start(2017-12-17 05:59:25)
General	Data	Network 0 码力 \| 17 页 \| 1.40 MB \| 2 年前 3 Flink如何实时分析Iceberg数据湖的CDC数据 Flink如何实时分析Iceberg数据湖的CDC数据阿里巴巴李劲松/胡争 FLINK FORWARD #ASIA 2020 #1 #2 #3 #4 常见的CDC 为何选择 Flink 如何实时写未来规划分析方案 + Iceberg 入读取 FLINK FORWARD #ASIA 2020 ## #1 常见的CDC分析方案 ## 离线 HBase 集群分析 CDC 数据 ↓ ## MySQL 3、通过RegionServer定位HFile，Server的优化和缓存完全用不上。 4、数据格式绑定HFile，不方便拓展到Parquet、Avro、Orc等。 FLINK FORWARD #ASIA 2020 ## Apache Kudu 维护 CDC 数据集 ## MySQL ## 方案评估优点 1、支持实时更新数据，时效性佳。 2、列存加速，适合OLAP分析。 ## 缺点 1、独立的Kudu集群，比较小众。维护成本高。等割裂。数据独立，且存储成本不如 S3 / OSS。 3、Kudu的批量扫描不如parquet。 4、不支持增量拉取。 FLINK FORWARD #ASIA 2020 ## MySQL → GQOOP → HVE ## 方案评估优点 1、流程能工作 2、Hive存量数据不受增量数据影响。 ## 缺点 1、数据不是实时写入； 2、每次数据导致都要 MERGE 存量数据。T+1 0 码力 \| 36 页 \| 781.69 KB \| 2 年前 3 大数据集成与Hadoop - IBM 大数据集成与 Hadoop 可最大限度降低Hadoop计划风险并提高ROI的最佳实践 ![Image](/uploads/documents/6/0/d/1/60d1a1fc09146b40702b2ad5e7fd30d7/p1_1.jpg) IBM $ ^{®} $ ## 简介 Apache Hadoop技术通过支持新的流程和架构，不断改进大数据措施的经济性和活力，这样不仅有助于削减开源软件项目，支持在多个商业服务器群集间分散处理和存储大型数据集，并可根据需求变化从单一服务器扩展到数以千计的服务器。主要的Hadoop组件包括Hadoop Distributed File System（用于存储大型文件）和Hadoop分布式并行处理框架（称为MapReduce）。但是，Hadoop基础架构本身并没有提供完整的大数据集成解决方案，摆在人们面前的既有挑战，也有机遇，只有处理好这。 ## 大数据集成对于Hadoop措施的重要性 Hadoop的迅速崛起推动企业在如何抽取、管理、转换、存储和分析大数据方面实现了范式转变。无论是要更深入的分析，还是希望获得更出色的洞察、新产品、新服务以及更高的服务水平，都可以通过这项技术一一实现，从而大幅降低成本并创造新的收入。依靠收集、移动、转换、清除、集成、治理、探索以及分析多种不同来源的大量不同类型的数据来实现大数据与Hadoop 0 码力 \| 16 页 \| 1.23 MB \| 2 年前 3 Curve元数据节点高可用 Curve元数据节点高可用 • 1. 需求 • 2. 技术选型 • 3. etcd clientv3的concurrency介绍 • 3.1 etcd clientV3的concurrency模块构成 • 3.2 Campaign的流程 • 3.2.1 代码流程说明 • 3.2.2 举例说明Campagin流程 • 3.3 Observe的流程 4. MDS使用election模块的功能进行选主区 4.2.5.1 事件一先发生 4.2.5.2 事件二先发生 4.2.6 异常情况4：Etcd集群的follower节点异常 4.2.7 各情况汇总 ### 1. 需求 mds是元数据节点，负责空间分配，集群状态监控，集群节点间的资源均衡等，mds故障可能会导致client端无法写入。因此，mds需要做高可用。满足多个mds，但同时只有一个mds节点提供服务，称该提供服务的m 熟知的就是zookeeper和etcd，考虑当前系统中mds有两个外部依赖模块，一是mysql，用于存储集群拓扑的相关信息；二是etcd，用于存储文件的元数据信息。而etcd可以用于实现mds高可用，没必要引入其他组件。使用etcd实现元数据节点的leader主要依赖于它的两个核心机制：TTL和CAS。TTL(time to live)指的是给一个key设置一个有效期，到期后key会被自 0 码力 \| 30 页 \| 2.42 MB \| 1 年前 3 Greenplum 新一代数据管理和数据分析解决方案 ## Greenplum ## 新一代数据管理和数据分析解决方案 ## 关于Greenplum公司 ![Image](/uploads/documents/9/8/b/3/98b3d2ca5ab52d44cfe0bd9d7d1dfbef/p2_1.jpg) ## Greenplum ![Image](/uploads/documents/9/8/b/3/98b3d2ca5ab52d44 cfe0bd9d7d1dfbef/p2_2.jpg) - Greenplum是一家数据库软件公司，在数据处理和BI/DW领域，提供容量最大、速度最快、性价比最好的数据库引擎产品和服务。 • Greenplum总部位于圣马蒂奥，加利福尼亚州，美国，成立于2003年6月。 • Greenplum 中国于2008年12月正式成立. 官方网站： www.greenplum.com www.greenplum-china ts/9/8/b/3/98b3d2ca5ab52d44cfe0bd9d7d1dfbef/p2_3.jpg) ## Greenplum: 简介 ## 推动数据依赖型企业的发展 Greenplum数据引擎软件为新一代数据仓库所需的大规模数据和复杂查询功能所设计 ## 全球各地的一些Greenplum客户 ## 亚太地区 ## 欧洲、中东、非洲 ## 北美 ![Image](/upload 0 码力 \| 45 页 \| 2.07 MB \| 2 年前 3 大数据时代的Intel之Hadoop ## 大数据时代的Intel之Hadoop 系统方案架构师：朱海峰英特尔 $ ^{®} $ 中国云计算创新中心 2013.4 北京 ## 法律声明本文所提供之信息均与英特尔 $ ^{®} $ 产品相关。本文不代表英特尔公司或其它机构向任何人明确或隐含地授予任何知识产权。除相关产品的英特尔销售条款与条件中列明之担保条件以外，英特尔公司不对销售和/或使用英特尔产品做出其它任何明确或隐含的担 2012英特尔公司。所有权保留。 ## 提纲 • 大数据时代的新挑战 • 大数据时代的Intel • 关注产业应用，产研相互促进 ## 大数据时代的数据 ![Image](/uploads/documents/6/e/5/1/6e51d0ecc4e60eef9dfe8d45e965aa37/p4_1.jpg) 从文明诞生到2003年，人类文明产生了5EB的数据；而今天，我们每两天产生5EB的数据。 Eric Schmidt Schmidt Google 2011年每天处理的数据超过： 24 PB ![Image](/uploads/documents/6/e/5/1/6e51d0ecc4e60eef9dfe8d45e965aa37/p4_2.jpg) ![Image](/uploads/documents/6/e/5/1/6e51d0ecc4e60eef9dfe8d45e965aa37/p4_3.jpg) 0 码力 \| 36 页 \| 2.50 MB \| 2 年前 3 TensorFlow on Yarn：深度学习遇上大数据 ## 深度学习 + 大数据 TensorFlow on Yarn ## 李远策 2017年4月17日 ![Image](/uploads/documents/3/c/8/6/3c8605215c91326185ac873f441c0df8/p1_1.jpg) ![Image](/uploads/documents/3/c/8/6/3c8605215c91326185ac873f441c0df8/p1_2 Yarn技术细节揭秘 ➢ 深度学习平台演进及SparkFlow介绍 ## 背景坐标：360-系统部-大数据团队专业：Yarn、Spark、MR、HDFS … 挑战：深度学习空前火爆，各种深度学习框架层出不穷，业务部门拥抱新兴技术。平台怎么应对？机遇：Maybe 深度学习 + 大数据 ![Image](/uploads/documents/3/c/8/6/3c8605215c91326 "ps1.example.com:2222" ] }) 带来的问题: - 手动指定机器很繁琐 - 端口冲突 - 机器负载不均 ## TensorFlow使用现状及痛点数据分发 / 模型保存 ![Image](/uploads/documents/3/c/8/6/3c8605215c91326185ac873f441c0df8/p6_2.jpg) - 手动分发训练样本 0 码力 \| 32 页 \| 4.06 MB \| 2 年前 3 共 1000 条 1 2 3 4 5 6 100 前往页相关搜索词 Redis 分布式存储双向同步数据一致性 CRDT 多数据中心高可用 UDTS 数据迁移增量同步 TiDB MySQL SQLite 数据导出 SQL Maestro 数据导入 Flink Iceberg数据湖 CDC数据增量拉取实时分析 Hadoop 大数据集成 MapReduce 数据治理数据集成平台 etcd 选举机制异常情况 lease过期 Greenplum 数据引擎海量并行处理数据分析解决方案大数据 Intel 分布式计算数据处理 TensorFlow on Yarn 集成资源管理分布式训练集群调度关于我们文库协议联系我们意见反馈免责声明本站文档数据由用户上传或本站整理自互联网，不以营利为目的，供所有人免费下载和学习使用。如侵犯您的权益，请联系我们进行删除。 IT文库 ©1024 - 2026 \| 站点地图 Powered By MOREDOC AI v3.5.0-beta.10

分类

语言

格式

Redis 多数据中心双向同步祝辰

携程 Redis 多数据中心双向同步实践祝辰

数据迁移

SQLite 数据转 Mysql

Flink如何实时分析Iceberg数据湖的CDC数据

大数据集成与Hadoop - IBM

Curve元数据节点高可用

Greenplum 新一代数据管理和数据分析解决方案

大数据时代的Intel之Hadoop

TensorFlow on Yarn：深度学习遇上大数据

搜索

分类

语言

格式