-
Doris 的数据导入事务及原子性保证
杨政国 百度资深研发工程师 Doris Committer

## 01
## Doris简介
## 系统定位
• 基于MPP(大规模并行处理)架构的分析型数据库
• 性能卓越,PB级别数据毫秒/秒级响应 性能卓越,PB级别数据毫秒/秒级响应
• 适用于高并发、低延时下的多维分析、实时报表等场景
• 由百度自研,2017年开源,2018年贡献给Apache社区后更名为 Apache Doris
百度内部统称其为“百度数据仓库Palo”,同时百度云上提供Palo的企业级托管版本
## 发展历程

## 2008
1.0版本正式上线
- 应用于百度凤巢统计报表的需求场景,上线后数据更新频率从天级提升至分钟级
## 2009
- 进行了通用化改造,开始承接公司内部其他报表系统
- 助力百度统计成为国内最大的中文网站分析工具
## 2012
- 随百度业务飞速发展,
0 码力 |
33 页 |
21.95 MB
| 2 年前 3
-
Curve元数据节点高可用
• 1. 需求
• 2. 技术选型
• 3. etcd clientv3的concurrency介绍
• 3.1 etcd clientV3的concurrency模块构成
• 3.2 Campaign的流程
• 3.2.1 代码流程说明
• 3.2.2 举例说明Campagin流程
• 3.3 Observe的流程
4. MDS使用election模块的功能进行选主 事件二先发生
4.2.6 异常情况4:Etcd集群的follower节点异常
4.2.7 各情况汇总
### 1. 需求
mds是元数据节点,负责空间分配,集群状态监控,集群节点间的资源均衡等,mds故障可能会导致client端无法写入。
因此,mds需要做高可用。满足多个mds,但同时只有一个mds节点提供服务,称该提供服务的mds节点为主,等待节点为备;主节点的服务挂掉之后,备节点能启动服 储集群拓扑的相关信息;二是etcd,用于存储文件的元数据信息。而etcd可以用于实现mds高可用,没必要引入其他组件。
使用etcd实现元数据节点的leader主要依赖于它的两个核心机制:TTL和CAS。TTL(time to
live)指的是给一个key设置一个有效期,到期后key会被自动删掉。这在很多分布式锁的实现上都会用到,可以保证锁的实时性和有效性。CAS(Atomic Compa
0 码力 |
30 页 |
2.42 MB
| 1 年前 3
-
## 高可用分布式流数据存储设计
李玥
京东集团 技术架构部 架构师
## TGO鲲鹏会 汇聚全球科技领导者的高端社群
全球12大城市
850+高端科技领导者
使命
Mission
为社会输送更多优秀的
科技领导者
## 愿景 Vision
构建全球领先的有技术背景
优秀人才的学习成长平台

## 自我介绍
## 李玥
京东集团 技术架构部 架构师
负责主导设计新一代京东消息中间件系统,专注于流数据的一致性分发和可靠存储、分布式实时计算和高可用分布式系统架构等技术领域。
从事互联网研发、架构10余年,曾在浪潮集团、当当网等公司从事架构相关工作。2017年加入京东,期间提升京东商城相关系统的性能和吞吐量数倍。
目 能与开源。
Why 有什么用?
What 如何定位?如何融入生态系统?
How 如何实现?如何优化?
## 目录
## WHY
## 为什么需要流数据存储?
## 那些年的服务
单体应用
烟筒式
SOA
微服务
## 这些年的数据
Services
## ☐ → ☐
Data
Hive
ES
HBase
HDFS
KV
## 我们的愿景
Services
## O
0 码力 |
36 页 |
6.02 MB
| 2 年前 3
-
## MYSQL 高可用方案探究
1 前言.....3
2 Lvs+Keepalived+Mysql 单点写入主主同步高可用方案.....3
2.1 方案简介.....3
2.2 方案架构图.....3
2.3 方案优缺点.....4
2.4 方案实战.....4
2.4.1 适用场景.....4
2.4.2 实战环境介绍.....4
2.4.3 Mysql 的安装和配置 backup 的 realserver 的配置.....7
2.4.9 Master 和 backup 的启动.....8
2.4.10 高可用方案测试.....9
3 Lvs+Keepalived+Mysql 单点写入读负载均衡主主同步高可用方案.....9
3.1 方案简介.....9
3.2 方案架构图.....9
3.3 方案优缺点.....9
3.4 适用场景 11
3.5.7 Master 和 backup 的 realserver 的配置.....15
3.5.8 Master 和 backup 的启动.....16
4 Heartbeat 高可用 Mysql 主主同步方案.....16
4.1 方案简介.....16
4.2 方案优缺点.....16
4.3 方案架构图.....17
4.4 适用场景.....17
4
0 码力 |
31 页 |
874.28 KB
| 1 年前 3
-
## 数据迁移
## 存量 MySQL 迁移到 TiDB 服务
UDTS 产品支持 MySQL(5.5/5.6/5.7/8.0) 到 TiDB 的全量数据迁移,及增量数据同步。可协助用户在不停机的情况下轻松将业务从 MySQL 切换至 TiDB。
## 自建 TiDB 迁移到 TiDB 服务
UDTS 产品支持 TiDB 全量数据迁移至 TiDB 服务。用户在源 TiDB 开启 Pump, Drainer 可进行数据增量同步。UDTS 与源端 Pump, Drainer 一起可协助用户在不停机的情况下轻松将业务从自建 TiDB 切换至 TiDB 服务。
## 为 TiDB 服务建立 MySQL 从库
UDTS 产品支持 TiDB 全量数据迁移至 MySQL 数据库。用户在 TiDB 服务上开启 Binlog 可将数据增量同步至下游 MySQL。UDTS 与 TiDB Binlog Binlog 服务一起可协助用户轻松建立 MySQL 从库。
## 为 TiDB 服务建立 TiDB 从库
UDTS 产品支持 TiDB 全量数据迁移至 TiDB 数据库。用户在源 TiDB 服务上开启 Binlog 可将数据增量同步至下游 TiDB。UDTS 与 TiDB Binlog 服务一起可协助用户轻松建立 TiDB 从
库。
0 码力 |
2 页 |
42.01 KB
| 1 年前 3
-
Global DevOps Summit 全球敏捷运维峰会
基于ClickHouse+StarRocks 构建支撑千亿级数据量的高可用查询引擎
演讲人:蔡岳毅
1. 为什么选择ClickHouse/StarRocks;
2. ClickHouse/StarRocks 的高可用架构;
3. 如何合理的应用ClickHouse的优点,StarRocks如何来补充ClickHouse的短板;
4 1. 不固定的查询条件,不固定的汇总条件;
2. 数据量日益增量,每天要更新的数据量也不断增大;
3. 业务场景不断增多,涉及面越来越广;
4. 需要保证高可用并秒出;
5. 从Sql,Es,CrateDB,Kylin,Ingite,MongoDB,Hbase不断的研究,实践;
## ClickHouse 的特点
## 优点:
1. 数据压缩比高,存储成本相对非常低;
2. 支持常用的 支持常用的SQL语法,写入速度非常快,适用于大量的数据更新;
3. 依赖稀疏索引,列式存储,cpu/内存的充分利用造就了优秀的计算能力,并且不用考虑左侧原则;
## 缺点:
1. 不支持事务,没有真正的update/delete;
2. 不支持高并发,可以根据实际情况修改qps相关配置文件;

## 利用 InHgServer 生成 Mysql
数据库
确保 mysql
数据库中没有 IM 相关库

调整使用 Mysql 作为
数据库,并点击启动

确认启动后
数据库正确建立
| InsMsgServer Start(2017-12-17 05:59:25) |
| General | Data | Network | 0 码力 |
17 页 |
1.40 MB
| 2 年前 3
-
# MySQL協助您搭建全方位的高可用應用 杜修文 甲骨文全球事業部
## 安全港声明
以下内容旨在阐明产品的整体方向。该内容仅供参考,不可纳入任何合同。该信息不承诺提供任何资料、代码或功能,并且不应该作为制定购买决策的依据。本文档所述的 Oracle 产品的任何特性或功能的开发、发行和时间规划均由 Oracle 自行决定。
## MySQL 高可用性解决方案

## 支持高可用性的各个层 并不仅仅是可靠地存储数据
冗余应用服务器
数据的冗余访问路径

数据路由
数据冗余存储
## 支持高可用性的各个层 并不仅仅是可靠地存储数据
冗余应用服务器
数据的冗余访问路径

• MySQL Replication
数据冗余存储
• Shared Storage
• Group Replication
• MySQL Cluster
## MySQL 复制工作流
二进制日志
会话
转储
中继日志
0 码力 |
40 页 |
2.19 MB
| 2 年前 3