Doris的数据导入机制以及原子性保证## Doris 的数据导入事务及原子性保证 杨政国 百度资深研发工程师 Doris Committer  ## 01 ## Doris简介 ## 系统定位 • 基于MPP(大规模并行处理)架构的分析型数据库 • 性能卓越,PB级别数据毫秒/秒级响应 ents/0/1/5/2/01525fea83a74444259958fe4de89db4/p7_3.jpg) 🌸 - 高并发查询,100台集群可达10w QPS - 流式导入单节点100MB/s,小批量导入毫秒延迟 ## 扩展性强 架构优雅,单集群可水平扩展至200台以上 ▶ ## 高可用 数据、元数据高可用,线上稳定服务6年 机器故障副本自动迁移 ## 整体架构简单,产品易用 任何节点都可线性扩展  ## 02 ## 导入的问题 多维报表 自助查询 用户画像 ## 典型应用场景——OLAP分析 数据源 数据存储 数据分析 数据应用 OLTP  退出 InsMsgServer,确保导入过程中不影响 InsMsgServer 运行  sql12/17/2 ## 导入 Mysql Welco MySQL Work\\ create and \\ design and run Browse Docu MySQL Connections test root Setup Options File Management Access Settings... PERFORMANCE Dashboard Performance Reports 分别导入 user.sql / detail.sql / email.sql / login.sql / pwd.sql / sign.sql / staff.sql Query 1 Administrationuser.sql 12/17/2 0 码力 | 17 页 | 1.40 MB | 2 年前3
Oracle VM VirtualBox 4.1.0 User Manual0 码力 | 284 页 | 4.76 MB | 1 年前3
Apache OFBiz Documentation Guidelines0 码力 | 21 页 | 325.77 KB | 2 年前3
Google Python Style Guide0 码力 | 30 页 | 94.81 KB | 2 年前3
6. ClickHouse在众安的实践洞察查询引擎(解析/适配) 查询服务 权限控制 MPP-clickhouse 预计算-kylin 运行环境 阿里云主机 独立服务器 第三方虚拟主机 ## Why Clickhouse? 高效的数据导入和查询性能 性能 开源 低成本,免费 Clickhosue 真正的面向列存储,支持高维度表 面向列 压缩比 高度的数据压缩比,存储成本更小 ## 易观开源OLAP引擎测评报告 内存: 96GB • 硬盘: 1TB 高效云盘,最大IO吞吐量 140MBps 以事业部、入库时间作双分区导入数据 ## 遇到的问题 导入效率: 原有导入数据方式在百亿级数据下会报Too many partitions for single INSERT block的问题 • 数据导入慢 ## 原因: • ck-loader-mr方式对大数据量场景支持不够友好 • 单次插入分区过多 ## ## 解决方法: 使用clickhouse原生insert format csv 配合linux pipeline导入 hadoop fs -cat 'hdfs://hadoop-namenode:port/user/hive/user/2013/000000_0' | clickhouse-client --host=127.0.0.1 --port=10000 -u user0 码力 | 28 页 | 4.00 MB | 2 年前3
Nim 2.0.2 中文手册错误:集合太大;对于具有超过 2^16 个元素的序数类型,请使用 `std/sets` 注意: Nim 还提供了 hash sets(sets.html)(你需要通过 import std/sets 导入它们), 它们没有这样的限制。 集合可以通过集合构造器来构造:{} 是空集。空集的类型与任何具体的集合类型兼容。构造器也可以用来包含元素(和元素范围)。 type CharSet = set[char]0 码力 | 127 页 | 7.05 MB | 1 年前3
KiCad 8.0 中文文档文件和文件夹 ..... 2 安装和升级 KiCad ..... 5 导入设置 ..... 5 从早期版本迁移文件 ..... 5 Using the KiCad project manager ..... 7 Standalone mode ..... 8 创建一个新工程 ..... 8 从其他 EDA 工具导入工程 ..... 9 Saving and loading project 文件,没有必要与工程一起发送。如果你使用版本控制系统(如 Git)来跟踪你的 KiCad 工程,你可能想把这些文件添加到被忽略的文件列表中,这样它们就不会被跟踪了。 # 安装和升级 KiCad ## 导入设置 KiCad 的每个主要版本都有自己的配置,因此您可以在同一台计算机上运行多个 KiCad 版本,而不会干扰配置。首次运行新版本的 KiCad 时,系统将询问如何初始化设置: 配置 KiCad 6/p7_1.jpg) ☐ 从早期版本导入设置(未找到) 以默认设置启动 ☒ 取消(C) ✓ 确定(0) 如果检测到以前版本的 KiCad,您可以选择从该版本导入设置。系统会自动检测以前配置文件的位置,但如果需要,您可以覆盖该位置以选择其他位置。 请注意,KiCad 前一版本的原理图符号和封装库表将不会被导入。 如果您不想从以前的版本导入设置,也可以选择从默认设置开始。 KiCad0 码力 | 24 页 | 1.29 MB | 2 年前3
Blender NIF Plugin Documentation
Release 2.6.0a0.dev40 码力 | 112 页 | 107.36 KB | 2 年前3
DBeaver User Guide v.7.00 码力 | 277 页 | 15.10 MB | 2 年前3
共 573 条
- 1
- 2
- 3
- 4
- 5
- 6
- 58













