Greenplum上云与优化# ApsaraDB for GP的定位 ## ApsaraDB for GP的定位 GP的优势? 与其他技术的对比? 为什么上云? ## ApsaraDB for GP的定位 MPP + 列存压缩 ApsaraDB for GP = 复杂SQL + 查询优化器 本地高效存储 + 高速网络 + 预置稳定资源 = 简单、高效解决大数据分析需求 ### GP vs. RDS? MPP处理举例  ### GP vs. RDS? 列存与压缩原理举例 ## Select count(*) from customer where status = valid group by city  子节点 子节点 子节点 子节点 子节点 子节点 子节点 ## ApsaraDB for GP的定位 MPP + 列存压缩 ApsaraDB for GP = 复杂SQL + 查询优化器 本地高效存储 + 高速网络 + 预置稳定资源 = 简单、高效解决大数据分析需求 # ApsaraDB for GP的内核优化0 码力 | 26 页 | 1.13 MB | 2 年前3
使用 TiDB 进行实时数据分析-马晓宇或者干脆绕过消息队列缓存,在线应用直接写入数据库 ☐ 需要系统负荷有余量 ☐ 受到较少的干扰 ☐ 使用行存格式 - 如果实时长查询快速返回结果 所有系统资源全力投入计算 ☐ 使用列存格式 ## 案例回顾 TiDB 为保证短读写,使用了行存而非列存 ☐ 分析场景下 IO 效率低于列存数据库 • 分析应用的大批量数据读取会干扰短读写 简单的限制资源方法会大大降低大查询的执行速度 如果 ☐ 应用对系统抖动敏感 那么只使用 TiDB + TiSpark 也还是歇菜 ## TiFlash Extension ( Beta 测试中 ) - 通过 Raft Learner 独立同步一套列存 Raft Learner 提供异步低消耗的副本同步 Raft Learner 读取协议配合 MVCC 提供强一致的读取 - 通过 Label 进行物理隔离 AP / TP 作业互相无影响 ## ## Why TiFlash here • 架构简化 ☐ 同一套平台覆盖多个场景 ○ 统一的运维 同一份数据的另一个副本 ☐ 无需数据转移和复杂的增量合并流程 ☐ 行存 + 索引 → 高并发短查询 ☐ 列存 + 向量化引擎 → 低并发快速批量扫表 ☐ 完整的资源隔离 ## 案例回顾 数据源 TiTiDB   # 深入浅出访存优化 by 彭于斌 (@archibate) 往期录播:https://www.bilibili.com/video/BV1fa411r7zp 课程 PPT 和代码:https://github. 第 1 章:内存带宽 ## cpu-bound 与 memory-bound - 通常来说,并行只能加速计算的部分,不能加速内存读写的部分。 - 因此,对 fill 这种没有任何计算量,纯粹只有访存的循环体,并行没有加速效果。称为内存瓶颈(memory-bound)。 - 而 sine 这种内部需要泰勒展开来计算,每次迭代计算量很大的循环体,并行才有较好的加速效果。称为计算瓶颈(cpu-bound)。 } } BENCHMARK(BM_parallel_sine); ## 浮点加法的计算量 - 冷知识:并行地给浮点数组每个元素做一次加法反而更慢。 因为一次浮点加法的计算量和访存的超高延迟相比实在太少了。 • 计算太简单,数据量又大,并行只带来了多线程调度的额外开销。 • 小彭老师经验公式:1 次浮点读写 ☐ 8 次浮点加法 - 如果矢量化成功(SSE):1 次浮点读写0 码力 | 147 页 | 18.88 MB | 2 年前3
Greenplum Database 管理员指南 6.2.1.... - 346 管理大规模集群的数据重分布..... - 346 可用磁盘空间充足的系统..... - 347 可用磁盘空间不足的系统..... - 347 重分布 AO 表和压缩表..... - 348 重分布分区表..... - 348 重分布有索引的表..... - 349 准备并添加新的计算节点主机..... - 349 将新的主机加入 ssh 互信. 第十八章:最佳实践..... - 373 最佳实践概述..... - 373 数据模型..... - 373 Heap 表与 AO 表..... - 374 行存与列存..... - 374 压缩..... - 375 分布键..... - 375 内存管理..... - 376 分区..... - 377 索引..... - 378 资源队列..... -379 .... -391 模式设计..... -392 数据类型..... -392 存储模式..... -393 压缩..... -395 分布键..... -395 分区..... -402 分区和列存的文件数..... -404 索引..... -405 资源组管理内存等资源..... -406 GP 数据库的内存配置0 码力 | 416 页 | 6.08 MB | 2 年前3
HBase基本介绍随机实时读写 十亿级行, 百万级列 每次看一个项目介绍完自己, 还是不知道他是干嘛的, 希望今天我介绍完, 大家能知道他是干嘛的 ## APACHE HBASE A Bigtable is a sparse(稀疏), distributed, persistent multidimensional sorted map. ## 回顾: 稀疏的, 行和列比较随意, 不需要固定的schema 整个数据模型就是一个按key排序的大Map, ## Agenda ★ Data Model ★ Architecture & Component ★ Schema design ### 1. Data Model 存什么样的数据 |Row Key|Time Stamp|ColumnFamily contents|ColumnFamily anchor|ColumnFamily people| |---|---|---|---|---| 一个非关系型的数据库, 我们首先要了解他的数据模型, 就是说他能存什么样的数据. 像redis是存kv结构的数据, MongoDB是存储文档型数据, 那HBase存什么样的数据? ## 数据模型 逻辑视图 · '表/行/列' • Row Key ColumnFamily列族:ColumnQualifier列限定名 分数:语文 • Version/Timestamp0 码力 | 33 页 | 4.86 MB | 2 年前3
TiDB v8.5 中文手册· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 529 5.1.7 TiFlash 存算分离架构的软硬件要求 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 529 5 pt-osc/gh-ost 工具的持续同步场景 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 686 6.5.2 下游存在更多列的迁移场景· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 688 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 2596 14.3.6 TiFlash 存算分离架构与 S3 支持 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·0 码力 | 5095 页 | 104.54 MB | 1 年前3
Apache Cassandra static column 介绍与实战static column。同一个 partition key 中被声明为 static 的列只有一个值的,也就是只存储一份。 解Spark、Hadoop或者Hbase相关的文章,欢迎关注微信公共帐号:iteblog_hadoop ## 定义 static column 在表中将某个列定义为 STATIC 很简单,只需要在列的最后面加上 STATIC 关键字,具体如下: CREATE TABLE username 只会有一个 email 和 encrypted_password。 注意,不是任何表都支持给列加上 STATIC 关键字的,静态列有以下限制。 - 如果表没有定义 Clustering columns(又称 Clustering key),这种情况是不能添加静态列的。如下: cqlsh:iteblog_keyspace> CREATE TABLE "itebl columns。这是因为静态列在同一个 partition key 存在多行的情况下才能达到最优情况,而且行数越多效果也好。但是如果没有定义 clustering column,相同 PRIMARY KEY 的数据在同一个分区里面只存在一行数据,本质上就是静态的,所以没必要支持静态列。 - 如果建表的时候指定了 COMPACT STORAGE,这时候也不允许存在静态列: cqlsh:iteblog_keyspace>0 码力 | 5 页 | 0 Bytes | 2 年前3
TiDB v7.1 中文手册· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 469 5.1.7 TiFlash 存算分离架构的软硬件要求 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 469 5 pt-osc/gh-ost 工具的持续同步场景 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 619 6.5.2 下游存在更多列的迁移场景· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 621 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 2347 14.3.6 TiFlash 存算分离架构与 S3 支持 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·0 码力 | 4369 页 | 98.92 MB | 2 年前3
Web 开发技术-JavaScriptJavaScript 功能、脚本语言 3 JavaScript 实现 ECMAScript > DOM BOM 4 在 HTML 中使用 JavaScript ➢直接嵌入 ➢外部引入 JS 代码压缩 ## 1 JavaScript 简史 ## 时代背景 ➢1995 年,拨号上网,速度仅 28.8kbit/s ## 诞生目的 用于表单验证,网速很慢,最好能将服务器语言负责的表单输入验证操 js"> ### 4.3 引入外部文件 ## JavaScript 代码压缩 优势:去除 JavaScript 文件中的注释和不必要的空格,并简化命名标识符。它通常减少了一半的文件大小,从而导致更快的下载速度,并增加了一定的安全性。 ➢扩展名:*.min.js ➢压缩工具:YUI Compressor、在线压缩(https://www.css-js.com/)等  指定有效密码 自 定 义 列 表。 密 码 列 表 的 格 式 必 须 符 合 OpenSSL 标 准。 仅 适 用 于 MySQL。TLS 参数必须指向有效文件。如果它们指向不存在或无效的文件,则将导致认证授权错误。 (MySQL)TLS 或 TLS 1.2 的 TLS 协议进行连接的加密密码的列表-DBSRCipher13-客户端允许使用 TLS 1.3 协议进行连接的加密密码的列表 接 是 使 用 提 供 的 列 表 中 的 密 码 进 行 的。 ( (Post- greSQL) 设 置 此 选 项 将 被 视 为 错 误。 1 MySQL 加密配置 总览 本节提供了一些关于 CentOS 8.2 和 MySQL 0 码力 | 2715 页 | 28.60 MB | 2 年前3
共 865 条
- 1
- 2
- 3
- 4
- 5
- 6
- 87













