Greenplum介绍
数据库有一个额外的操作类型,称为的motion。 motion操作就是把查询处理过程中涉及到的其它节点 上的数据在各个节点中做移动。 GP的查询处理 为了提高执行的性能,Greenplum把执行计划进行切片 (slice)。 例如: SELECT customer, amount FROM sales JOIN customer USING (cust_id) WHERE dateCol = '04-30-2008'; GP的查询处理 在master上,查询的工作进程叫query dispatcher(QD) 在segment上,查询的工作进程叫query executor (QE) 执行计划的每个切片(slice)至少分配一个工作进程。 GP的查询处理 GP的执行计划 建测试表: create table t1(id int primary key,cn int,name varchar(40))0 码力 | 38 页 | 655.38 KB | 1 年前3Greenplum开源MPP数据库介绍
Motion q 跨节点的数据交换 q Gather汇集 (n:1), Broadcast广播 (n:n), Redistribute重分布 (n:n) Ø Slice q Motion把计划切片 q 每一片叫Slice,每一个Slice的实体是一组存在于各个节点上的进程 Ø Locus Ø 数据的分布模式 Confidential │ ©2022 VMware, Inc. 12 分布式计划举例0 码力 | 23 页 | 4.55 MB | 1 年前3Greenplum 精粹文集
·支持横向扩展来提高整体的计算能力和存储容量 ·都支持 X86 开放集群架构 但两种技术在数据存储和计算方法上,也存在很多显而易见的差异: ·MPP 按照关系数据库行列表方式存储数据(有模式),Hadoop 按照文件切片方式分布式存储(无模式)。 ·两者采用的数据分布机制不同,MPP 采用 Hash 分布,计算节点 和存储紧密耦合,数据分布粒度在记录级的更小粒度(一般在 1k 以下);Hadoop FS0 码力 | 64 页 | 2.73 MB | 1 年前3
共 3 条
- 1