Greenplum 精粹文集MPP 和 Hadoop 都是为了解决大规模数据的并行计算而出现的技术, 两种技术的相似点在于: ·分布式存储数据在多个节点服务器上 ·采用分布式并行计算框架 ·支持横向扩展来提高整体的计算能力和存储容量 ·都支持 X86 开放集群架构 但两种技术在数据存储和计算方法上,也存在很多显而易见的差异: ·MPP 按照关系数据库行列表方式存储数据(有模式),Hadoop 按照文件切片方式分布式存储(无模式)。0 码力 | 64 页 | 2.73 MB | 1 年前3
Greenplum Database 管理员指南 6.2.1端的算子往往是GP的移动算子(重分布、广播或汇总)。移动算子负责将处理过程中产 生记录在Instance之间移动。 EXPLAIN的输出中每个算子都有一行,其显示基本的算子类型和该算子的成本估算: cost -- 访问的磁盘页数量,就是说,1.0等于一个连续的磁盘页操作。第一个 值是获得第一条记录的成本,第二个值是获得所有记录的总成本。总成本是假设会检索 所有的记录,但有时并 版权所有:Esena(陈淼 +86 18616691889) 编写:陈淼 - 233 - 注意:Orca优化器和PostgreSQL优化器生成的执行计划中,cost不具有可比性。这 两个优化器,使用不同的成本估算模型和算法来评估执行计划的成本。对比两个优化器 之间的cost值是没有实际意义的。 另外,对于任意优化器生成的执行计划的cost值来说,只对当前的查询和当前的 统计信息有意义,不同的语句会生0 码力 | 416 页 | 6.08 MB | 1 年前3
共 2 条
- 1













