Greenplum Database 管理员指南 6.2.1(只要该层级中存在)总是会被扫描,如果默认分区中包含数据,其一定会影响处理时 间。对于Orca优化器来说,如果查询条件不涉及默认分区,则不会扫描默认分区,如 果分区条件不是常量,Orca还会进行动态分区裁剪。 在使用COPY或者INSERT向ROOT表装载数据时,这些数据会默认自动路由到正确 的叶子分区。因此,可以像使用普通的未分区表一样插入数据到分区表。 Greenplum Database E,因此,如果自定义函数是 IMMUTABLE或者STABLE的,在创建函数时应该明确指定其VOLATILE属性,这一点很 重要,不然,VOLATILE的函数用于查询条件时,将无法被优化,会影响分区裁剪等。 注意,对于有副作用的函数(例如修改表中数据,执行Linux命令等),必须指定为 VOLATILE类型,否则,即便创建时不会报错,也将无法正常调用。 CREATE FUNCTION时缺省的EXECUTE 在1亿条以上。同时,单表,在单个Primary上的记录数低于500万条时,建议不 做分区,即,比如集群有100个Primary,单表记录数在5亿以下时,可以不分区。 应该检查执行计划,是否有分区裁剪,以确定分区是否对查询有帮助。 当需要对列存表进行分区时,每个分区的记录数应该更大,因为列存表是按照每个 字段作为一个单独的数据文件来存储的。整个分区表的数据文件数量为: 文件数量0 码力 | 416 页 | 6.08 MB | 1 年前3
Greenplum 6: 混合负载的理想数据平台Efficiently Processing Complex Correlated Queries 01 Dynamic Partition Elimination 03 动态分区裁剪 公共表达式的下推 高效处理相关子查询 超过8年的投资,多位博士的长期贡献 基于Cascades / Volcano框架, Goetz Graefe 优化分布式大数据系统中特别复杂的查询 180 码力 | 52 页 | 4.48 MB | 1 年前3
共 2 条
- 1













