裁剪 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Greenplum Database 管理员指南 6.2.1

(只要该层级中存在)总是会被扫描，如果默认分区中包含数据，其一定会影响处理时间。对于Orca优化器来说，如果查询条件不涉及默认分区，则不会扫描默认分区，如果分区条件不是常量，Orca还会进行动态分区裁剪。在使用COPY或者INSERT向ROOT表装载数据时，这些数据会默认自动路由到正确的叶子分区。因此，可以像使用普通的未分区表一样插入数据到分区表。 Greenplum Database E，因此，如果自定义函数是 IMMUTABLE或者STABLE的，在创建函数时应该明确指定其VOLATILE属性，这一点很重要，不然，VOLATILE的函数用于查询条件时，将无法被优化，会影响分区裁剪等。注意，对于有副作用的函数(例如修改表中数据，执行Linux命令等)，必须指定为 VOLATILE类型，否则，即便创建时不会报错，也将无法正常调用。 CREATE FUNCTION时缺省的EXECUTE 在1亿条以上。同时，单表，在单个Primary上的记录数低于500万条时，建议不做分区，即，比如集群有100个Primary，单表记录数在5亿以下时，可以不分区。  应该检查执行计划，是否有分区裁剪，以确定分区是否对查询有帮助。  当需要对列存表进行分区时，每个分区的记录数应该更大，因为列存表是按照每个字段作为一个单独的数据文件来存储的。整个分区表的数据文件数量为：文件数量

0 码力 | 416 页 | 6.08 MB | 1 年前
3
Greenplum 6: 混合负载的理想数据平台

Efficiently Processing Complex Correlated Queries 01 Dynamic Partition Elimination 03 动态分区裁剪公共表达式的下推高效处理相关子查询超过8年的投资，多位博士的长期贡献基于Cascades / Volcano框架, Goetz Graefe 优化分布式大数据系统中特别复杂的查询 18

0 码力 | 52 页 | 4.48 MB | 1 年前
3

共 2 条前往

页

Greenplum Database 管理管理员指南混合负载理想数据平台

分类

语言

格式

Greenplum Database 管理员指南 6.2.1

Greenplum 6: 混合负载的理想数据平台