Greenplum Database 管理员指南 6.2.1SEQUENCES IN SCHEMA public FROM bob; 需要注意的是,GRANT ALL IN SCHEMA 语法只是将当前状态下 Schema 内现有 的对象进行授权,之后创建的对象不包含在本次授权中,从原理上来说,GRANT ALL IN SCHEMA 语法是一种内置的循环授权的方式,并不是在 Schema 上保存权限信息。 模拟 Row 级别的权限控制 GP 句是等价的。 注意:日期间隔不能跨越 Saturday(周六)。 Incorrect:DENY BETWEEN DAY 'Saturday' AND DAY 'Sunday' 正确语法为: DENY DAY 'Saturday' DENY DAY 'Sunday' 例子: 下面的例子说明在 CREATE ROLE 和 ALTER ROLE 的时候使用时间约束。这里只 pygresql.org 使用通用API来访问GP的说明: 1. 下载相应的语言和对应平台的API文件。例如下载JDK和JDBC。 2. 编写相应的程序连接GP。需要注意SQL的语法支持问题。 下载合适的PostgreSQL驱动并配置到Master Instance的连接。 第三方客户端工具 很多第三方的ETL和BI工具使用标准的API如ODBC、JDBC,都可以通过配置连接0 码力 | 416 页 | 6.08 MB | 1 年前3
Greenplum数据库架构分析及5.x新功能分享流处理 在线系统扩展 任务管理 服务 加载 & 数据联邦 高速数据加载 近实时数据加载 任意系统数据访问 存储 & 数据访问 混合存储引擎(行存&列存) 多种压缩,多级分区表 索引(B树,位图,GiST) 安全性 语言支持 标准SQL支持,SQL 2003 OLAP扩展 支持 MapReduce 扩展编程语言 (Python,R, Java, Perl, C/C++) 第三方工具 调度器 执行器 解析器执行词法分 析、语法分析并生 成 解析树 客户端 主节点接受客户连接, 处理请求,执行认证 解析器 主节点 17 Pivotal Confidential–Inter nal Use Only 优化器 本地存储 主节点Segment 系统表 分布式事务 Interconnect 调度器 执行器 解析器 优化器 处理解析树,生成 查询计划 查询计划描述了如0 码力 | 44 页 | 8.35 MB | 1 年前3
Greenplum数据仓库UDW - UCloud中立云计算服务商在导⼊⼤量的数据的时候我们建议不要使⽤insert⼀条条的导⼊数据、强烈建议使⽤copy、udwfile导⼊数据。 insert加载数据 加载数据 我们可以通过insert插⼊数据到udw,语法如下所⽰: INSERT INTO 表名 [ ( 字段 [, ...] ) ] { DEFAULT VALUES | VALUES ( { 表达式 | DEFAULT } [, ...] ) | 数据已经在udw中,也可以通过insert into table1 select * from table2这种⽅式加载数据。 copy加载数据 加载数据 我们可以⽤copy快速加载⽂件数据到udw。具体语法如下: 数据导⼊ Greenplum数据仓库 UDW Copyright © 2012-2021 UCloud 优刻得 73/206 cat /data/test.dat | psql -h hostIP 79/206 或者通过下⾯sql查看 select datname from pg\_database; (超级⽤⼾) 2.3 变更数据库 变更数据库 使⽤ALTER DATABASE命令,语法如下: ALTER DATABASE name [ [ WITH ] option [ ... ] ] where option can be: CONNECTION LIMIT connlimit0 码力 | 206 页 | 5.35 MB | 1 年前3
Greenplum机器学习⼯具集和案例Processing ⼯工作原理理 2017.thegiac.com C API (Greenplum, PostgreSQL, HAWQ) 底层抽象层 (数组操作、类型转换、数值计算库等) 数据库内建函 数 ⽤用户接⼝口 ⾼高层抽象层 (迭代控制器器) 内循环函数 (实现机器器学习逻辑) Python SQL C++ MADlib 架构 2017.thegiac Spark: 不不同的产品,侧重点不不同 MADlib Spark 算法库 易用性 需要编程 查询优化 成熟度稍差 内存和流处理 通过 Gemfire SQL 语法支持 需要提升 磁盘数据 不是核心焦点 并发性能 不是核心焦点 大数据关联 不是核心焦点 2017.thegiac.com ⽤用户案例例 1 Greenplum0 码力 | 58 页 | 1.97 MB | 1 年前3
Pivotal Greenplum 5: 新一代数据平台的自定义分词器和一个通用查询处理器(可接受 来自支持的 Solr 查询处理器的采用混合语法的查询)。PostGIS 程序包是 PostgreSQL 的空间数据库扩展,可让地理信息 系统 (GIS) 对象存储在数据库中。Pivotal Greenplum PostGIS 扩展包括支持使用基于 GiST 的 R 树空间索引和函数分析和处 理 GIS 对象。 图 3:Pivotal Greenplum0 码力 | 9 页 | 690.33 KB | 1 年前3
完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum体文本的自定义分词器和一个通用查询处理器(可接 受来自支持的 Solr 查询处理器的采用混合语法的查询)。PostGIS 程序包是 PostgreSQL 的空间数据库扩展,可让地 理信息系统 (GIS) 对象存储在数据库中。Greenplum PostGIS 扩展包括支持使用基于 GiST 的 R 树空间索引和函数分 析和处理 GIS 对象。 完全兼容欧拉开源操作系统的 HTAP 数据平台0 码力 | 17 页 | 2.04 MB | 1 年前3
Greenplum 排序算法9 8 7 7 9 6 3 2 1 分治法 9 快速排序 ● 快速排序算法: 10 堆排序是最常用的排序算法,由J.Williams在1964年发明。 ● 堆是一种近似完全二叉树的结构,最大值堆要求每个子节点的键值总是小于父 节点。最小值堆要求每个子节点的键值总是大于父节点。 堆排序算法 ● 步骤1:建立最大值堆,最大元素在堆顶 ● 步骤2:重复将堆顶元组移除并插入到排序数组,更新堆使其保持堆的性质 输 出 缓 冲 区 输 入 缓 冲 区 27 败者树算法(GP目前使用堆): ● 1. 输入每个顺串的第一个记录作为败者树的叶子节点。建立初始化败者树。 ● 2. 两两相比较,父亲节点存储了两个节点比较的败者(节点较大的值);胜利者 (较小者)可以参与更高层的比赛。这样树的顶端就是当次比较的冠军(最小 者)。 ● 3. 调整败者树,当我们把最小者输入到输出文件以后,需要从相应的顺串取出 一个记录补上去。补回来的时候,我们就需要调整败者树,我们只需要沿着当前 节点的父亲节点一直比较到顶端。比较的规则是与父亲节点比较,胜者可以参 与更高层的比较,一直向上,直到根节点。失败者留在当前节点。 败者树 28 败者树 1 10 30 44 56 . . . 6 8 34 64 66 . . . 7 11 12 13 17 . . . 22 55 67 77 79 . . .0 码力 | 52 页 | 2.05 MB | 1 年前3
Greenplum介绍一般的dml语句。 Greenplum3.X不支持表空间。4.0提供了支持 tablespace功能。 不支持trigger。 建表语句多了distributed by 子名外, 其它的SQL语法 基本上都与PostgreSQL一样: CREATE TABLE products (name varchar(40), prod_id integer, supplier_id integer) foo (a int, b text) WITH (appendonly=true, compresstype=zlib, compresslevel=5); GP使用人性化的partion语法支持分区表 CREATE TABLE sales (id int, date date, amt decimal(10,2)) DISTRIBUTED BY (id) PARTITION BY '2008-01-01') INCLUSIVE END (date '2009-01-01') EXCLUSIVE EVERY (INTERVAL '1 day') ); GP使用人性化的partion语法支持分区表 CREATE TABLE sales (id int, date date, amt decimal(10,2)) DISTRIBUTED BY (id) PARTITION BY0 码力 | 38 页 | 655.38 KB | 1 年前3
Greenplum 精粹文集确实胜出一筹。 Big Date2.indd 4 16-11-22 下午3:38 Greenplum 精粹文集 5 1) PG 有非常强大 SQL 支持能力和非常丰富的统计函数和统计语法 支持,除对 ANSI SQL 完全支持外,还支持比如分析函数(SQL2003 OLAP window 函数),还可以用多种语言来写存储过程,对于 Madlib、R 的支持也很好。这一点上 MYSQL 布式存储技术结合,推出了 HAWQ 高级数据分析软件系统,实现 了 Hadoop 上的 SQL-On-Hadoop。 与其它的 SQL-on-HADOOP 系统不同,HAWQ 支持完全的 SQL 语法 和 SQL2003 OLAP 语法及 Cost-Base 的算法优化,让用户 就像使用关系型数据库一样使用 Hadoop。底层存储采用 HDFS, HAWQ 实现了计算节点和 HDFS 数据节点的解耦,采用 MR2 和功能上的差距,Hadoop 还有很长的一段路要走。就目前来看, 我们认为这两个系统都有其适用的场景。 简单来说,如果你的数据需要频繁的被计算和统计、并且你希望具 有更好的 SQL 交互式支持和更快计算性能及复杂 SQL 语法的支持, 那么你应该选择 MPP 数据库,SQL-on-Hadoop 技术还没有足够 成熟。特别如数据仓库、集市、ODS、交互式分析数据平台等系统, MPP 数据库有明显的优势。 Big Date20 码力 | 64 页 | 2.73 MB | 1 年前3
Greenplum 分布式数据库内核揭秘Segment 节点进行执行,并将最终结果返回给客户端。 Segment 节点上负责执行 QD 分发来的查询任务的进程称为 QE (Query Executor) 进程,递归 遍历 QD 发来的计划树,对每一个节点按照拉模型 (火山模型) 进行执行。 QD && QE Confidential │ ©2021 VMware, Inc. 26 QD && QE Confidential │ ©20210 码力 | 31 页 | 3.95 MB | 1 年前3
共 12 条
- 1
- 2













