Greenplum 精粹文集
Python、C、Perl、TCL、 PLSQL 等等语言来扩展功能,在后续章节中,我将展现这种扩展 是如何的方便,另外,开发新的功能模块、新的数据类型、新的索 引类型等等非常方便,只要按照 API 接口开发,无需对 PG 重新编译。 PG 中 contrib 目录下的各个第三方模块,在 GP 中的 postgis 空间 数据库、R、Madlib、pgcrypto 各类加密算法、gptext 全文检索都 是通过这种方式实现功能扩展的。 postgresql 的 contrib 中的一些常用模块 Greenplum 提 供了编译后的模块开箱即用,如:oraface、postgis、pgcrypt 等, 对于其它模块,用户可以自行将 contrib 下的代码与 Greenplum 的 include 头文件编译后,将动态 so 库文件部署到所有节点就可进行测 试使用了。有些模块还是非常好用的,例如:oraface,基本上集成了 Oracle Hadoop 集群配合运作的案例越 来越多。在中国移动的大数据架 构规范中,云化 ETL 是一个重 要的组成部分。云化 ETL 就是构架在 Hadoop 集群之上。Greenplum 提供了专用产品模块 gphdfs,Greenplum 通过 gphdfs 可以直接与 HDFS 上的数据进行交互,并且可以同时发挥 Greenplum 和 Hadoop 两者并行处理的优势。 Big Date2.indd0 码力 | 64 页 | 2.73 MB | 1 年前3Greenplum数据仓库UDW - UCloud中立云计算服务商
."\n\n"; } echo "Operation done successfully\n"; pg_close($db); ?> 1.7 node客户端访问 客户端访问 1)安装pg模块 npm install -g node_gyp npm install -g pg 2)连接数据库并访问 ⽰例代码如下: var pg = require('pg'); var constring ]] [NOWAIT] [...]] 命令: SET 描述: 改变⼀个运⾏时参数 语法: SET [SESSION | LOCAL] configuration_parameter {TO | =} value | 'value' | DEFAULT} SET [SESSION | LOCAL] TIME ZONE {timezone | LOCAL | DEFAULT} 开发指南 Greenplum数据仓库 TRANSACTION 描述: 设置当前事务的属性 语法: SET TRANSACTION [transaction_mode] [READ ONLY | READ WRITE] SET SESSION CHARACTERISTICS AS TRANSACTION transaction_mode [READ ONLY | READ WRITE] 事务模式为其中之⼀: ISOLATION0 码力 | 206 页 | 5.35 MB | 1 年前3并行不悖- OLAP 在互联网公司的实践与思考
平时使用规范 Ø避免高频率的insert、update操作 Ø避免频繁执行高内存消耗的会话 Ø避免出现死锁 Ø可以在适当的时候执行 vaccum 操作 Ø避免直接在Greenplum执行消耗session会话的操作 Ø尽量不创建索引 • 上线与调度规范 Ø上线的程序,必须要经过测试,才可以生产使用 Ø调度程序需考虑每个任务的前后关系,时间富裕 Ø避免因为过于追求并行度,对多个任务造成相互影响 数据仓库体系架构 一 Greenplum开发规范 五 Greenplum运维体系 四 Greenplum扩展规划 六 39 Greenplum扩展规划 整体扩展思路 • OLAP三大模块不断完善 Ø 通过dbsync程序,实现数据传输和加载优化 Ø 对于Greenplum上的架构和设计不断优化 Ø 继续建设多样化的postgresql数据集市,满足不同需求 • 优化现有业务的调度实现0 码力 | 43 页 | 9.66 MB | 1 年前3Greenplum 排序算法
bool delayEagerFree 某个Segment的排序节点输出最后一条元组 后是否可以提前 释放内存 36 ● ExecSort: 从下层Outer节点读取所有元组,并传递给tuplesort模块进行排序 排序节点 37 TupleSort是排序节点的核心,算法主要阶段: ● 第一阶段初始化TupleSort,通过调用函数tuplesort_begin_common,生成 Tuple0 码力 | 52 页 | 2.05 MB | 1 年前3Pivotal Greenplum 5: 新一代数据平台
的支持。这些新数据类型及相关函数有助于打造 一个没有孤岛的环境,结构化、半结构化和非结构化数据均可在一个位置进行存储和分析。其他功能还有 dblink,这是一 个用于与其他数据库(无论在同一数据库主机还是远程主机上)建立连接的新模块。Pivotal Greenplum 支持数据库用户 使用 dblink 在其他数据库中执行简短的临时查询。最后,Greenplum 5 将已安装的 Python 版本升级为 2.7。PL/Python0 码力 | 9 页 | 690.33 KB | 1 年前3VMware Greenplum 6 Documentation
Individual Session 526 Using SHA-256 Password Encryption 527 Setting the SHA-256 Password Hash Algorithm System-wide 527 Setting the SHA-256 Password Hash Algorithm for an Individual Session 527 VMware 777 Enabling GPORCA for a System 777 Enabling GPORCA for a Database 777 Enabling GPORCA for a Session or a Query 778 Collecting Root Partition Statistics 778 Running ANALYZE 778 GPORCA and Leaf Partition Hashing 1074 Time-based Authentication 1075 Accessing the Database 1075 Establishing a Database Session 1075 Supported Client Applications 1076 Greenplum Database Client Applications 1076 Connecting0 码力 | 2445 页 | 18.05 MB | 1 年前3VMware Greenplum 7 Documentation
572 Enabling GPORCA for a System 573 Enabling GPORCA for a Database 573 Enabling GPORCA for a Session or a Query 573 Collecting Root Partition Statistics 573 Running ANALYZE 574 GPORCA and Leaf Partition Parallel Retrieve Cursor 699 Listing a Parallel Retrieve Cursor’s Endpoints 699 Opening a Retrieve Session 700 Retrieving Data From the Endpoint 701 Waiting for Data Retrieval to Complete 701 Handling Closing the Cursor 702 Listing All Parallel Retrieve Cursors 702 Listing Segment-Specific Retrieve Session Information 703 VMware Greenplum 7 Documentation VMware by Broadcom 28 Limiting the Number of0 码力 | 2221 页 | 14.19 MB | 1 年前3VMware Greenplum v6.25 Documentation
Individual Session 497 Using SHA-256 Password Encryption 498 Setting the SHA-256 Password Hash Algorithm System-wide 498 Setting the SHA-256 Password Hash Algorithm for an Individual Session 498 Example 748 Enabling GPORCA for a System 748 Enabling GPORCA for a Database 748 Enabling GPORCA for a Session or a Query 749 Collecting Root Partition Statistics 749 Running ANALYZE 749 GPORCA and Leaf Partition Accessing the Database 1044 VMware Greenplum 6 Documentation VMware, Inc. 47 Establishing a Database Session 1044 Supported Client Applications 1045 Greenplum Database Client Applications 1045 Connecting0 码力 | 2400 页 | 18.02 MB | 1 年前3VMware Greenplum 6 Documentation
Individual Session 521 Using SHA-256 Password Encryption 522 Setting the SHA-256 Password Hash Algorithm System-wide 522 Setting the SHA-256 Password Hash Algorithm for an Individual Session 522 Example 768 Enabling GPORCA for a System 769 Enabling GPORCA for a Database 769 Enabling GPORCA for a Session or a Query 769 Collecting Root Partition Statistics 770 Running ANALYZE 770 GPORCA and Leaf Partition Hashing 1061 Time-based Authentication 1061 Accessing the Database 1061 Establishing a Database Session 1062 Supported Client Applications 1062 Greenplum Database Client Applications 1063 Connecting0 码力 | 2374 页 | 44.90 MB | 1 年前3VMware Tanzu Greenplum v6.23 Documentation
Individual Session 501 Using SHA-256 Password Encryption 502 Setting the SHA-256 Password Hash Algorithm System-wide 502 Setting the SHA-256 Password Hash Algorithm for an Individual Session 502 Example 741 Enabling GPORCA for a System 742 Enabling GPORCA for a Database 742 Enabling GPORCA for a Session or a Query 742 Collecting Root Partition Statistics 742 Running ANALYZE 743 GPORCA and Leaf Partition Greenplum 6 Documentation VMware, Inc 45 Accessing the Database 1029 Establishing a Database Session 1030 Supported Client Applications 1030 Greenplum Database Client Applications 1030 Connecting0 码力 | 2298 页 | 40.94 MB | 1 年前3
共 25 条
- 1
- 2
- 3