并行不悖- OLAP 在互联网公司的实践与思考1 并行不悖 – OLAP 在互联网公司的实践与思考 赵飞祥 2 Greenplum现状说明 三 Greenplum体系架构 二 数据仓库体系架构 一 Greenplum开发规范 五 Greenplum运维体系 四 Greenplum扩展规划 六 3 数据仓库体系架构 业务数据与数据使用归类 时间维度:过去 - 现在 - 未来 (数据的生命周期) • “现在”的数据 —— 可以很好支持各种方式的数据加载和DML操作 – 具备海量的数据存储和计算性能 9 Greenplum现状说明 三 Greenplum体系架构 二 数据仓库体系架构 一 Greenplum开发规范 五 Greenplum运维体系 四 Greenplum扩展规划 六 10 greenplum体系架构 postgresql体系结构 11 greenplum体系架构 postgresql体系结构 (gpfdist+外部表,每小时4TB+) Ø 分布分区 Ø 数据压缩 Ø 外部访问 15 Greenplum现状说明 三 Greenplum体系架构 二 数据仓库体系架构 一 Greenplum开发规范 五 Greenplum运维体系 四 Greenplum扩展规划 六 16 Greenplum现状说明 Greenplum集群现状概述 • 三大Greenplum集群体系 Ø 公司IDC_01机房Greenplum体系0 码力 | 43 页 | 9.66 MB | 1 年前3
Greenplum Database 管理员指南 6.2.1LE的relation name。 虽然可以在CREATE分区表时通过WITH子句中的tablename属性的方式为分区指定个 性化的relation name,但是建议永远不要这样做,这是一个违反规范的做法(也许 可以作为一个考题,例如,如何创建一个10级分区表,因为按照缺省的分区命名规则, 到8级分区时就会出现表名重复的报错)。虽然可以使用SQL命令直接针对分区表进行查 询和装载操作,但只能通过ALTER 查看一个字段上的直接依赖 修改上面的查询语句,可以用于查询依赖于某个字段的视图,当需要修改表上的某 个字段或者删除该字段时(编者建议,不要在一张大表上直接修改字段定义,可能会是 一个性能很差的操作,应该制定规范,采用重建表的方式进行),会用到这种查询,这 里将会用到pg_attribute系统表: =# SELECT v.oid::regclass AS view,d.refobjid::regclass SQL(结构化查询语言)是用来访问数据库的一种语言。SQL语言有特定的修辞和词 法(单词、特征等),据此构造数据库引擎可以理解的查询或命令。 SQL由一系列的命令组成。命令由一系列按照语法规范编写的修辞组成,以分号(;) 结尾。 GP基于PostgreSQL,并遵循相同的SQL结构和语法(一些MPP相关的有差异)。大 多情况下,GP的语法与PostgreSQL对等,不过在GP中有些命令可能会有增量或者语0 码力 | 416 页 | 6.08 MB | 1 年前3
Greenplum 精粹文集理,备份策略如何规划,如何高 效组网都得在前期考虑好。在我 们的成功案例中,同一个企业级 数据平台中 Greenplum 集群和 Hadoop 集群配合运作的案例越 来越多。在中国移动的大数据架 构规范中,云化 ETL 是一个重 要的组成部分。云化 ETL 就是构架在 Hadoop 集群之上。Greenplum 提供了专用产品模块 gphdfs,Greenplum 通过 gphdfs 可以直接与 HDFS0 码力 | 64 页 | 2.73 MB | 1 年前3
共 3 条
- 1













