Greenplum开源MPP数据库介绍Agenda Greenplum简介 Greenplum的MPP架构 > 分布式优化器: Postgres planner 和 ORCA > 分布式事务和执行 Greenplum存储 Greenplum生态 Greenplum 7 Greenplum简介:什么是Greenplum? 基于PostgreSQL、开源、分布式MPP、ACID完备、为OLAP优化的关系型数据仓库。 https://greenplum 2003年,Luke Lonergan 和 Scott Yara 发起 Greenplum 项目,从 PostgreSQL 8 分支,做成 MPP 架构 2010年被EMC收购 2012年成为Pivotal的一部分 2015年开源,可能是世界上第一个成熟商用的开源MPP数据仓库 ➢ 2019年底跟随Pivotal被VMware收购 ## 谁在用Greenplum? ➢ 500多付费企业客户 成千上万的开源用户 jpg)  ## Greenplum的MPP架构 ## Massively: ☐ PB级的数据,单台主机无法处理 ☐ 所以数据分布在多个主机上 ☐ 高效、灵活的数据分布,和实际业务相关 ## Parallel: ☐ 数据并行处理计算0 码力 | 23 页 | 4.55 MB | 2 年前3
Greenplum 6新特性:
在线扩容工具GPexpand剖析Pivotal ## Greenplum 6新特性: 在线扩容工具GPexpand剖析 杜佳伦 (jdu@pivotal.io) ## 大纲 • Greenplum 集群部署 • GPExpand简介与具体用法 • Greenplum 6中GPExpand的改进与实现 ## Greenplum 集群部署  ## 推荐篇 推荐场景、在线机器学习和深度学习 集 • 模型: $ H_{targets} = f(V_{context}, V_{user}, V_{objects}) $ ## 趋势 • 实时化:在线机器学习 • 深度化:深度学习 • 平台化:机器学习平台 ## 3 在线机器学习 ## · 实时化 • 特征实时化:更及时反馈用户行为,更细粒度刻画用户 - 模型实时化:根据线上样本实时训练模型,及时地反映对象的线上变化 !0 码力 | 36 页 | 16.69 MB | 2 年前3
Pivotal Greenplum 5.0 - 开源MPP 数据库的不二之选# 开源 MPP 数据库的不二之选: Pivotal Greenplum 5.0 姚延栋 yyao@pivotal.io ## 开放源代码    ## MPP  Master Servers Query0 码力 | 18 页 | 913.39 KB | 2 年前3
阿里云 AnalyticDB for PostgreSQL
- 打造更简单易用的Cloud SQL Data Warehousefor PostgreSQL 未来演进 ## AnalyticDB for PostgreSQL 在线MPP数据仓库服务 简单易用、海量扩展、兼容部分Oracle 语法生态、既支持在线交互分析,也支持离线数据处理。AnalyticDB for PostgreSQL(云Greenplum)低成本,快速构筑在线企业数据仓库。  ## PB级数据秒级响应 MPP水平扩展架构,PB级数据查询秒级响应;向量化计算,及列存储智能索引,领先传统数据库引擎性能 3x;新一代SQL优化器,实现复杂分析语句免调优  UDW 采用无共享的 MPP 架构,适用于海量数据的存储和计算。UDW 的架构如上图所示,主要有 Client、Master Node 和 Compute Node 组成。基本组成部分的功能如下: 1. Client: 访问 UDW testSchema; 删除非空模式: DROP SCHEMA testSchema CASCADE; ## 4、 表格设计 udw 的表格创建类似于 postgresql,由于 udw 采用 mpp 数据,创建表格的时候可以选择不同的数据分布策略,不同的存储方式等等。创建表格的时候可以定义下面信息: 数据类型 表约束 • 数据分布策略 • 表存储模型 • 分区策略 • 外部表: udwfile、udwhdfs 布(DISTRIBUTED BY(key))和随机分布(DISTRIBUTED RANDOMLY)。如果不指定分布策略则默认按 primary key 或者第一个 column 做哈希分布。 在MPP环境下,查询的执行时间是由所有节点决定的。当数据出现倾斜时,会导致较低的性能以及内存溢出的情况。 当选择分布键时,考虑以下几个方面: 1. 为所有的表显示地指定哈希或随机分布,不要使用默认的。0 码力 | 206 页 | 5.35 MB | 2 年前3
TiDB 原理与实战0 码力 | 23 页 | 496.41 KB | 1 年前3
深度揭秘Greenplum开源数据库透明加密3. GPDB数据透明加密方案设计 4. GPDB数据透明加解密流程 5. 总结 ## 我们所面临的问题 ## 什么是Greenplum数据库 GPDB 一款开源的HTAP数据库: • MPP架构 完整的事务+ACID+标准SQL支持 • 支持上千个节点的部署 • 支持PB级文件 • 丰富的ETL和外部组件 • 支持Python/R/Java直接访问处理数据库数据 https://github 一款开源的HTAP数据库: • MPP架构 完整的事务+ACID+标准SQL支持 • 支持上千个节点的部署 • 支持PB级文件 • 丰富的ETL和外部组件 • 支持Python/R/Java直接访问处理数据库数据 https://github.com/greenplum-db/gpdb ## pgcrypto的问题 Recall 一款开源的HTAP数据库: · MPP架构 完整的事务+ACID+标准SQL支持 一款开源的HTAP数据库: · MPP架构 完整的事务+ACID+标准SQL支持 • 支持上千个节点的部署 支持PB级文件 丰富的ETL和外部组件 支持Python/R/Java直接访问处理数据库数据 https://github.com/greenplum-db/gpdb ## GPDB透明加密 Recall again 一款开源的HTAP数据库: - MPP架构 - 完整的事务+ACID+标准SQL支持0 码力 | 48 页 | 10.19 MB | 2 年前3
TiDB v7.1 中文手册· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 777 9 8.10 在线修改集群配置 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 2346 14.3.5 使用 MPP 模式· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 3686 15.5.2 在线数据同步· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·0 码力 | 4369 页 | 98.92 MB | 2 年前3
共 745 条
- 1
- 2
- 3
- 4
- 5
- 6
- 75













