搜索

pdf文档 VMware Tanzu Greenplum v6.21 Documentation

33.54 MB 2025 页 0 下载 87 浏览 0 评论 0 收藏
语言 格式 评分
英语
.pdf
3
摘要
VMware Tanzu Greenplum 6.21文档详细介绍了Greenplum Database的安装、配置和使用,以及与相关产品的集成。Greenplum是一个大规模并行处理(MPP)数据库,支持下一代数据仓库和大规模分析处理。与开源版本相比,Tanzu Greenplum 6新增了产品包装、QuickLZ压缩支持、多种数据连接器(如Greenplum-Spark Connector)、增强的contrib模块(如gp_array_agg)等功能。文档还涵盖了平台兼容性、存储要求、网络配置以及已解决的问题列表,确保用户能够顺利部署和使用该数据库系统。
AI总结
### VMware Tanzu Greenplum v6.21 文档总结 #### 1. 概述 VMware Tanzu Greenplum 是一个大规模并行处理(MPP)数据库服务器,支持下一代数据仓库和大规模分析处理。它通过自动分区数据和并行查询,使集群服务器能够作为一个超级计算机运行,性能比传统数据库快数十倍甚至上百倍。支持 SQL、MapReduce 并行处理,以及从数百 GB 到数百 TB 的数据量。 #### 2. 与开源 Greenplum 的区别 VMware Tanzu Greenplum 6 包含开源 Greenplum Database 的所有功能,并新增以下功能: - 产品打包和安装脚本。 - QuickLZ 压缩支持(开源版本因许可限制未提供)。 - 数据连接器:Greenplum-NiFi、Greenplum-Spark、Greenplum-Informatica、Greenplum-Kafka、Greenplum Streaming Server。 - 增强的贡献模块:`gp_array_agg`、`gp_parallel_retrieve_cursor`、`gp_sparse_vector` 等。 - PXF(Greenplum 平台扩展框架)版本 6.3.0,支持从 VMware Tanzu Network 下载。 - Dell EMC VxRail 部署的增强功能:默认包含 Greenplum Command Center(GPCC),存储策略从 Stripe 1 更新为 Stripe 4,提升 vSAN 性能。 - 支持修改虚拟机部署中的数据磁盘大小。 #### 3. 已解决的问题 - **集群管理**:修复了 `gpstop` 在从备(master)节点不可用时失败的问题。 - **查询优化器**:修复了大表查询性能问题,引入 `gp_array_agg` 聚合函数以提高性能。 - **服务器**:修复了 `SELECT * from ` 间歇性失败的问题,优化了资源分配和清理机制。 - **其他**:修复了 `gp_sparse_vector` 模块中使用 `==` 操作符与 NULL 生成 PANIC 的问题,以及索引因无效快照导致的损坏问题。 #### 4. 平台要求 - **操作系统**:支持 CentOS 7.x、RHEL 7.x、Ubuntu 18.04 LTS、Oracle Linux 7.x 等。 - **VMware vSphere**:要求 ESXi 6.7 Update 3 或更高版本,vCenter Server 7.0 GA 或更高版本。 - **存储**:仅支持 XFS 文件系统,网络或共享存储需作为块设备挂载。 - **硬件**:最低 16 GB 内存,10 GbE 网络,支持 x86_64 CPU。 #### 5. 软件依赖与扩展 - **软件依赖**:Java 和其他工具。 - **数据存储**:支持 AWS、GCP、Azure 等云存储,需使用 RAID 和 XFS 文件系统。 - **扩展支持**:包括 GPCC、PXF、Greenplum Streaming Server 等工具和模块。 #### 6. 版本与兼容性 - **Tanzu Greenplum 版本**:6.x。 - **Data Domain Boost**:支持 3.3 版本 SDK 和 DDOS 6.1/6.0 及更高版本。 #### 7. 安装与验证 - **数据存储**:需创建目录用于存储主节点、备用节点和段实例数据。 - **软件验证**:通过 SHA256 校验码验证下载的软件完整性。 #### 8. 主要功能 - **查询优化**:支持有序聚合和位图扫描。 - **扩展模块**:新增 `gp_array_agg` 和 `gp_parallel_retrieve_cursor` 等模块。 - **数据集成**:支持通过 `greenplum_fdw` 访问外部集群数据。 #### 9. 总结 VMware Tanzu Greenplum 6.21 提供了强大的 MPP 数据库性能,支持大规模数据分析和多种数据连接器,适合企业级部署。其增强功能和问题修复提升了性能、稳定性和易用性,适用于云、VxRail 和本地硬件部署。
P1
P2
P3
P4
P5
P6
P7
P8
P9
P10
P11
P12
下载文档到本地,方便使用
- 可预览页数已用完,剩余 2013 页请下载阅读 -
文档评分
请文明评论,理性发言.