| 语言 | 格式 | 评分 |
|---|---|---|
中文(简体) | .pdf | 3 |
| 摘要 | ||
UDW是UCloud提供的大规模并行处理数据仓库服务,基于开源Greenplum开发,支持Greenplum和Udpg两种类型。产品采用无共享MPP架构,由Client、Master Node和Compute Node组成,支持高可用和双机热备。用户可通过SQL进行数据分析,适用于互联网、物联网、金融、电信等行业。支持MADlib扩展实现机器学习,PostGIS支持空间地理位置应用。提供数据迁移工具,支持从MySQL导入数据和通过PXF外部表与HDFS/Hive交互。用户可创建数据仓库并选择节点类型,如存储密集型ds1.large或计算密集型dc1.large。 | ||
| AI总结 | ||
UDW 是 UCloud 提供的大规模并行处理(MPP)云数据仓库服务,基于开源的 Greenplum 和 PostgreSQL(Udpg 类型)开发,适用于 PB 级数据的存储与分析,服务于互联网、物联网、金融、电信等行业。
**核心架构**:
- 采用无共享的 MPP 架构,由 **Client**、**Master 节点** 和 **Compute 节点** 组成。
- 具备高可用性:Primary Segment 故障时可切换至 Mirror Segment,恢复后自动同步;Master 节点为主从模式,Active Master 不可用时自动切换至 Standby Master。
**快速上手**:
1. **创建数据仓库**:在 UCloud 控制台选择 UDW 标签,点击“创建数据仓库”,需选择类型(Greenplum 或 Udpg)、节点个数(分布式架构,数据双机热备,可用容量约为总容量的一半)、以及配置信息(名称、管理员用户名/密码、可选默认 DB 等)。端口固定为 5432。
2. **连接数据仓库**:提供客户端方式,需根据数据仓库类型下载对应的 Greenplum 或 Udpg 客户端,配置环境变量后即可连接。
**主要功能与特性**:
- 支持 **MADlib** 扩展,用于机器学习;支持 **PostGIS**,用于空间和地理位置应用。
- 支持最新 **Greenplum 6.2.1** 版本。
- 提供多种规格:**存储密集型**(如 ds1.large: 4核24G 2000G SATA)和**计算密集型**(如 dc1.large: 2核12G 300G SSD)。
- 支持节点扩容、更改密码、续费、删除等操作管理,并提供操作日志和性能监控。
**数据迁移与扩展(PXF)**:
- **从 MySQL 导入**:提供专业工具,支持全量和增量导入,单线程速度达 4000-8000 条/秒,多线程可达 4万-10万条/秒。
- **与 HDFS/Hive 互导**:支持通过 **Sqoop** 或创建 **PXF 外部表** 实现数据导入导出。
- **使用 pg_dump 迁移**:支持通过安装 greenplum-db-clients 工具,使用 pg_dump 导出并使用 psql 重建数据。
- **使用 HDFS 外部表迁移**:可在源集群创建 PXF 可写外部表写入 HDFS,再在目标集群创建可读外部表读取并写入。
**常见问题(FAQs)**:
- 连接方式:参考官方快速上手文档。
- 数据导入:支持从 MySQL 和 HDFS/Hive 导入导出。
- 终止 SQL:可通过相关命令 kill 正在执行的语句。 | ||
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余
199 页请下载阅读 -
文档评分














Greenplum数据仓库UDW - UCloud中立云计算服务商