搜索

pdf文档 Greenplum数据仓库UDW - UCloud中立云计算服务商

5.35 MB 206 页 1 下载 161 浏览 0 评论 0 收藏
语言 格式 评分
中文(简体)
.pdf
3
摘要
UDW是UCloud提供的大规模并行处理数据仓库服务,基于开源Greenplum开发,支持Greenplum和Udpg两种类型。产品采用无共享MPP架构,由Client、Master Node和Compute Node组成,支持高可用和双机热备。用户可通过SQL进行数据分析,适用于互联网、物联网、金融、电信等行业。支持MADlib扩展实现机器学习,PostGIS支持空间地理位置应用。提供数据迁移工具,支持从MySQL导入数据和通过PXF外部表与HDFS/Hive交互。用户可创建数据仓库并选择节点类型,如存储密集型ds1.large或计算密集型dc1.large。
AI总结
UDW 是 UCloud 提供的大规模并行处理(MPP)云数据仓库服务,基于开源的 Greenplum 和 PostgreSQL(Udpg 类型)开发,适用于 PB 级数据的存储与分析,服务于互联网、物联网、金融、电信等行业。 **核心架构**: - 采用无共享的 MPP 架构,由 **Client**、**Master 节点** 和 **Compute 节点** 组成。 - 具备高可用性:Primary Segment 故障时可切换至 Mirror Segment,恢复后自动同步;Master 节点为主从模式,Active Master 不可用时自动切换至 Standby Master。 **快速上手**: 1. **创建数据仓库**:在 UCloud 控制台选择 UDW 标签,点击“创建数据仓库”,需选择类型(Greenplum 或 Udpg)、节点个数(分布式架构,数据双机热备,可用容量约为总容量的一半)、以及配置信息(名称、管理员用户名/密码、可选默认 DB 等)。端口固定为 5432。 2. **连接数据仓库**:提供客户端方式,需根据数据仓库类型下载对应的 Greenplum 或 Udpg 客户端,配置环境变量后即可连接。 **主要功能与特性**: - 支持 **MADlib** 扩展,用于机器学习;支持 **PostGIS**,用于空间和地理位置应用。 - 支持最新 **Greenplum 6.2.1** 版本。 - 提供多种规格:**存储密集型**(如 ds1.large: 4核24G 2000G SATA)和**计算密集型**(如 dc1.large: 2核12G 300G SSD)。 - 支持节点扩容、更改密码、续费、删除等操作管理,并提供操作日志和性能监控。 **数据迁移与扩展(PXF)**: - **从 MySQL 导入**:提供专业工具,支持全量和增量导入,单线程速度达 4000-8000 条/秒,多线程可达 4万-10万条/秒。 - **与 HDFS/Hive 互导**:支持通过 **Sqoop** 或创建 **PXF 外部表** 实现数据导入导出。 - **使用 pg_dump 迁移**:支持通过安装 greenplum-db-clients 工具,使用 pg_dump 导出并使用 psql 重建数据。 - **使用 HDFS 外部表迁移**:可在源集群创建 PXF 可写外部表写入 HDFS,再在目标集群创建可读外部表读取并写入。 **常见问题(FAQs)**: - 连接方式:参考官方快速上手文档。 - 数据导入:支持从 MySQL 和 HDFS/Hive 导入导出。 - 终止 SQL:可通过相关命令 kill 正在执行的语句。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 199 页请下载阅读 -
文档评分
请文明评论,理性发言.