pdf文档 Greenplum数据仓库UDW - UCloud中立云计算服务商

5.35 MB 206 页 0 评论
语言 格式 评分
中文(简体)
.pdf
3
摘要
文档介绍了UCloud的Greenplum数据仓库UDW,基于Greenplum开源,采用MPP架构,支持大规模并行计算,为多个行业提供高效的数据分析能力。UDW支持MADlib和PostGIS,扩展了机器学习和空间地理应用功能。数据加载支持多种方式,包括copy命令、外部表并行加载、HDFS和MySQL数据迁移等。UDW提供了高可用性,节点间数据双机热备,支持通过多种客户端工具连接,包括JDBC、ODBC、Python等。
AI总结
《Greenplum数据仓库UDW - UCloud中立云计算服务商》文档内容总结如下: ### 1. 概述 - **产品简介**:UDW(UCloud Data Warehouse)是基于开源Greenplum开发的分布式并行处理数据仓库,支持PB级数据存储与计算,适用于互联⽹、物联⽹、金融、电信等行业。 - **核心功能**:通过SQL简化数据分析,⽀持MADlib机器学习扩展、PostGIS空间地理功能,最新⽀持Greenplum 6.2.1版本。 ### 2. 产品架构 - **架构组成**:UDW采用无共享MPP架构,主要包括: - **Client**:支持JDBC、ODBC、Python等多种访问方式。 - **Master Node**:负责连接请求、权限认证、SQL调度、结果汇总。 - **Compute Node**:管理计算和存储资源,由多个Segment组成,负责数据存储和SQL执行。 - **节点规格**: - 计算密集型:如24核/144G/12000G(SATA)。 - 快速上⼿型:如2核/12G/300G(SSD)。 ### 3. 高可用性 - 节点采用双机热备,实际可用容量约为节点总容量的50%。 ### 4. 快速上⼿ - **创建数据仓库**: 1. 选择数据仓库类型(Greenplum或UDPG)。 2. 选择节点个数, 참고节点容量计算公式。 3. 设置数据仓库信息,包括名称、管理员账号、密码等。 - **连接数据库**:⽀持通过psql客户端、JDBC、ODBC等方式连接。 - **数据加载**:支持COPY命令、外部表并⾏加载、HDFS、MySQL等方式。 ### 5. 操作指南 - **管理操作**:包括启动、关闭、重启、扩容、更改密码、删除等。 - **监控与日志**:提供操作日志和监控功能,帮助用户了解数据仓库状态。 ### 6. 数据导入 - **工具支持**: - 使用pg_dump导出数据,结合psql重建数据。 - 通过外部表迁移数据,从HDFS、MySQL、UFile等源加载数据。 - 支持Sqoop工具实现HDFS/Hive与UDW的数据互通。 - **具体方法**: 1. 外部表并⾏加载:创建外部表后,通过INSERT INTO加载数据。 2. COPY命令:直接将文件数据加载到UDW。 ### 7. 案例分析 - **日志数据分析**:通过UDW实现日志数据的存储与分析。 - **网络流分析**:利用PXF扩展功能,访问HDFS/HBase数据。 ### 8. 常见问题(FAQ) - 如何连接UDW? - ⽀持从MySQL导入数据吗? - HDFS/Hive与UDW之间的数据导入导出。 - 如何终止运行中的SQL语句? - 节点扩容是否有限制? ### 9. 价格信息 - 按实例规格和节点数量计算,具体价格不明确,建议参考官网。 ### 总结 UDW是UCloud基于Greenplum开发的云数据仓库产品,具备高性能、分布式架构和丰富的数据分析功能,适合多种行业的数据处理需求。文档详细介绍了产品架构、使用方法、数据迁移案例及常见问题解答,帮助用户快速上手和高效使用。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 199 页请下载阅读 -
文档评分
请文明评论,理性发言.