导入导出 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Greenplum Database 管理员指南 6.2.1

................................................................................ - 237 - 第十一章：数据导入与导出 ................................................................................................. ....................... - 252 - 使用外部表导入数据 ...................................................................................................... - 257 - 使用外部表导出数据 ................................... gpfdist 协议外部表导出数据 ................................................................... - 258 - 使用基于命令的 WEB 型外部表导出数据 ............................................................. - 259 - 使用 COPY 命令导入导出 .....

0 码力 | 416 页 | 6.08 MB | 1 年前
3
Greenplum数据库架构分析及5.x新功能分享

Pivotal Confidential–Inter nal Use Only 大规模并行数据加载 • 高速数据导入和导出 – 主节点不是瓶颈 – 10+ TB/小时/Rack – 线性扩展 • 低延迟 – 加载后立刻可用 – 不需要中间存储 – 不需要额外数据处理 • 导入/导出到&从: – 文件系统 – 任意 ETL 产品 – Hadoop 发行版外部数据源 Interconnect

0 码力 | 44 页 | 8.35 MB | 1 年前
3
Greenplum 精粹文集

数据搬迁，Greenplum 采用了旧环境数据备份、传输、新环境恢复的方案，停机时间实际只花了不到 4 天。相比较而言，其他封闭式系统，需要压缩并备份数据，倒腾出整套设备搬迁到新数据中心，然后再导入新数据，影响或暂停业务几十天。两种方案从工程复杂度、人力投入、业务影响来说，开放式架构所带来的便利和优势体现的淋漓尽致。 Big Date2.indd 22 16-11-22 下午3:38 构的大模型更为明显。第一次扩容是从 50 节点到 74 节点，完成 30TB 业务数据的导出、传输、导入，以及 70TB 左右的索引数据创建，实际停机时间大约 3 天左右。第二次扩容则到了上百节点。考虑到升级操作的可控性并缩短升级和扩容时间，仍然采用新初始化集群的方案操作，在同一集群中初始化了一个新数据库，将数据从旧库导出后，再导入新库。该方案在 2 天之内完成 57TB 压缩数据的加载和 130TB 27 16-11-22 下午3:38 28 4. ETL 服务器 ETL 服务器是数据的临时存放区，由于 Greenplum 服务器并行加载的特点，数据可以直接通过网络从 ETL 服务器导入到 Greenplum 计算节点，所以 ETL 服务器网络和磁盘 IO 的性能直接关系到数据加载和卸载的性能，官方的测试数据 16 台计算节点 Greenplum 集群，加载性能可以达到 16TB/

0 码力 | 64 页 | 2.73 MB | 1 年前
3
Greenplum数据仓库UDW - UCloud中立云计算服务商

203 204 205 206 访问 Hive 访问 HBase 使⽤使⽤ pg_dump 迁移数据迁移数据安装 greenplum-db-clients 使⽤ pg_dump 导出数据使⽤ psql 重建数据利⽤利⽤ hdfs 外部表迁移数据外部表迁移数据 1. 在原 greenplum 集群中创建 hdfs pxf 可写外部表 2. 将原 greenplum 从 hdfs 外部表中读取数据并写⼊⽬的 greenplum 集群 FAQs 创建好数据仓库之后怎么连接到UDW？ UDW⽀持从mysql导⼊数据吗？ HDFS/Hive与UDW之间可以导⼊导出数据吗？ UDW中怎么kill掉正在执⾏的SQL语句？如何通过外⽹访问UDW？节点扩容时数量有没有什么限制？数据仓库价格数据仓库价格⽬录 Greenplum数据仓库 UDW Copyright 使⽤⽅法请参考我们的⽂档：外部表并⾏加载数据到udw 从从hdfs加载数据加载数据为了⽅便udw和hdfs之间的数据导⼊和导出，我们提供个两种⽅案： 1. ⽤sqoop实现hdfs和udw直接的数据导⼊导出，使⽤⽅法请参考：hdfs和hive中数据导⼊导出到udw 2. 创建hdfs外部表，使⽤⽅法请参考：创建hdfs外部表从从mysql中导⼊数据中导⼊数据为了⽅便mys

0 码力 | 206 页 | 5.35 MB | 1 年前
3
Greenplum 新一代数据管理和数据分析解决方案

GreenPlum v3.1 Beta – 应用软件：SQL语句 • 数据导入测试 – A - 67858566 rows – B - 80088742 rows – C - 372844366 rows – D - 75042462 rows – E - 2521897 rows 结论：超过6亿条历史数据导入，用时少于1.5小时，性能非常卓越。 • 全表扫描测试 – DWA测试环境：针对表C（372844366

0 码力 | 45 页 | 2.07 MB | 1 年前
3
Greenplum开源MPP数据库介绍

报警和通知 Confidential │ ©2022 VMware, Inc. 20 Greenplum Streaming Server Ø ETL工具 (10+TB/hour) Ø 并行导入流式数据 Ø Kafka和其它流式来源 Confidential │ ©2022 VMware, Inc. 21 Greenplum 7的亮点：PostgreSQL v12 和新特性 Ø 6000+

0 码力 | 23 页 | 4.55 MB | 1 年前
3
Greenplum 编译安装和调试

代码。（Eclipse、VisualCode具有类似功能） Greenplum 进程都是 daemon 进程，很难通过启动方式进入调试器。因而通常使用的方法是 attach 到已经运行的进程。首先启动 clion，导入 Greenplum 源代码项目。clion 需要 CMakeLists.txt 文件构建工程项目。将下面的 CMakeLists.txt 放到 Greenplum 源代码目录的顶层目录中，再启动

0 码力 | 15 页 | 2.07 MB | 1 年前
3
完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum

1. 分别选取不同的 OS 镜像创建三台 ARM 实例并搭建 Greenplum 6.7.0 三节点集群环境。 2. 在 Master 应用 TPC-DS tools，生成 5GB 测试数据，并导入 Greenplum 测试集群。 3. 执行 TPC-DS tools 中的 99 个查询任务，并记录查询时间。 4. 重复 5 次测试。以下所有测试数据均由 5 次测试后计算得出的均值。在各操作系统进行的

0 码力 | 17 页 | 2.04 MB | 1 年前
3

共 8 条前往

页

分类

语言

格式

Greenplum Database 管理员指南 6.2.1

Greenplum数据库架构分析及5.x新功能分享

Greenplum 精粹文集

Greenplum数据仓库UDW - UCloud中立云计算服务商

Greenplum 新一代数据管理和数据分析解决方案

Greenplum开源MPP数据库介绍

Greenplum 编译安装和调试

完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum