Greenplum Database 管理员指南 6.2.1,提供最专业的落地实施支持。 十多年来,参与过的项目不计其数,有 POC 测试,有开发支持,有故障支持,有 长期驻场支持,有临时的功能支持,甚至可能会作为用户看不见的后端支持,总之,我 们的目标是,努力解决用户的一切不违背自然规律的诉求,我们跟随着 Greenplum 的 成长,见证了 Greenplum 从闭源到开源的成长历程,一路给 Greenplum 做各种补丁 脚本,也看到了 Greenplum reindexdb 将数据库重建索引 vacuumdb 回收数据库的磁盘空间并分析数据库 在使用这些客户端应用程序时,必须通过 GP Master 来访问数据库,必须知道需 要访问的目标 DB Name、Host Name、Port 以及连接使用的 User Name。这些参 数在命令行可以分别使用-d、-h、-p 和-U 提供。没有指定任何选项的参数会优先被 解读为 DB Name。 pg_resgroup_move_query()函数时,该查询将受到新的资源组的配额 限制: 如果目标资源组的最大并发事务数量已经超了,该查询会进行排队等待状态。 Greenplum Database 管理员指南 V6.2.1 版权所有:Esena(陈淼 +86 18616691889) 编写:陈淼 - 67 - 如果目标资源组的内存资源不足,调用该函数时会收到如下报错信息: group0 码力 | 416 页 | 6.08 MB | 1 年前3
深度揭秘Greenplum开源数据库透明加密https://github.com/greenplum-db/gpdb Recall GPDB数据透明加密方案设计 GPDB TDE GPDB透明加密 加密目标 • 表数据 • 预写日志数据 • 主从节点所有数据 • 索引及其他表辅助数据 • 磁盘缓存文件 设计目标 • 对用户和数据库透明 • 高性能,使用CPU加密指令集 • 内核原生 GPDB透明加密 加密 Planer TDE key0 码力 | 48 页 | 10.19 MB | 1 年前3
Pivotal Greenplum 最佳实践分享以让系统性能提升 • 对于大数据类系统,应避免使用PK,UI,FK,唯一性约束或参考性检查将导致性能大幅下降; • 大数量更新时,应先删除索引,更新/加载数据后再重建索引,或者采用分区交换降低对目标表的影响 临时空间的监控和管理 临时空间被无限制使用,可能导致系统空间撑爆,为了避免这种情况,建议设置以下参数 – gp_workfile_compress_algorithm Transfer命令 基于gpfdist和外部表实现,比基于命名管道的gptransfer更稳定高效 两个集群之间必须互相网络连通 集群之间无需ssh互信 源端与目标端对象名称可不一致 条件源端过滤,降低带条件场景的网络压力 源端可以是视图,自劢识别是否使用快速模式 命令可部署在可在集群外执行 自劢识别低速模式,快速模式和全速模式0 码力 | 41 页 | 1.42 MB | 1 年前3
Pivotal HVR meetup 20190816Data Lake Data Warehouse Cloud HVR 连续数据集成技术 Migrations Disaster Recovery 6 扩展性—高性能架构 7 • 创建并装载目标表 • 用于实时复制的初始化 • 也可以单独使用 • 可以被定义为任务,定时调度执行 异构平台环境下初始化同步 8 • 非侵入式技术对生产没有影响 • 基于日志捕获技术的实时性非常高0 码力 | 31 页 | 2.19 MB | 1 年前3
Greenplum数据库架构分析及5.x新功能分享Segment Instance Segment Instance 节点N 8 Pivotal Confidential–Inter nal Use Only 数据分布: 并行化的根基 最重要的策略和目标是均匀分布数据到各个数据节点。 43 Oct 20 2005 12 64 Oct 20 2005 111 45 Oct 20 2005 42 46 Oct 20 2005 64 77 Oct0 码力 | 44 页 | 8.35 MB | 1 年前3
Greenplum机器学习⼯具集和案例在Greenplum内部实现了了流程⾃自动 化 X 代码复杂冗余,很多数据类型 转换 ✓ 代码更更精简,更更便便于维护的代码 X 原始模型预测效果不不理理想 ✓ 新模型能够更更精准地预测⽬目标客 户 商业影响 2017.thegiac.com 用户案例例2 基于API日志的⾦金金融产品⽤用户分析 2017.thegiac.com 问题 ● 更更好地理理解不不同种0 码力 | 58 页 | 1.97 MB | 1 年前3
Greenplum 6: 混合负载的理想数据平台standby primary segment mirror segment 6 Pivotal Confidential–Internal Use Only 数据分布: 并行化的根基 最重要的策略和目标是均匀分布数据到各个数据节点。 43 Oct 20 2005 12 64 Oct 20 2005 111 45 Oct 20 2005 42 46 Oct 20 2005 64 77 Oct 200 码力 | 52 页 | 4.48 MB | 1 年前3
Greenplum 精粹文集1) 为什么不从数据库底层进行重新设计研发? 所谓术业有专攻,就像制造跑车的不会亲自生产车轮一样,我们只 要专注在分布式技术中最核心的并行处理技术上面,协调我们下面 的轮子跑的更快更稳才是我们的最终目标。而数据库底层组件就像 车轮一样,经过几十年磨砺,数据库引擎技术已经非常成熟,大可 不必去重新设计开发,而且把数据库底层交给其它专业化组织来开 发(对应到 Postgresql 就是社区),还可充分利用到社区的源源不0 码力 | 64 页 | 2.73 MB | 1 年前3
共 8 条
- 1













