并行不悖- OLAP 在互联网公司的实践与思考管理数据库内对象权限 Ø 用户 user : 用户认证权限 Ø pg_hba.conf : 实例权限配置文件 Ø iptables : 防火墙IP访问配置策略 • 账号类型划分 Ø 管理账号 Ø 开发账号 Ø 调度账号 Ø 业务账号 Ø 测试账号 • 账号名称限定 Ø 所有都用小写字母加下划线的方式 Ø 按照命名规则,做到见名知义 37 Greenplum开发规范 Greenplum使用规范 •0 码力 | 43 页 | 9.66 MB | 1 年前3
Pivotal Greenplum 最佳实践分享在金融业,行压缩的数据压缩比在1:6左右,一般采用zlib5级压缩 • 数据压缩对于高并发查询分析系统可以大幅降低IO消耗,提升并行处理、混合负载的性能 分布键使用: • 尽量采用一个常用关联字段作为分布键,例如账号、客户号,这个可以提高关联条件的命中率,减少关联时数据重分布 (主要对大表) • 选用分布键同时考虑数据平均分布(一个例子,日志号不是最好的分布键,大量的空值导致资料倾斜) 物理模型经验分享(续) 以数据批处理为主要功能的系统一般不需建索引 • 以并发查询为主要功能,特别OLTP查询(根据KEY,Attribute等作为筛选条件)的系统按照常用字段建索引。 • 建索引的方法:对于区别度高的字段,如账号、手机号码等使用B-Tree索引,对于区别度低的字段(<10000),采用 Bitmap索引; • 表关联时,一般不需要建索引,如果where条件的筛选性很强,建立索引可以让系统性能提升 •0 码力 | 41 页 | 1.42 MB | 1 年前3
Greenplum Database 管理员指南 6.2.1Read、Alter、Delete 任何数据,包括系统 表的访问和任何数据库操作,因此,保护好 gpadmin 用户账号是很重要的。超级用户 (gpadmin)只应该用于执行特定的系统管理任务(例如备份恢复、故障处理、升级、扩 容等)。一般的数据库访问不应该使用 gpadmin 账号,ETL 等生产系统也不应该使用 gpadmin 账号。不要闲的无聊,试图将 gpadmin 修改为 NOSUPERUSER,弄不好如 Greenplum0 码力 | 416 页 | 6.08 MB | 1 年前3
共 3 条
- 1













