Greenplum 精粹文集而如果你的数据加载后只会被用于读取少数次的任务和用于少数次 的访问,而且主要用于 Batch(不需要交互式),对计算性能不是 很敏感,那 Hadoop 也是不错的选择,因为 Hadoop 不需要你花费 较多的精力来模式化你的数据,节省数据模型设计和数据加载设计 方面的投入。这些系统包括:历史数据系统、ETL 临时数据区、数 据交换平台等等。 切记,千万不要为了大数据而大数据(就好像不要为了创新而创新一 个道理),否则,你项目最后的产出与你的最初设想可能 两者并行处理的优势。 Big Date2.indd 30 16-11-22 下午3:38 Greenplum 精粹文集 31 2. 数据模型设计的重要性 实施 Greenplum 的项目,有的是从其他数据库产品迁移过来的数据模 型,有的是新设计的数据模型。无论是哪种情况,设计时请重点关注 Greenplum 的特性,要充分发挥 Greenplum 所长。 ·分布键: 均匀为第一大0 码力 | 64 页 | 2.73 MB | 1 年前3
Pivotal Greenplum 5: 新一代数据平台集成分析:改进后的全新分析接口 一直以来,客户都能在 Pivotal Greenplum 中做高级分析,无论是提供将应用逻辑向下推送至数据所在位置的方法,执行 分析功能,还是以大规模并行方式构建数据模型,都可以实现。Greenplum 5 支持适用于数据挖掘和数据科学工作的最全面、 最先进的分析程序包和扩展。 Greenplum 5 还针对最受欢迎的 Python 和 R 语言算法库提供简单易用的安装程序。0 码力 | 9 页 | 690.33 KB | 1 年前3
完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum打开任何其他外部连接。 集成分析:改进后的全新分析接口 一直以来,客户都能在 Greenplum 中做高级分析,无论是提供将应用逻辑向下推送至数据所在位置的方法,执行分 析功能,还是以大规模并行方式构建数据模型,都可以实现。Greenplum 支持适用于数据挖掘和数据科学工作的最 全面、最先进的分析程序包和扩展。Greenplum 还针对最受欢迎的 Python 和 R 语言算法库提供简单易用的安装程0 码力 | 17 页 | 2.04 MB | 1 年前3
Greenplum Database 管理员指南 6.2.1........................................................................................ - 373 - 数据模型 ................................................................................................. Instance 之间存储数据的,可以参考下图所示的简单 逻辑关系,主键(Primary Key)被使用黑体标记,外键(Foreign Key)关系通过连 线标明。 用数据仓库的术语来说,这种数据模型称为星型模型。在这种数据库模型下,Order 表通常被称为事实表(Fact Table),其他表(Customer、Vendor、Product)被称 为维表(Dimension Table)。不 维管理、性能优化等工作,都 可以起到很好的指导作用,也可以帮助很多初学者解决一些概念上的困惑。 最佳实践概述 本节,将大概介绍一下最佳实践的多个方面的内容。 数据模型 GP是MPP数据库,主要专注在分析型场景,所以,与传统的单机交易型数据库在模 型设计上会有所不同。因此,GP更推荐如下的模型设计: 对于非范式模型,GP数据库将会表现出更好的性能。比如星型模型和雪花模型,0 码力 | 416 页 | 6.08 MB | 1 年前3
共 4 条
- 1













