积分充值
 首页
前端开发
AngularDartElectronFlutterHTML/CSSJavaScriptReactSvelteTypeScriptVue.js构建工具
后端开发
.NetC#C++C语言DenoffmpegGoIdrisJavaJuliaKotlinLeanMakefilenimNode.jsPascalPHPPythonRISC-VRubyRustSwiftUML其它语言区块链开发测试微服务敏捷开发架构设计汇编语言
数据库
Apache DorisApache HBaseCassandraClickHouseFirebirdGreenplumMongoDBMySQLPieCloudDBPostgreSQLRedisSQLSQLiteTiDBVitess数据库中间件数据库工具数据库设计
系统运维
AndroidDevOpshttpdJenkinsLinuxPrometheusTraefikZabbix存储网络与安全
云计算&大数据
Apache APISIXApache FlinkApache KarafApache KyuubiApache OzonedaprDockerHadoopHarborIstioKubernetesOpenShiftPandasrancherRocketMQServerlessService MeshVirtualBoxVMWare云原生CNCF机器学习边缘计算
综合其他
BlenderGIMPKiCadKritaWeblate产品与服务人工智能亿图数据可视化版本控制笔试面试
文库资料
前端
AngularAnt DesignBabelBootstrapChart.jsCSS3EchartsElectronHighchartsHTML/CSSHTML5JavaScriptJerryScriptJestReactSassTypeScriptVue前端工具小程序
后端
.NETApacheC/C++C#CMakeCrystalDartDenoDjangoDubboErlangFastifyFlaskGinGoGoFrameGuzzleIrisJavaJuliaLispLLVMLuaMatplotlibMicronautnimNode.jsPerlPHPPythonQtRPCRubyRustR语言ScalaShellVlangwasmYewZephirZig算法
移动端
AndroidAPP工具FlutterFramework7HarmonyHippyIoniciOSkotlinNativeObject-CPWAReactSwiftuni-appWeex
数据库
ApacheArangoDBCassandraClickHouseCouchDBCrateDBDB2DocumentDBDorisDragonflyDBEdgeDBetcdFirebirdGaussDBGraphGreenPlumHStreamDBHugeGraphimmudbIndexedDBInfluxDBIoTDBKey-ValueKitDBLevelDBM3DBMatrixOneMilvusMongoDBMySQLNavicatNebulaNewSQLNoSQLOceanBaseOpenTSDBOracleOrientDBPostgreSQLPrestoDBQuestDBRedisRocksDBSequoiaDBServerSkytableSQLSQLiteTiDBTiKVTimescaleDBYugabyteDB关系型数据库数据库数据库ORM数据库中间件数据库工具时序数据库
云计算&大数据
ActiveMQAerakiAgentAlluxioAntreaApacheApache APISIXAPISIXBFEBitBookKeeperChaosChoerodonCiliumCloudStackConsulDaprDataEaseDC/OSDockerDrillDruidElasticJobElasticSearchEnvoyErdaFlinkFluentGrafanaHadoopHarborHelmHudiInLongKafkaKnativeKongKubeCubeKubeEdgeKubeflowKubeOperatorKubernetesKubeSphereKubeVelaKumaKylinLibcloudLinkerdLonghornMeiliSearchMeshNacosNATSOKDOpenOpenEBSOpenKruiseOpenPitrixOpenSearchOpenStackOpenTracingOzonePaddlePaddlePolicyPulsarPyTorchRainbondRancherRediSearchScikit-learnServerlessShardingSphereShenYuSparkStormSupersetXuperChainZadig云原生CNCF人工智能区块链数据挖掘机器学习深度学习算法工程边缘计算
UI&美工&设计
BlenderKritaSketchUI设计
网络&系统&运维
AnsibleApacheAWKCeleryCephCI/CDCurveDevOpsGoCDHAProxyIstioJenkinsJumpServerLinuxMacNginxOpenRestyPrometheusServertraefikTrafficUnixWindowsZabbixZipkin安全防护系统内核网络运维监控
综合其它
文章资讯
 上传文档  发布文章  登录账户
IT文库
  • 综合
  • 文档
  • 文章

无数据

分类

全部数据库(8)Greenplum(8)

语言

全部中文(简体)(8)

格式

全部PDF文档 PDF(8)
 
本次搜索耗时 0.161 秒,为您找到相关结果约 8 个.
  • 全部
  • 数据库
  • Greenplum
  • 全部
  • 中文(简体)
  • 全部
  • PDF文档 PDF
  • 默认排序
  • 最新排序
  • 页数排序
  • 大小排序
  • 全部时间
  • 最近一天
  • 最近一周
  • 最近一个月
  • 最近三个月
  • 最近半年
  • 最近一年
  • pdf文档 Greenplum 精粹文集

    Sharedisk 架构,后者最大瓶颈就是在 IO 吞吐上,在大规模数据处理时,IO 无法及时 feed 数据给到 CPU, CPU 资源处于 wait 空转状态,无法充分利用系统资源,导致 SQL 效 率低下: 一台内置 16 块 SAS 盘的 X86 服务器,每秒的 IO 数据扫描性能约在 2000MB/s 左右,可以想象,20 台这样的服务器构成的机群 IO 性能 是 40GB/s,这样超大的 IO master,所以 master 节点的可用性直接关系到集群的稳定, 但从实践经验来看,由于 master 节点只存元数据,只负责 SQL 的解析、 分发以及最终计算结果的展现,所以承担的负载一般都非常小,故障 率也极低,在我们维护阿里 Greenplum 集群 3 年的时间里,以及接触 到的客户中,基本上没有碰到由于 master 故障导致集群不可用的情况, 唯一一次,还是因为客户误操作同时将 master 和 均匀为第一大原则,选取更有业务意义的字段,并非必须选择原库 的主键(PK)。 ·压缩表使用: 大表都要采用压缩存储,既节省空间也节省 IO 资源。长远来看还可 降低阵列卡和磁盘的故障率。 ·行存还是列存: 列存储有更高的压缩率,合适于聚合运算,但不合适于宽表。一个 数据库中不应只有一种存储方式,每张表应依据实际情况设计存储 方式。 ·临时表: 对于程序中所使用到的临时表和中间表,上述 3 点规则同样适用。
    0 码力 | 64 页 | 2.73 MB | 1 年前
    3
  • pdf文档 Greenplum数据仓库UDW - UCloud中立云计算服务商

    表数据经常 insert; 查询中选择⼤部分的列; 列存储的应⽤场景: 列存储⼀般适⽤于宽表(即字段⾮常多的表)。在使⽤列存储时,同⼀个字段的数据连续保存在⼀个物理⽂件中,所以列存储的压缩率⽐普通压缩表的压缩率要⾼很多,另外在多数字段中筛 选其中⼏个字段中,需要扫描的数据量很⼩,扫描速度⽐较快。因此,列存储尤其适合在宽表中对部分字段进⾏筛选的场景。注意:列存储的表必须是追加表(Appendonly 表数据经常insert; 3. 查询中选择⼤部分的列; 列存储的应⽤场景: 列存储⼀般适⽤于宽表(即字段⾮常多的表)。在使⽤列存储时,同⼀个字段的数据连续保存在⼀个物理⽂件中,所以列存储的压缩率⽐普通压缩表的压缩率要⾼很多,另外在多数字段中筛 选其中⼏个字段中,需要扫描的数据量很⼩,扫描速度⽐较快。因此,列存储尤其适合在宽表中对部分字段进⾏筛选的场景。 列存储的表必须是追加表(Appendonly ⾼。对于压缩的数据,使⽤索引访问⽅法时,只有需要的数据才会被解压缩。 3. 避免在经常改变的列上创建索引:在经常更新的列上创建索引会导致每次更新数据时写操作⼤量增加。 4. 创建选择率⾼的 B-树索引,对于选择率较低的列,使⽤ Bitmap 索引。 5. 对参与连接操作的列创建索引:对经常⽤于连接的列(例如:外键列)创建索引,可以让查询优化器使⽤更多的连接算法,进⽽提⾼连接效率。 6. 对经常出现在
    0 码力 | 206 页 | 5.35 MB | 1 年前
    3
  • pdf文档 Greenplum Database 管理员指南 6.2.1

    压缩速度:虽然说,quicklz与zlib相比,有更好的压缩解压速度,相对来说压 缩率差一些,但是,已经有ZSTD可以用了,谁还在乎这些呢。例如,quicklz与 zlib level 1的压缩相比,具有相当的压缩率,会有更好的性能,与zlib level 6相比,zlib level 6会有好很多的压缩率,当然性能也会有显著的下降。选择 ZSTD,通过选择压缩级别,就可以兼顾压缩率与性能。所以,在6版本之前,一 般选择zlib level (appendonly=true, compresstype=zstd, compresslevel=5); 检查 AO 表的压缩与分布情况 GP提供了内置的函数用以检查AO表的压缩率和分布情况。这两个函数可以使用对 象ID或者TABLE的NAME作为参数。表名可能需要带模式名。 函数 返回类型 解释 get_ao_distribution(name) ge get_ao_compression_ratio(name) get_ao_compression_ratio(oid) float8 计算出 AO 表的压缩率。如 果该信息未得到,将返回 -1 值。 压缩率得到的是一个常见的比值类型。例如,6.19,意思是该TABLE未压缩状态 下的储存尺寸是压缩状态下的储存尺寸的6.19倍。 分布信息展示的是每个Insta
    0 码力 | 416 页 | 6.08 MB | 1 年前
    3
  • pdf文档 Greenplum机器学习⼯具集和案例

    ~16x/迭代 ⼯工作流程优化 2017.thegiac.com 原始模型 改良后的模型 ● 模型精确度 = 99.7% ● 真正率(True Positive Rate) = 0% ● 模型精确度= 62.8% ● 真正率 = 66% 该模型善于预测不不会点击邮件的⽤用户, 但是⽆无法预测会点击邮件的⽤用户 该模型更善于预测会点击邮件的用户, 这样是用户真正关心的,能为公司带来
    0 码力 | 58 页 | 1.97 MB | 1 年前
    3
  • pdf文档 完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum

    数据管理专业委员会(SIGMOD)发起、在数据库领域具有最高学术地位的国际性学术会议,SIGMOD 和另外 两大数据库会议 VLDB、ICDE 构成了数据库领域的三个顶级会议,其论文录取率是很低的,平均录取率大约仅为 15%-17%,值得一提的是此论文主要由中国研发团队完成,也说明了中国研发团队实力处于世界一流水平。在论文 中 Greenplum 团队提出一种全新的全局死锁检测器来减少独占锁
    0 码力 | 17 页 | 2.04 MB | 1 年前
    3
  • pdf文档 Brin Index主Greenplum 7中的理论与实现

    TB的Heap表只需要125M的Brin [1, 5] [7, 10] [9, 12] Brin Block Rang Confidential │ ©2021 VMware, Inc. Brin的选择率 BlockNum: B = 1000 TupleNum: N = 1000000 TuplePerblock: M = 1000 Selection: a = 1%
    0 码力 | 32 页 | 1.04 MB | 1 年前
    3
  • pdf文档 Greenplum 6: 混合负载的理想数据平台

    1. 24 个生产集群 2. 2个选项: 20个节点或 40个节点 3. 600+ 服务器, 13k+ 核, 81PB存储(增长 中) 4. 2.5PB 或 25PB 原始数据 按10x压缩率 1 2 3 4 Greenplum在摩根士丹利 OLTP - Online transaction processing - 联机事务处理 出色的OLTP特性 天生的优势 ● 行式存储
    0 码力 | 52 页 | 4.48 MB | 1 年前
    3
  • pdf文档 Pivotal Greenplum 最佳实践分享

    • 数据压缩对于高并发查询分析系统可以大幅降低IO消耗,提升并行处理、混合负载的性能 分布键使用: • 尽量采用一个常用关联字段作为分布键,例如账号、客户号,这个可以提高关联条件的命中率,减少关联时数据重分布 (主要对大表) • 选用分布键同时考虑数据平均分布(一个例子,日志号不是最好的分布键,大量的空值导致资料倾斜) 物理模型经验分享(续) 分区表使用:
    0 码力 | 41 页 | 1.42 MB | 1 年前
    3
共 8 条
  • 1
前往
页
相关搜索词
Greenplum精粹文集数据仓库数据仓库UDWUCloud中立计算服务服务商Database管理管理员指南机器学习案例完全兼容欧拉开源操作系统操作系统HTAP平台BrinIndex理论实现混合负载理想Pivotal最佳实践分享
IT文库
关于我们 文库协议 联系我们 意见反馈 免责声明
本站文档数据由用户上传或本站整理自互联网,不以营利为目的,供所有人免费下载和学习使用。如侵犯您的权益,请联系我们进行删除。
IT文库 ©1024 - 2025 | 站点地图
Powered By MOREDOC AI v3.3.0-beta.70
  • 关注我们的公众号【刻舟求荐】,给您不一样的精彩
    关注我们的公众号【刻舟求荐】,给您不一样的精彩