文件系统优化 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Greenplum上云与优化

张广舟（明虚）阿里云高级专家 Greenplum上云与优化 — ApsaraDB for Greenplum介绍 2016Postgres中国用户大会目录 content ApsaraDB for GP的定位 ApsaraDB for GP的内核优化未来的规划 2016Postgres中国用户大会 ApsaraDB for GP的定位 2016Postgres中国用户大会 2016Postgres中国用户大会 ApsaraDB for GP的定位 ApsaraDB for GP = 简单、高效解决大数据分析需求 MPP + 列存压缩复杂SQL + 查询优化器本地高效存储 +高速网络 +预置稳定资源 = = 2016Postgres中国用户大会 GP vs. RDS? Select count(*) from customer group Name Id status city 列存块 ….. 列存块列存 ≈索引 + index only 2016Postgres中国用户大会 GP vs. Hadoop? Orca优化器 SQL Runtime 本地存储 >5-30倍的性能优势 2016Postgres中国用户大会 ApsaraDB for GP vs. AWS Redshift? “有史以来卖的最好的云服务”

0 码力 | 26 页 | 1.13 MB | 1 年前
3
HBase最佳实践及优化

Postgres Conference China 2016 中国用户大会 HBase最佳实践及优化陈飚 cb@cloudera.com Cloudera Postgres Conference China 2016 中国用户大会关于我… 陈飚 Cloudera售前技术经理、资深方案架构师 http://biaobean.pro 原Intel Hadoop发行版核心开发人员, 成功实施并运维多成功实施并运维多个上百节点Hadoop大数据集群。 – 曾在Intel编译器部门从事服务器中间件软件开发，擅长服务器软件调试与优化，与团队一起开发出世界上性能领先的XSLT 语言处理器 – 2010 年后开始Hadoop 产品开发及方案顾问，先后负责Hadoop 产品化、HBase 性能调优，以及行业解决方案顾问 2 Postgres Conference China 2016 中国用户大会固定一个数据模型（固定数据模型能得到高性能，同时满足应用需求） – 无数据类型 Postgres Conference China 2016 中国用户大会 HBase的实现特性 • 非常高的数据读写速度，为写特别优化 – 高效的随机读取 – 对于数据的某一个子集能够进行有效地扫描 • 具有容错特性，能够将数据持久化的非易失性存储中 – 使用HDFS做底层存储，可利用Hadoop的压缩 Codec等减少空间占用

0 码力 | 45 页 | 4.33 MB | 1 年前
3
PostgreSQL 查询优化器解析

0 码力 | 37 页 | 851.23 KB | 1 年前
3
Oracle 和 MySQL 性能优化感悟

0 码力 | 19 页 | 3.82 MB | 1 年前
3
云原生数据库PieCloudDB 性能优化之路

郭峰拓数派云原生数据库PieCloudDB 性能优化之路打造立足于国内基础数据计算领域的世界级高科技创新驱动机构杭州拓数派科技发展有限公司（又称“OpenPie”），以“Data Computing for New Discoveries”「数据计算，只为新发现」为使命，成立后的短短10个月时间内，完成了包括头部产业基金、东吴证券、元禾重元和政府科创平台在内的连续三轮战略融资。 PostgreSQL优化器简介 PieCloudDB优化器之分布式特性简介 PieCloudDB优化器之云原生特性简介 Q/A Contents 录目 01 • 预处理阶段 • 通过逻辑上的等价变换，把查询树转换为更加简单高效的等式 • 分发约束条件，收集外连接信息等 • 扫描/连接优化阶段 • 主要处理扫描和连接操作 • 扫描/连接之外的优化阶段 • 主要处理除扫以上每一步操作都会产生一个或多个路径 • 为每个路径添加LockRows, Limit, ModifyTable • 把最优路径转换为查询计划 • 对最优计划进行一些调整 02 • PieCloudDB优化器拓展了PostgreSQL优化器，使其适用于分布式架构 • 引入了Motion的概念，使得数据可以在不同的工作节点之间移动 • 利用Motion产生分布式的查询计划 • 这些分布式的查询计划会被分为更小的单元，并被分发到不同的工作节点中并行执行

0 码力 | 26 页 | 711.44 KB | 1 年前
3
Greenplum Database 管理员指南 6.2.1

................................................................................. - 182 - 关于 ORCA 优化器 ................................................................................................. ................................................................................. - 263 - 与数据导入相关的优化 .................................................................................................. ........................................................................................ - 272 - 文件系统要求 ...............................................................................................

0 码力 | 416 页 | 6.08 MB | 1 年前
3
完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum

......................................................................................... 10 并发控制优化 .................................................................................................. 云原生调度增强：针对云场景在线和离线业务混合部署场景，创新 CPU 调度算法保障在线业务对 CPU 的实时抢占及抖动抑制，创新业务优先级 00M 内存回收算法保障在线业务安全可靠运行。 • 新文件系统 EulerFS：面向非易失性内存的新文件系统，采用软更新、目录双视图等技术减少文件元数据同步时间，提升文件读写性能。 • 内存分级扩展 etMem：新增用户态 swap 功能，策略配置淘汰的冷内存交换到用户态存储，用户无感知，性能容器化部署、运维，提供与业务容器一致的基于 K8S 的管理体验。 • 安全容器方案：iSulad+shimv2+StratoVirt 安全容器方案，相比传统 docker+qemu 方案，底噪和启动时间优化 40%。 • 双平面部署工具 eqqo：ARM/X86 双平面混合集群 0S 高效一键式安装，百节点部署时间<15min。 3. 探索场景创新边缘计算：发布面向边缘计算场景的版本

0 码力 | 17 页 | 2.04 MB | 1 年前
3
TiDB中文技术文档

TiDB 数据库管理 TiDB 服务 TiDB 进程启动参数 TiDB 系统数据库 TiDB 系统变量 TiDB 专用系统变量和语法 TiDB 访问权限管理 TiDB 用户账户管理使用加密连接 SQL 优化理解 TiDB 执行计划统计信息语言结构字面值数据库、表、索引、列和别名关键字和保留字用户变量表达式语法注释语法字符集和时区字符集支持字符集配置时区数据类型日期和时间类型进程启动参数 TiDB 数据目录 TiDB 系统数据库 TiDB 系统变量 TiDB 专用系统变量和语法 TiDB 服务器日志文件 TiDB 访问权限管理 TiDB 用户账户管理使用加密连接 SQL 优化理解 TiDB 执行计划统计信息语言结构字面值数据库、表、索引、列和别名关键字和保留字用户变量表达式语法注释语法字符集和时区字符集支持字符集配置时区数据类型数值类型日期和时间类型 : 每个 TiKV 的 leader/region 数量 TiDB 快速入门指南 - 22 - 本文档使用书栈(BookStack.CN) 构建 TiDB 用户文档 TiDB 数据库管理 SQL 优化语言结构字符集和时区数据类型函数和操作符 SQL 语句语法 JSON 支持 Connectors 和 API TiDB 事务隔离级别错误码与故障诊断与 MySQL 兼容性对比 TiDB 内存控制

0 码力 | 444 页 | 4.89 MB | 6 月前
3
TiDB v5.1 中文手册

· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 74 4.2.1 在 TiKV 部署目标机器上添加数据盘 EXT4 文件系统挂载参数 · · · · · · · · · · · · · · · · · · · · · · · · · 74 4.2.2 检测及关闭系统 swap· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 76 4.2.5 检查和配置操作系统优化参数 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 78 4.2 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 283 8.2.3 分析优化器问题 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·

0 码力 | 2189 页 | 47.96 MB | 1 年前
3
Greenplum 精粹文集

SMP（对称多处理）架构难于扩展，并且在 CPU 计算和 IO 吞吐上不能满足海量数据的计算需求。分布式存储和分布式计算理论刚刚被提出来，Google 的两篇著名论文发表后引起业界的关注，一篇是关于 GFS 分布式文件系统，另外一篇是关于 MapReduce 并行计算框架的理论，分布式计算模式在互联网行业特别是收索引擎和分词检索等方面获得了巨大成功。 Big Date2.indd 1 16-11-22 Postgresql 是单实例数据库，怎么能在多个 X86 服务器上运行多个实例且实现并行计算呢？为了这，Interconnnect 大神器出现了。在那一年多的时间里，大咖们很大一部分精力都在不断的设计、优化、开发 Interconnect 这个核心软件组件。最终实现了对同一个集群中多个 Postgresql 实例的高效协同和并行计算，Interconnect 承载了并行查询计划生产和 Dispatch 于 Madlib、R 的支持也很好。这一点上 MYSQL 就差的很远，很多分析功能都不支持，而 Greenplum 作为 MPP 数据分析平台，这些功能都是必不可少的。 2) Mysql 查询优化器对于子查询、复制查询如多表关联、外关联的支持等较弱，特别是在关联时对于三大 join 技术：hash join、merge join、nestloop join 的支持方面，Mysql 只支持最后一种

0 码力 | 64 页 | 2.73 MB | 1 年前
3

共 103 条前往

页

分类

语言

格式

Greenplum上云与优化

HBase最佳实践及优化

PostgreSQL 查询优化器解析

Oracle 和 MySQL 性能优化感悟

云原生数据库PieCloudDB 性能优化之路

Greenplum Database 管理员指南 6.2.1

完全兼容欧拉开源操作系统的 HTAP 数据平台 Greenplum

TiDB中文技术文档

TiDB v5.1 中文手册

Greenplum 精粹文集