Apache Kyuubi 1.7.0-rc0 Documentation
3.79 MB
210 页
0 下载
143 浏览
0 评论
0 收藏
所属分类:
云计算&大数据 / Apache Kyuubi
| 语言 | 格式 | 评分 |
|---|---|---|
英语 | .pdf | 3 |
| 摘要 | ||
Apache Kyuubi 是一个高性能的统一 JDBC 和 SQL 执行引擎,旨在帮助用户像处理普通数据一样处理大数据。它提供标准化的 JDBC 接口,支持多租户、高可用性和数据安全,依赖 Apache Spark 提供高性能查询能力。Kyuubi 通过扩展点支持插件功能,并提供弹性资源管理以优化资源利用率。文档还介绍了 Kyuubi 的架构、配置、安全性以及与 Spark 的集成。 | ||
| AI总结 | ||
### Apache Kyuubi 1.7.0-rc0 文档总结
#### 1. **概述**
Apache Kyuubi 是一个高性能的通用 JDBC 和 SQL 执行引擎,旨在帮助用户像处理普通数据一样处理大数据。它提供标准化的 JDBC 接口,使用户无需关注底层大数据平台(计算引擎、存储服务、元数据管理等)。Kyuubi 依赖 Apache Spark 提供高性能数据查询能力,并通过以下方式提升性能和可用性:
- **引擎缓存**:提高即席查询的响应速度。
- **水平扩展和负载均衡**:提升并发能力。
- **高可用性和负载均衡**:确保服务稳定性和 SLA 承诺。
- **弹性资源管理**:两级架构设计,优化资源利用率。
Kyuubi 的目标是基于 Apache Spark 和数据湖技术,打造统一的数据湖管理平台,支持 ETL、BI 分析等场景,实现“一平台、一份数据、一个 SQL 接口”的统一处理。
---
#### 2. **架构**
Kyuubi 的架构设计使其能够高效管理和处理大规模数据。其核心组件包括:
- **控制平面**:提供集中化的认证和授权功能,支持多租户和多种协议(如 LDAP、Kerberos)。
- **数据平面**:通过引擎隔离数据和元数据访问,确保资源和数据安全。
- **扩展支持**:支持插件化扩展,管理员或用户可通过插件动态扩展功能。
---
#### 3. **升级指南**
- **从 Kyuubi 1.6 升级到 1.7**:
- `kyuubi.ha.zookeeper.engine.auth.type` 不再 fallback 到 `kyuubi.ha.zookeeper.auth.type`,需显式设置为 KERBEROS。
- `GetInfo` 请求返回引擎信息,若需恢复旧行为,设置 `kyuubi.server.info.provider` 为 SERVER。
- 会话类型 SQL 已重构为 INTERACTIVE,用户需使用 INTERACTIVE 查看会话事件。
- REST API 的 Open(创建)会话不再包含 `user` 和 `password` 参数,需通过 HTTP 请求的 Authorization 头设置。
- **从 Kyuubi 1.6.0 升级到 1.6.1**:
- `kyuubi.ha.zookeeper.engine.auth.type` 不再 fallback 到 `kyuubi.ha.zookeeper.auth.type`,需显式设置为 KERBEROS。
- **从 Kyuubi 1.5 升级到 1.6**:
- Zookeeper 认证相关配置 `kyuubi.kui.principal` 和 `kyuubi.kui.keytab` 被移除,需显式设置 `kyuubi.ha.zookeeper.auth.principal` 和 `kyuubi.ha.zookeeper.auth.keytab`。
---
#### 4. **配置与扩展**
Kyuubi 提供灵活的配置方式,支持通过以下方式扩展功能:
- **插件扩展**:管理员可通过插件扩展 Kyuubi 服务器功能,例如自定义配置顾问(`SessionConfAdvisor`)。
- **动态扩展**:部分插件可由用户在运行时动态加载。
---
#### 5. **性能优化**
Kyuubi 基于 Apache Spark 的自适应查询执行(AQE)框架,提供以下优化功能:
- **小文件合并**:通过增加 Shuffle 阶段自动合并小文件,支持数据源表和 Hive 表。
- **优化倾斜连接**:在 Join 前插入 Shuffle 节点,确保倾斜连接优化生效。
- **分区级别配置隔离**:通过配置隔离解决分区大小冲突问题,优化数据处理效率。
---
#### 6. **高可用性与安全性**
- **高可用性**:
- 负载均衡:防止单点故障,确保零停机时间维护。
- 故障检测:通过指标和日志监控服务器和引擎状态。
- **安全性**:
- 多租户支持:通过集中化认证和授权层确保数据和资源安全。
- 精细权限控制:支持行/列级别的数据访问控制。
---
#### 7. **发行与贡献**
Kyuubi 定期发布新版本,遵循 Apache 项目规范,由社区投票决定发布。贡献者可通过邮件列表参与讨论和开发,文档中也提供了 IDE 设置和贡献指南。
---
以上为 Apache Kyuubi 1.7.0-rc0 的核心内容总结,涵盖架构、功能、升级、配置、优化及安全性等方面,便于用户快速了解和使用。 | ||
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余
203 页请下载阅读 -
文档评分














Apache Kyuubi 1.8.0 Documentation