搜索

pdf文档 Apache Kyuubi 1.7.0-rc0 Documentation

3.79 MB 210 页 0 下载 143 浏览 0 评论 0 收藏
语言 格式 评分
英语
.pdf
3
摘要
Apache Kyuubi 是一个高性能的统一 JDBC 和 SQL 执行引擎,旨在帮助用户像处理普通数据一样处理大数据。它提供标准化的 JDBC 接口,支持多租户、高可用性和数据安全,依赖 Apache Spark 提供高性能查询能力。Kyuubi 通过扩展点支持插件功能,并提供弹性资源管理以优化资源利用率。文档还介绍了 Kyuubi 的架构、配置、安全性以及与 Spark 的集成。
AI总结
### Apache Kyuubi 1.7.0-rc0 文档总结 #### 1. **概述** Apache Kyuubi 是一个高性能的通用 JDBC 和 SQL 执行引擎,旨在帮助用户像处理普通数据一样处理大数据。它提供标准化的 JDBC 接口,使用户无需关注底层大数据平台(计算引擎、存储服务、元数据管理等)。Kyuubi 依赖 Apache Spark 提供高性能数据查询能力,并通过以下方式提升性能和可用性: - **引擎缓存**:提高即席查询的响应速度。 - **水平扩展和负载均衡**:提升并发能力。 - **高可用性和负载均衡**:确保服务稳定性和 SLA 承诺。 - **弹性资源管理**:两级架构设计,优化资源利用率。 Kyuubi 的目标是基于 Apache Spark 和数据湖技术,打造统一的数据湖管理平台,支持 ETL、BI 分析等场景,实现“一平台、一份数据、一个 SQL 接口”的统一处理。 --- #### 2. **架构** Kyuubi 的架构设计使其能够高效管理和处理大规模数据。其核心组件包括: - **控制平面**:提供集中化的认证和授权功能,支持多租户和多种协议(如 LDAP、Kerberos)。 - **数据平面**:通过引擎隔离数据和元数据访问,确保资源和数据安全。 - **扩展支持**:支持插件化扩展,管理员或用户可通过插件动态扩展功能。 --- #### 3. **升级指南** - **从 Kyuubi 1.6 升级到 1.7**: - `kyuubi.ha.zookeeper.engine.auth.type` 不再 fallback 到 `kyuubi.ha.zookeeper.auth.type`,需显式设置为 KERBEROS。 - `GetInfo` 请求返回引擎信息,若需恢复旧行为,设置 `kyuubi.server.info.provider` 为 SERVER。 - 会话类型 SQL 已重构为 INTERACTIVE,用户需使用 INTERACTIVE 查看会话事件。 - REST API 的 Open(创建)会话不再包含 `user` 和 `password` 参数,需通过 HTTP 请求的 Authorization 头设置。 - **从 Kyuubi 1.6.0 升级到 1.6.1**: - `kyuubi.ha.zookeeper.engine.auth.type` 不再 fallback 到 `kyuubi.ha.zookeeper.auth.type`,需显式设置为 KERBEROS。 - **从 Kyuubi 1.5 升级到 1.6**: - Zookeeper 认证相关配置 `kyuubi.kui.principal` 和 `kyuubi.kui.keytab` 被移除,需显式设置 `kyuubi.ha.zookeeper.auth.principal` 和 `kyuubi.ha.zookeeper.auth.keytab`。 --- #### 4. **配置与扩展** Kyuubi 提供灵活的配置方式,支持通过以下方式扩展功能: - **插件扩展**:管理员可通过插件扩展 Kyuubi 服务器功能,例如自定义配置顾问(`SessionConfAdvisor`)。 - **动态扩展**:部分插件可由用户在运行时动态加载。 --- #### 5. **性能优化** Kyuubi 基于 Apache Spark 的自适应查询执行(AQE)框架,提供以下优化功能: - **小文件合并**:通过增加 Shuffle 阶段自动合并小文件,支持数据源表和 Hive 表。 - **优化倾斜连接**:在 Join 前插入 Shuffle 节点,确保倾斜连接优化生效。 - **分区级别配置隔离**:通过配置隔离解决分区大小冲突问题,优化数据处理效率。 --- #### 6. **高可用性与安全性** - **高可用性**: - 负载均衡:防止单点故障,确保零停机时间维护。 - 故障检测:通过指标和日志监控服务器和引擎状态。 - **安全性**: - 多租户支持:通过集中化认证和授权层确保数据和资源安全。 - 精细权限控制:支持行/列级别的数据访问控制。 --- #### 7. **发行与贡献** Kyuubi 定期发布新版本,遵循 Apache 项目规范,由社区投票决定发布。贡献者可通过邮件列表参与讨论和开发,文档中也提供了 IDE 设置和贡献指南。 --- 以上为 Apache Kyuubi 1.7.0-rc0 的核心内容总结,涵盖架构、功能、升级、配置、优化及安全性等方面,便于用户快速了解和使用。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 203 页请下载阅读 -
文档评分
请文明评论,理性发言.