搜索

pdf文档 Apache Kyuubi 1.7.3 Documentation

3.79 MB 211 页 0 下载 125 浏览 0 评论 0 收藏
语言 格式 评分
英语
.pdf
3
摘要
Apache Kyuubi 1.7.3是一个统一的多租户JDBC网关,用于大规模数据处理和分析,基于Apache Spark构建。文档介绍了其管理指南,包括统一网关的API、多租户和高可用特性,以及无服务器SQL功能。Kyuubi通过将查询编译和优化放在引擎侧而非服务器侧,提高了客户端并发性和服务稳定性。其松耦合架构将服务器与引擎分离,降低了GC问题和OOM风险。文档还涵盖了构建指南、发布流程、术语解释以及Spark SQL扩展功能,如自动合并小文件、优化倾斜连接和阶段级配置隔离。
AI总结
Kyuubi 1.7.3 是一个统一的、多租户的 JDBC 网关,构建于 Apache Spark 之上,旨在提供无服务器 SQL 服务,支持数据仓库和湖仓一体。 **核心架构与优势** - **统一网关**:提供 JDBC 接口,支持多租户和高可用性。服务器端与引擎端分离,服务器启动时轻量,易于水平扩展。 - **高并发与稳定性**:查询的编译和优化在引擎端完成,减轻了服务器负载,提升了客户端并发能力。由于服务器与引擎分离,避免了 Spark ThriftServer 中因并发和任务调度竞争导致的 GC 问题和 OOM 风险。无效的 UDF 仅影响单个用户引擎,不影响服务器或其他用户。 - **易用性与高性能**:支持在任意规模下运行。通过自适应查询执行(AQE)框架,提供自动合并小文件、在 Join 前插入 Shuffle 以优化倾斜连接、以及阶段级配置隔离等优化功能。 **主要功能与组件** - **支持的引擎**:可集成 Apache Spark、Flink、Doris、Hive、Trino 等多种计算框架。 - **扩展与连接器**:提供 Spark SQL 扩展(如支持 Z-order 优化)和多种连接器。 - **安全与监控**:包含安全概览、监控和工具模块。 **开发与发布** - **构建**:基于 Apache Maven,命令为 `./build/mvn clean package -DskipTests`。 - **发布流程**:包括决定发布、准备、创建分支、构建候选版本、社区投票、最终确定、推广发布、移除废弃候选版本目录以及发布 Docker 镜像。 **关键术语** - **Kyuubi**:统一的多租户 JDBC 接口。 - **Server**:处理并发连接和查询请求的守护进程。 - **ServerSpace**:用于注册服务器并将其作为服务层暴露给客户端。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 204 页请下载阅读 -
文档评分
请文明评论,理性发言.