| 语言 | 格式 | 评分 |
|---|---|---|
英语 | .epub | 3 |
| 摘要 | ||
Apache Kyuubi 是一个基于 Apache Spark 的统一多租户 JDBC 接口,支持大规模数据处理和分析。它提供多租户支持,包括多客户端并发和基于队列的访问控制列表(ACL),允许用户通过多种工具(如 Hive Beeline、DBeaver、HUE 等)并发操作。Kyuubi 支持多种集群管理器(如 YARN、Kubernetes 等),并提供高性能和高可用性。文档还介绍了如何构建、安装和使用 Kyuubi,以及与其他工具和数据源的集成。 | ||
| AI总结 | ||
Apache Kyuubi 是一个基于 Apache Spark 的统一多租户 JDBC 接口,支持大规模数据处理和分析。以下是文档的核心内容总结:
### 核心功能与特点
1. **多租户支持**
- 支持端到端多租户,每个用户账号对应一个 Spark 应用(SPA),确保资源和数据的隔离性。
- 提供基于 QUEUE/NAMESPACE 的访问控制列表(ACL)和元数据访问控制,保障数据安全。
2. **统一接口**
- 提供单一 SQL 接口,支持通过多种客户端工具(如 Hive Beeline、HUE、DBeaver 等)同时操作 Kyuubi 服务。
3. **高性能**
- 基于 Apache Spark 的高性能计算引擎,支持快速的数据处理和分析。
4. **灵活性与扩展性**
- 支持将 Spark 应用提交到多种集群管理器(如 YARN、Kubernetes、Mesos 等)。
- 支持与多种数据源(如 Delta Lake、Apache Hudi、Apache Iceberg 等)集成。
### 架构与设计理念
- **服务端与引擎的耦合架构**:提升服务的并发能力和稳定性。
- **分层架构**:各层 loosely coupled,便于扩展和维护。
### 快速入门
1. **安装**
- 通过解压 tarball 安装 Kyuubi,无需复杂配置。
2. **运行**
- 支持在本地、YARN、Kubernetes 等环境中运行。
3. **使用**
- 支持通过 JDBC、ODBC 等接口与 Kyuubi 交互,可配合多种工具(如 DBeaver、DataGrip、HUE 等)使用。
### 开发与贡献
- **开发工具**
- 提供 Maven 项目构建、文档生成、测试运行、调试等工具。
- **贡献指南**
- 代码遵循 Apache License 2.0,支持通过 Pull Request 提交代码和文档改进。
- 参与贡献前需熟悉项目架构和代码规范。
### 附录
- **术语解释**
- 包括 JDBC、Server、Engine、多租户、高可用性等核心概念。
- **数据湖与湖仓**
- 支持 Apache Iceberg、Delta Lake、Apache Hudi 等数据湖技术。
总结:Apache Kyuubi 提供了一个统一的 SQL 接口,支持多租户、高并发、高性能的数据处理和分析,适用于复杂的数据湖和湖仓架构,同时支持多种集群管理和工具集成。 | ||
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余
226 页请下载阅读 -
文档评分














Apache Kyuubi 1.4.1 Documentation
Apache Kyuubi 1.6.1 Documentation