搜索

epub文档 Apache Kyuubi 1.4.1 Documentation

4.62 MB 233 页 0 下载 134 浏览 0 评论 0 收藏
语言 格式 评分
英语
.epub
3
摘要
Apache Kyuubi 是一个基于 Apache Spark 的统一多租户 JDBC 接口,支持大规模数据处理和分析。它提供多租户支持,包括多客户端并发和基于队列的访问控制列表(ACL),允许用户通过多种工具(如 Hive Beeline、DBeaver、HUE 等)并发操作。Kyuubi 支持多种集群管理器(如 YARN、Kubernetes 等),并提供高性能和高可用性。文档还介绍了如何构建、安装和使用 Kyuubi,以及与其他工具和数据源的集成。
AI总结
Apache Kyuubi 是一个基于 Apache Spark 的统一多租户 JDBC 接口,支持大规模数据处理和分析。以下是文档的核心内容总结: ### 核心功能与特点 1. **多租户支持** - 支持端到端多租户,每个用户账号对应一个 Spark 应用(SPA),确保资源和数据的隔离性。 - 提供基于 QUEUE/NAMESPACE 的访问控制列表(ACL)和元数据访问控制,保障数据安全。 2. **统一接口** - 提供单一 SQL 接口,支持通过多种客户端工具(如 Hive Beeline、HUE、DBeaver 等)同时操作 Kyuubi 服务。 3. **高性能** - 基于 Apache Spark 的高性能计算引擎,支持快速的数据处理和分析。 4. **灵活性与扩展性** - 支持将 Spark 应用提交到多种集群管理器(如 YARN、Kubernetes、Mesos 等)。 - 支持与多种数据源(如 Delta Lake、Apache Hudi、Apache Iceberg 等)集成。 ### 架构与设计理念 - **服务端与引擎的耦合架构**:提升服务的并发能力和稳定性。 - **分层架构**:各层 loosely coupled,便于扩展和维护。 ### 快速入门 1. **安装** - 通过解压 tarball 安装 Kyuubi,无需复杂配置。 2. **运行** - 支持在本地、YARN、Kubernetes 等环境中运行。 3. **使用** - 支持通过 JDBC、ODBC 等接口与 Kyuubi 交互,可配合多种工具(如 DBeaver、DataGrip、HUE 等)使用。 ### 开发与贡献 - **开发工具** - 提供 Maven 项目构建、文档生成、测试运行、调试等工具。 - **贡献指南** - 代码遵循 Apache License 2.0,支持通过 Pull Request 提交代码和文档改进。 - 参与贡献前需熟悉项目架构和代码规范。 ### 附录 - **术语解释** - 包括 JDBC、Server、Engine、多租户、高可用性等核心概念。 - **数据湖与湖仓** - 支持 Apache Iceberg、Delta Lake、Apache Hudi 等数据湖技术。 总结:Apache Kyuubi 提供了一个统一的 SQL 接口,支持多租户、高并发、高性能的数据处理和分析,适用于复杂的数据湖和湖仓架构,同时支持多种集群管理和工具集成。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 226 页请下载阅读 -
文档评分
请文明评论,理性发言.