Apache Kyuubi 1.9.0-SNAPSHOT Documentation
3.93 MB
220 页
0 评论
语言 | 格式 | 评分 |
---|---|---|
英语 | .pdf | 3 |
摘要 | ||
Apache Kyuubi是一个分布式和多租户的网关,支持在数据仓库和湖仓上提供无服务器SQL服务。它构建在多种现代计算框架(如Spark、Flink、Doris等)之上,以查询分布式数据集。Kyuubi通过隐藏技术细节,简化了用户对数据处理和分析的操作,支持ETL和OLAP工作loads。其架构分为多层,支持组件松耦合,方便构建现代数据栈。Kyuubi Server处理客户端连接和执行请求,支持会话管理,包括轻量级和重量级会话创建。系统还提供了多种客户端接口,如JDBC、ODBC和RESTful API,确保数据和集群的安全性。 | ||
AI总结 | ||
以下是对《Apache Kyuubi 1.9.0-SNAPSHOT Documentation》的中文总结,重点突出核心观点和关键信息:
---
### 文档概述
Apache Kyuubi™ 是一个分布式和多租户的网关,提供无服务器(Serverless)SQL 功能,支持在数据仓库和数据湖上执行查询。它构建在多种现代计算框架之上,如 Apache Spark、Flink、Doris、Hive、Trino 和 StarRocks 等,能够从异构数据源的分布式集群中查询大规模数据集。
Kyuubi 隐藏了底层计算和存储的技术细节,使用户能够专注于业务逻辑。它为管理员提供了升级组件、优化工作负载、安全认证和审计等功能,同时支持零停机时间维护。
Kyuubi 的生态系统分为多层次,层与层之间松耦合,灵活组合,便于构建现代数据栈。例如,结合 Kyuubi、Spark 和 Iceberg,可以通过纯 SQL 实现数据湖仓(Data Lakehouse)的数据处理(如 ETL)和在线分析处理(OLAP),数据仅存储一份,使用统一的 SQL 接口完成所有工作负载。
---
### 快速入门
1. **部署环境**:
- 启动 Spark Standalone 集群:
```bash
./spark/sbin/start-master.sh -h |
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余
213 页请下载阅读 -
文档评分