epub文档 Apache Kyuubi 1.8.0-rc0 Documentation

5.28 MB 428 页 0 评论
语言 格式 评分
英语
.epub
3
摘要
文档详细介绍了Apache Kyuubi 1.8.0-rc0的功能和配置,包括组件结构、安装步骤、SQL函数扩展、日志系统配置、会话管理、监控指标、故障排除方法及文档贡献指南。内容涵盖了从安装至发布的全面指南,旨在帮助用户高效使用和管理Kyuubi服务。
AI总结
以下是对《Apache Kyuubi 1.8.0-rc0 Documentation》的简要总结: --- ### 1. **安装与结构** - **安装**: Kyuubi 的安装基于二进制包。解压后的目录结构包括: ``` ├── LICENSE # Apache 许证协议 ├── NOTICE # 项目声明 ├── RELEASE # 包构建信息 ├── bin # Kyuubi 服务器入口(启动脚本) ├── conf # 默认配置文件 ├── externals # 支持的 SQL 引擎 ├── jars # 依赖的 Jar 包 ├── logs # 日志目录 ├── pid # 服务器实例 PID 文件 └── work # 子进程工作目录 ``` - **环境依赖**:需要安装 Spark 最新稳定版本,可从 [Spark 官方下载页面](https://spark.apache.org/downloads.html) 获取。 --- ### 2. **辅助 SQL 函数** Kyuubi 提供多个辅助 SQL 函数,补充了 Spark 和 Flink 的内置函数: - **Spark**: - `kyuubi_version`:返回 Kyuubi 服务器版本(字符串)。 - `engine_name`:返回关联查询的 Spark 应用程序名称(字符串)。 - `engine_id`:返回关联查询的 Spark 应用程序 ID(字符串)。 - `system_user`:返回系统用户名(字符串)。 - `session_user`:返回会话用户名(字符串)。 - `engine_url`:返回引擎 URL(字符串)。 - **Flink**: - `kyuubi_version`:返回 Kyuubi 服务器版本(字符串)。 - `kyuubi_engine_name`:返回关联查询的应用程序名称(字符串)。 - `kyuubi_engine_id`:返回关联查询的应用程序 ID(字符串)。 - `kyuubi_system_user`:返回系统用户名(字符串)。 - `kyuubi_session_user`:返回会话用户名(字符串)。 --- ### 3. **监控与日志** - **日志系统**: Kyuubi 使用 Apache Log4j2(1.5.0 及以上版本)或 Log4j(1.4.1 及以下版本)记录日志,主要包括: - 服务器日志:记录服务器活动,如启动/停止和客户端请求响应。 - 引擎日志:记录 SQL 工作负载相关操作。 - 操作日志:记录操作细节。 - **日志配置**: 默认日志文件名为 `kyuubi-${env:USER}-${env:HOSTNAME}.out`,存储在 `$KYUUBI_HOME/logs` 目录下。可通过 `conf/log4j2.xml` 配置日志输出。 --- ### 4. **配置参数** - **服务器配置**: - `kyuubi.server.limit.connections.user.deny.list`:限制用户连接。 - `kyuubi.server.limit.connections.user.unlimited.list`:配置用户连接白名单。 - `kyuubi.server.name`:服务器名称。 - `kyuubi.server.periodicGC.interval`:周期性垃圾回收间隔。 - `kyuubi.server.redaction.regex`:敏感信息正则表达式。 - **会话配置**: - `kyuubi.session.check.interval`:会话超时检查间隔。 - `kyuubi.session.close.on.disconnect`:客户端断连时是否关闭会话。 - `kyuubi.session.conf.advisor`:会话配置建议插件。 --- ### 5. **优化与功能** - **优化规则**: Kyuubi 提供基于 AQE(自适应查询执行框架)的优化功能: - 自动合并小文件:通过额外的 Shuffle 节点解决小文件问题。 - 优化倾斜连接:在 Join 前添加 Shuffle 节点,确保标准连接。 - 阶段级配置隔离:优化任务数据大小,使分区数据大文件和小文件兼顾。 - **兼容性**:当前支持 Apache Spark 分支 3.1及以上版本。 --- ### 6. **贡献与文档** - **文档贡献**: Kyuubi 的文档与代码基库同步维护,文档源文件位于 `docs` 目录,发布在 [Read The Docs](https://kyuubi.rtfd.io) 平台上。欢迎社区贡献,包括编写、翻译、问题报告等。 - **风格指南**:文档使用 ReStructuredText 和 Markdown 格式,需遵循 Apache 开源项目的风格规范。 --- ### 7. **发布指南** Apache Kyuubi 发布版本的流程包括: 1. 决定发布版本。 2. 准备发布。 3. 切分功能分支。 4. 构建候选版本。 5. 投票确认候选版本。 6. 修复问题(如有)并重复。 7. 最终发布并推广。 8. 清理过时的分发目录。 9. 发布 Docker 镜像。 --- 以上是《Apache Kyuubi 1.8.0-rc0 Documentation》的核心内容总结,涵盖了安装、功能、配置、监控、优化及社区贡献等关键信息。
P1
P2
P3
P4
P5
P6
P7
下载文档到本地,方便使用
- 可预览页数已用完,剩余 421 页请下载阅读 -
文档评分
请文明评论,理性发言.