GPU Resource Management On JDOSGPU Resource Management On JDOS 梁永清 liangyongqing1@jd.com 提供的服务 1. 用于实验的 GPU 容器 2.基于 Kubeflow 的机器学习训练服务 3.模型管理和模型 Serving 服务 Experiment Training Serving 均基于容器,不对业务方直接提供 GPU 物理机 GPU 实验 JDOS 常规的容器服务0 码力 | 11 页 | 13.40 MB | 1 年前3
OpenShift Container Platform 4.14 OperatorContainer Platform 4.14 Operator 在 OpenShift Container Platform 中使用 Operator Last Updated: 2024-02-23 OpenShift Container Platform 4.14 Operator 在 OpenShift Container Platform 中使用 Operator 法律通告 法律通告 Copyright 本文档提供有关在 OpenShift Container Platform 中使用 Operator 的信息。文中为集群管理员提供 了 Operator 的安装和管理说明,为开发人员提供了如何通过所安装的 Operator 创建应用程序的信 息。另外还提供了一些使用 Operator SDK 构建自用 Operator 的指南。 . . . . . . . . . . . . . . . . . 目录 录 第 第 1 章 章 OPERATOR 概述 概述 1.1. 对于开发人员 1.2. 对于管理员 1.3. 后续步骤 第 第 2 章 章 了解 了解 OPERATOR 2.1. 什么是 OPERATOR? 2.2. OPERATOR FRAMEWORK 打包格式 2.3. OPERATOR FRAMEWORK 常用术语表 2.4. OPERATOR LIFECYCLE MANAGER0 码力 | 423 页 | 4.26 MB | 1 年前3
Node Operator: Kubernetes Node Management Made SimpleNode Operator: Kubernetes Node Management Made Simple 陈俊(Joe), Ant Financial Agenda • Background and Motivation • Introduction of Operators • Node-Operator • Advanced Topic: Topic: Kube-on-Kube-Operator • Achievement • Q&A Background: DC/OS From Sigma 2.0(Swarm) to Sigma 3.1(Kubernetes) Background: Cluster Scale • Production environment: • Dozens of Cluster • 5k+ Nodes / Cluster deployment system can not meet the requirements of resource management. Operator Observe Action Analyze • Observe: watch desired resource and actual resource • Analyze: difference from desired and actual0 码力 | 18 页 | 11.70 MB | 1 年前3
Operator Pattern 用 Go 扩展 Kubernetes 的最佳实践Operator Pattern:用 Go 扩展 K8s 的最佳实践 吴学强 ApeCloud KubeBlocks Maintainer & 研发总监 目 录 认识我们 00 什么是 Operator 01 Operator 基础模型 02 Operator 最佳实践 03 我们是谁 云猿生(ApeCloud)是一家提供数据库内核与管理平台的基 础软件开发商. KubeBlocks 从被收购到卷王(si) 回到初(qi)心(dian) KubeBlocks Maintainer & 研发总监 free6om 什么是 Operator 第一部分 Operator 前世今生 TPR Operator CRD Operator Pattern 2015.11 2016.12 2017.12 Now K8s 1.1 版本中正式推出 TPR (ThirdPartyResource),首次尝 K8s API 的扩展性问题, 但存在诸多问题,Alpha 阶段既 夭折 CoreOS 提出 Operator 概念,用 于管理和运行基于应用程序领 域的复杂有状态应用程序。 给出了用 TPR + controller- runtime 早期版本的 sample: etcd operator K8s 1.9 版本发布,CRD进入 beta 阶段并正式取代 TPR; controller-runtime0 码力 | 21 页 | 3.06 MB | 9 月前3
Streaming languages and operator semantics - CS 591 K1: Data Stream Processing and Analytics Spring 2020CS 591 K1: Data Stream Processing and Analytics Spring 2020 2/04: Streaming languages and operator semantics Vasiliki Kalavri | Boston University 2020 Vasiliki Kalavri | Boston University 2020 Kalavri | Boston University 2020 Streaming Operators 9 Vasiliki Kalavri | Boston University 2020 Operator types (I) • Single-Item Operators process stream elements one-by-one. • selection, filtering Consider events from stream S1 and stream S2 11 Vasiliki Kalavri | Boston University 2020 Operator types (II) • Sequence Operators capture the arrival of an ordered set of events. • common in0 码力 | 53 页 | 532.37 KB | 1 年前3
OpenShift Container Platform 4.10 构建应用程序2.2. 以其他用户身份创建项目 2.3. 配置项目创建 第 第 3 章 章 创 创建 建应 应用程序 用程序 3.1. 使用 DEVELOPER 视角创建应用程序 3.2. 从已安装的 OPERATOR 创建应用程序 3.3. 使用 CLI 创建应用程序 第 第 4 章 章 使用 使用 TOPOLOGY 视图查 视图查看 看应 应用程序 用程序组 组成情况 成情况 4.1. 先决条件 4 第 第 6 章 章 将 将应 应用程序 用程序连 连接到服 接到服务 务 6.1. SERVICE BINDING OPERATOR 发行注记 6.2. 了解 SERVICE BINDING OPERATOR 6.3. 安装 SERVICE BINDING OPERATOR 6.4. 服务绑定入门 6.5. 在 IBM POWER SYSTEMS、IBM Z 和 LINUXONE 上使用服务绑定 上使用服务绑定 6.6. 从服务公开绑定数据 6.7. 投射绑定数据 6.8. 使用 SERVICE BINDING OPERATOR 绑定工作负载 6.9. 使用 DEVELOPER 视角将应用程序连接到服务 第 第 7 章 章 使用 使用 HELM CHART 7.1. 了解 HELM 7.2. 安装 HELM 7.3. 配置自定义 HELM CHART 仓库 7.4. 使用 HELM 发行版本0 码力 | 198 页 | 3.62 MB | 1 年前3
OpenShift Container Platform 4.9 构建应用程序2.2. 以其他用户身份创建项目 2.3. 配置项目创建 第 第 3 章 章 创 创建 建应 应用程序 用程序 3.1. 使用 DEVELOPER 视角创建应用程序 3.2. 从已安装的 OPERATOR 创建应用程序 3.3. 使用 CLI 创建应用程序 第 第 4 章 章 使用 使用 TOPOLOGY 视图查 视图查看 看应 应用程序 用程序组 组成情况 成情况 4.1. 先决条件 4 第 第 5 章 章 将 将应 应用程序 用程序连 连接到服 接到服务 务 5.1. SERVICE BINDING OPERATOR 发行注记 5.2. 了解 SERVICE BINDING OPERATOR 5.3. 安装 SERVICE BINDING OPERATOR 5.4. 服务绑定入门 5.5. 在 IBM POWER SYSTEMS、IBM Z 和 LINUXONE 上使用服务绑定 上使用服务绑定 5.6. 从服务公开绑定数据 5.7. 投射绑定数据 5.8. 使用 SERVICE BINDING OPERATOR 绑定工作负载 5.9. 使用 DEVELOPER 视角将应用程序连接到服务 第 第 6 章 章 使用 使用 HELM CHART 6.1. 了解 HELM 6.2. 安装 HELM 6.3. 配置自定义 HELM CHART 仓库 6.4. 使用 HELM 发行版本0 码力 | 184 页 | 3.36 MB | 1 年前3
OpenShift Container Platform 4.9 节点自动扩展自动调整 POD 资源级别 2.5.1. 关于 Vertical Pod Autoscaler Operator 2.5.2. 安装 Vertical Pod Autoscaler Operator 2.5.3. 关于使用 Vertical Pod Autoscaler Operator 2.5.3.1. 更改 VPA 最小值 2.5.3.2. 自动应用 VPA 建议 2.5.3.3. 手动应用 VPA 建议 2.5.3.5. 阻止容器特定容器应用 VPA 建议 2.5.4. 使用 Vertical Pod Autoscaler Operator 2.5.5. 卸载 Vertical Pod Autoscaler Operator 2.6. 为 POD 提供敏感数据 2.6.1. 了解 secret 2.6.1.1. secret 的类型 9 9 9 10 10 10 使用 NODE TUNING OPERATOR 5.5.1. 访问 Node Tuning Operator 示例规格 5.5.2. 自定义调整规格 5.5.3. 在集群中设置默认配置集 5.5.4. 支持的 TuneD 守护进程插件 5.6. 使用 POISON PILL OPERATOR 修复节点 5.6.1. 关于 Poison Pill Operator 144 144 144 1470 码力 | 374 页 | 3.80 MB | 1 年前3
OpenShift Container Platform 4.6 节点自动扩展自动调整 POD 资源级别 2.5.1. 关于 Vertical Pod Autoscaler Operator 2.5.2. 安装 Vertical Pod Autoscaler Operator 2.5.3. 关于使用 Vertical Pod Autoscaler Operator 2.5.3.1. 自动应用 VPA 建议 2.5.3.2. 在创建 pod 时自动应用 VPA 建议 手动应用 VPA 建议 2.5.3.4. 阻止容器特定容器应用 VPA 建议 2.5.4. 使用 Vertical Pod Autoscaler Operator 2.5.5. 卸载 Vertical Pod Autoscaler Operator 2.6. 为 POD 提供敏感数据 2.6.1. 了解 secret 2.6.1.1. secret 的类型 2.6.1.2. Secret 5.3.1. 修改节点 5.4. 管理每个节点的 POD 数量上限 5.4.1. 配置每个节点的最大 pod 数量 5.5. 使用 NODE TUNING OPERATOR 5.5.1. 访问 Node Tuning Operator 示例规格 5.5.2. 自定义调整规格 5.5.3. 在集群中设置默认配置集 5.5.4. 支持的 Tuned 守护进程插件 5.6. 了解节点重新引导0 码力 | 404 页 | 3.60 MB | 1 年前3
OpenShift Container Platform 4.10 专用硬件和驱动程序启用章 特殊 特殊资 资源 源 OPERATOR 3.1. 关于特殊资源 OPERATOR 3.2. 安装特殊资源 OPERATOR 3.3. 使用特殊资源 OPERATOR 3.4. PROMETHEUS SPECIAL RESOURCE OPERATOR 指标 3.5. 其他资源 第 第 4 章 章 NODE FEATURE DISCOVERY OPERATOR 4.1. 关于 NODE NODE FEATURE DISCOVERY OPERATOR 4.2. 安装 NODE FEATURE DISCOVERY OPERATOR 4.3. 使用 NODE FEATURE DISCOVERY OPERATOR 4.4. 配置 NODE FEATURE DISCOVERY OPERATOR 4.5. 使用 NFD TOPOLOGY UPDATER 3 4 4 5 6 9 10 10 Container Platform 上构建的驱动程序容器镜像的基础镜像。 特殊资源 Operator (SRO) 编配驱动程序容器的构建和管理,以便在现有 OpenShift 或 Kubernetes 集群上加载内核模块和驱动程序。 Node Feature Discovery (NFD) Operator 为 CPU 功能、内核版本、PCIe 设备供应商 ID 等添加 节点标签。 第 第 10 码力 | 36 页 | 360.64 KB | 1 年前3
共 421 条
- 1
- 2
- 3
- 4
- 5
- 6
- 43













