GPU Resource Management On JDOS
GPU 利用率 – Job 调度 (部门 quota 限制 + 优先级) • 创建训练 – 用户选择集群提供代码地址和执行命令即可 – 选择所用框架(镜像):支持官方,亦可自制 (提供 dockerfile 生成镜像服务) – 选择存储来源:对接了内部的存储 – 填写代码地址,执行的命令等 – 可以选择是否监控训练,提供 tensorboard 任务列表 可以指定 git 的 commit-id commit-id 发起任务 任务详情 可以查看具体的容器列表,以及查看容器的日志和事件 Serving 服务 提供统一便捷的 Serving 服务,只需用户指定模型,即可提供 grpc 和 rest 服务,同时使用 GPU 复用 +HPA 提高 GPU 利用率 创建 Serving 与训练集成 • 用户只需要简单选择机房和 镜像填写模型名即可完成 Serving 服务创建 自有模型0 码力 | 11 页 | 13.40 MB | 1 年前3Kubernetes Operator 实践 - MySQL容器化
有状态服务容器化 1. 背景介绍 2. Operator 的基本原理 3. MySQL Operator 设计实践 4. 小结 无状态服务 服务调度 有状态服务集群 服务调度 状态保存 集群管理 有状态服务 服务调度 状态保存 带来的新挑战 服务调度 状态存储 集群管理 成员管理 扩缩容 故障迁移 高可用 CoreOS 提出了 operator Deployment StatefulSet mysql pod-1 … … mysql pod-N NodeN Mysql Operator pod … … mysql Pod-T 0. 创建 CRD 3. 集群管理 2. 调度 pod Ceph MySQL-Operator 主流程 API Server Reflector DeltaFIFO Local Storage Callbacks OnAdd OnUpdate CRD • Spec:配置 & 期望状态 • Status:当前状态 MySQL 配置 • 版本 • 端口 • 存储信息 • 配置文件 集群配置 • 副本数 • 高可用模式 K8s 调度信息 • 资源套餐 • 亲和性信息 • NodeSelector 使用 CRD 2. client-go 配套工具 apiVersion: apiextensions.k8s.io/v1beta10 码力 | 42 页 | 4.77 MB | 1 年前3MySQL 8.0.17 调优指南(openEuler 20.09)
● 对性能进行分析时,要多方面分析系统的资源瓶颈所在,因为系统某一方面性能 低,也许并不是它自己造成的,而是其他方面造成的。如CPU利用率是100%时, 很可能是内存容量太小,因为CPU忙于处理内存调度。 ● 一次只对影响性能的某方面的一个参数进行调整,多个参数同时调整的话,很难 界定性能的影响是由哪个参数造成的。 ● 由于在进行系统性能分析时,性能分析工具本身会占用一定的系统资源,如CPU 对于不同的IO设备,通过在OS层面调整一些IO相关参数配置,可以有效提升服务器性 能。 方法 Linux参数 参数含义 操作 /sys/block/$ {device}/queue/ scheduler 配置IO调度,deadline或者noop更 适用于MySQL数据库场景。命令中 的${device}为数据盘名称,根据实 际磁盘名称进行修改。NVME盘不 支持此操作。 echo deadline > /sys/0 码力 | 11 页 | 223.31 KB | 1 年前3RocketMQ v3.2.4 开发指南
1G 大小的文件通常耗时小亍 50ms,而 Ext3 文件系统耗时约 1s 左史,丏删除文件时,磁盘 IO 压力极大,会导致 IO 写入超时。 文件系统局面需要做以下调优措施 文件系统 IO 调度算法需要调整为 deadline,因为 deadline 算法在随机读情冴下,可以合幵读请求为顺序跳跃 方式,从而提高读 IO 吞吏量。 Ext4 文件系统有以下 Bug,请注意 http://blog a) 访问 PAGECACHE 时,即使只访问 1k 的消息,系统也会提前预读出更多数据,在下次读时,就可能命 中内存。 b) 随机访问 Commit Log 磁盘数据,系统 IO 调度算法设置为 NOOP 方式,会在一定程度上将完全的随机 读发成顺序跳跃方式,而顺序跳跃方式读较完全的随机读性能会高 5 倍以上,可参见以下针对各种 IO 方式的性能数据。 http://stblog0 码力 | 52 页 | 1.61 MB | 1 年前3清华大学 DeepSeek 从入门到精通
+ 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务 强弱判断 并非全面更强,仅在其训练目标领域显著优于通用模型 通用场景更灵活,但专项任务需依赖提示语补偿能力 • 例如:GPT-3、GPT-4(OpenAI),BERT(Google),主要用于语言生成、语言理解、文本分类、翻译 等任务。 快思慢想:效能兼顾 全局视野 概率预测(快速反应模型,如ChatGPT0 码力 | 103 页 | 5.40 MB | 8 月前3清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
平衡性能:在模型大小和 性能之间取得平衡,适合 中等规模任务。 多模态支持:支持文本和 图像处理,扩展应用场景。 可解释性:注重模型输出 的可解释性和透明性。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 和移动端。 多任务支持:支持多种任务, 如文本生成、分类和问答。 Kimi k1 快速响应:优化推理速度, 适合实时交互场景。 通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 1、阅读网页源代码,提取特定网页内容; 2、撰写python脚本; 3、提取并合并网址; 4、提取网址内容; 5、写入文件。 任务 你需要完成以下两个任务: 1.阅读网页【网址】源代码【对应网页源代码】。提取所 有包含“春运2025丨X月X日,全社会跨区域人员流动量完 取所有需求链接,输出完 整可运行python脚本,代 码运行后生成文件,但数 据采集结果为空。 DeepSeek R1 能够提取所有网址并进行 筛选、去重,所撰写代码 运行后完成数据爬虫任务, 所获取数据准确,少量数 据有所遗漏。 提示词 测试结果受到数据样本、测试环境、AI抽卡、提示词模板等因素影响,仅供参考,无法作为决策制定、质量评估或产品验证的最终依据。 爬虫数据采集0 码力 | 85 页 | 8.31 MB | 7 月前3消息中间件RocketMQ原理解析 - 斩秋
接 口 , 处 理 回 调 , 在 调 endTransactionOneway 向 broker 发送请求更新事物消息的最终状态 无 Prepared 消息,且遍历完,则终止扫描这个文件的定时任务 2.2.5 事物消息的 load&recover TransactionStateService.load ()事物状态服务加载, 加载只是建立文件映射 redoLog 队列恢复,加载本地 变量 构建 offsetStore 消费进度存储对象 启动消费消息服务 向 mqClientFactory 注册本消费者 启动 client 端远程通信 启动定时任务 定时获取 nameserver 地址 定时从 nameserver 获取 topic 路由信息 定时清理下线的 borker 定时向所有 broker entlyServic的submitConsumeRequest方法构建ConsumeRequest 任务提交到线程池。 长轮询向 broker 拉取消息是批量拉取的, 默认设置批量的值为 pullBatchSize = 32, 可配置 消费端 consumer 构建一个消费消息任务 ConsumeRequest 消费一批消息的个数是 可配置的 consumeMessageBatchMaxSize0 码力 | 57 页 | 2.39 MB | 1 年前3Ubuntu 桌面培训 2010
. . 145 IV.III.I OpenOffice.org 电子表格的主要特性 . . . . . . . . . . . . . . . . . 145 IV.III.II 完成基本的制表任务 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146 IV.IV 使用 OpenOffice.org 演示 户可以免费从一个版本 升级到下一个。Microsoft 计划的发布不频繁并且对用户并不完全透明。 安全方面 Ubuntu 很少成为病毒和恶意软件的目标。超级用户 root 默认被锁定,只 有特定的任务可以以超级用户权限运行。而 Microsoft Windows 中用户可以直接使 用超级用户。 图 I.6 Ubuntu 安 全 Ubuntu 介绍 15 Ubuntu 桌面培训 目录 自定义:通过这门课程您很快就会发现, 由自 由软件组成的桌面环境而努力。桌面环境,即图形用户界面,是计算机系统中最外层 的软件。GNOME 项目的目标包括创建软件开发框架,选择桌面应用程序,编写负责 引导应用软件的程序,文件句柄,窗口和任务管理器等。来自世界各地的社区成员 将 GNOME 翻译到各种语言中,让使用不同的语言的人们都能享用 GNOME。(参 考:http://en.wikipedia.org/wiki/GNOME) 260 码力 | 540 页 | 26.26 MB | 1 年前3基于 KUBERNETES 的 容器器 + AI 平台
Kubeflow 社区的联合创始⼈人 • kubeflow/tf-operator • 定义 TFJob Spec (CRD) • 跟踪 TensorFlow 任务运⾏行行状态 • ⽀支持分布式 TensorFlow 任务 KUBEFLOW 之上 • 借⼒力力容器器平台提供⽣生产级的集群资源管理理 • ⼯工作区隔离与共享 • 数据、模型、环境、应⽤用等 • 全⾯面⽀支持 AI0 码力 | 19 页 | 3.55 MB | 1 年前3JavaScript 正则表达式迷你书 老姚 - v1.1
情,还是做不到的。 比如匹配这样的字符串:1010010001…。 虽然很有规律,但是只靠正则就是无能为力。 6.2.2. 是否有必要使用正则? 要认识到正则的局限,不要去研究根本无法完成的任务。同时,也不能走入另一个极端:无所不用正则。能 用字符串 API 解决的简单问题,就不该正则出马。 比如,从日期中提取出年月日,虽然可以使用正则: JavaScript 正则表达式迷你书 60 码力 | 89 页 | 3.42 MB | 10 月前3
共 11 条
- 1
- 2