openEuler 23.09 技术白皮书限为 CPU 的 DRAM 容量)。GMEM 将较冷的设备内存页换出到 CPU 内存上,拓展了应用处理的问题规模,实现高性能、低门槛训推。 通过 GMEM 提供的极简异构内存管理框架,在超大模型训练中,GMEM 性能领先 NVIDIA-UVM。随着内存使用量增长,领 先比例不断提升,在超分两倍以上时可领先 NVIDIA-UVM 60% 以上。(数据基于 NPU-Ascend910 与 GPU-A100 可将待访问内存在主 机与加速器进行搬移。在实际使用时,加速器可在内存不足时可以借用主机内存,同时回收加速器内的冷内存,达到内存 超分的效果,突破模型参数受限于加速器内存的限制,实现低成本的大模型训练。 通过在内核中提供 GMEM 高层 API,允许加速器驱动通过注册 GMEM 规范所定义的 MMU 函数直接获取内存管理功能, 建立逻辑页表并进行内存超分。逻辑页表将内存管理的高层逻辑与 CPU 内存交换和内存预取等模块,由独立驱动 remote_pager.ko 使能。通过 Remote Pager 抽象层可以让第三方加速器很容易 的接入 GMEM 系统,简化设备适配难度。 用户 API 用户可以直接使用OS的mmap分配统一虚拟内存,GMEM在mmap系统调用中新增分配统一虚拟内存的标志(MMAP_ PEER_SHARED)。 同时 libgmem 用户态库提供了内存预取语义 hmadvise0 码力 | 52 页 | 5.25 MB | 1 年前3
openEuler 22.03 LTS SP2 技术白皮书利用率。高优先级 虚拟机业务推荐:时延敏感类业务,如 web 服务、高性能数据库、实时渲染、机器学习推理等。低优先级虚拟机业务推荐: 非时延敏感类业务,如视频编码、大数据处理、离线渲染、机器学习训练等。 应用场景 版本功能如下: • 集群调度增强:增强 OpenStack Nova 能力,支持优先级语义调度。 • 功耗控制:通过对低优先级虚拟机的 CPU 带宽进行限制,以此达到降低整机功耗的同时保障高优先级虚拟机 机密计算厂商纷纷推出远程证明技术,可以让租户随时检测云上可信执行环境及应用的可信状态,彻底打消租户的顾虑。 远程证明是一种动态度量技术,可以对可信执行环境和运行在环境里的应用进行实时度量,生成证明报告,并使用预 置根密钥签名,防止证明报告被篡改或伪造。 secGear 远程证明基于各厂商 SDK 远程证明能力,封装统一远程证明接口,当前仅支持鲲鹏平台,其中 secGear 依赖 kunpengsecl0 码力 | 48 页 | 5.62 MB | 1 年前3
鸟哥的Linux私房菜:服务器架设篇 第三版很多朋友因为自身或服务单位的需求,总是有架设各种网络服务器的时刻,这个时候大多数的前辈都会推荐他们使用 Linux 做为服务器架设的操作系统。但因为这些朋友很多都没有受过 Linux 操作系统操作方面的训练,因此总觉得 反正都是操作系统,所以 Linux 应该也跟 Windows 差不多吧!那么就硬着头皮使用图形接口去设定好众多的服务 器,也有可能参考网络上一些文章, 即使是透过文字接口去设定,也 这样是不是很好呢? Linux 不是很好学,根据鸟哥过去教学的经验,很多同学在学 Linux 时真是非常的痛苦,不过学完之后, 以前在 Windows 上面遇到的困难却也自然而然的迎刃而解!因为 Linux 训练我们时,是要我们去解决一个发现的问题, 这过程需要很多基础知识的培养,所以学完他之后,你会觉得很多事情都变的很简单而单纯。但如果使用 Windows 的懒人方案,很多问题就不可能了解为啥会发生与 程序的读我档 (READ ME) 或相关档案来安装才行。 此外,如果默认驱动程序已经捉到了网络卡,鸟哥是建议使用预设的驱动程序就好了喔! 另外,由于编译程序需要编译程序以及核心相关信息,因此得要预安装 gcc, make, kernel-header 等软件才 行。 但是我们选择的安装模式为『basic server』,这些软件默认都没有安装的,所以你得要先安装这些软件才 行。 这些软件可以简单的透过0 码力 | 795 页 | 17.63 MB | 1 年前3
Debian 参考手册(版本 2.109)息的系 统工具,如 ps(),可以从这个目录结构获得信息。 ”/proc/sys” 之下的目录,包含了可以更改某些内核运行参数的接口。(你也可以使用专门的 sysctl() 命令修改, 或者使用其预加载/配置文件”/etc/sysctl.conf”。) 当人们看到这个特别大的文件”/proc/kcore” 时,常常会惊慌失措。这个文件于你的的电脑内存大小相差不多。它 被用来调试内核。它是一个虚 意思是空或字符”4” ,这样可以让 grep 既找到”exim” 也找到”exim4”。虽然”*” 可以用于命令名 称匹配和正则表达式中,但是它们的含义是不一样的。欲详细了解正则表达式可以参考 grep(1)。 作为训练,请使用上述的命令来遍历目录并探究系统。如果你有任何有关控制台命令的问题,请务必阅读手册。 尝试下列例子 $ man man $ man bash $ man builtins $ man grep 系统通过其控制文件字段中的版本化二进制依赖声明机制来提供一致的二进制软件包集合。下面有一些它们的 简单定义。 •“依赖” – 绝对的依赖,所有在这里列出的软件包都必须同时或提前安装。 • ” 预依赖” – 类似于 Depends,但列出的软件包必须提前完成安装。 • ” 推荐” – 这里表示一个强,但不是绝对的依赖关系。大多数用户不会想要这个包,除非在这里列出的所有包都已经安装。 •0 码力 | 261 页 | 1.39 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践单维时间序列分析 有监督异常检测算法 (RF,GBDT,XGBoost,深度学习) 数据层 数据存储 数据提取 统计算法 输出疑似异常 无监督算法 输出疑似异常 有监督算法 特征工程 离线训练 实时计算 人工标注 提升效果 单维时间序列分析 时间序列异常检测整体流程 单维时间序列分析 打标工程 单维时间序列分析 异常检测:提供率值检测和量值检测的接口; 特征提取:提供三 200,可以自定义特征; 异常查询:异常入库存储,提供管理,查询,检索,放缩功能; 人工标注:提供正负样本的标注工具; 样本管理:提供检索,图示,编辑,删除,导入等功能; 模型管理:提供模型训练,预测功能。 腾讯 Metis 智能监控的功能特性(http://github.com/Tencent/Metis) 腾讯 Metis 智能监控的页面 单维时间序列分析 01 智能运维场景描述0 码力 | 28 页 | 1.88 MB | 1 年前3
鸟哥的Linux 私房菜长 很长!而用惯了 Windows 的人可能会受不了,因为文件名称通常真的都很长,对于用惯 Windows 而导致打字速度不快的朋友来说,嗯!真的是很困扰.....不过,只得劝您好好的加强打 字的训练啰!当然啦,如果您已经读完了本书第三篇关于 BASH 的用法,那么您将会发现『哇! 变量真是一个相当好用的东西吶!』嗯!看不懂,没关系,到第三篇谈到 bash 再说! Linux 目录配置: 在 且将所有的剩余空间都拨给 Extended 才行( 记得呦! Extended 最多只能有一个 ),否则只要 3P + E 之后 还有剩下的空间,那么那些容量将成为废物而浪费了,所以结论就是『如果您要分割硬 碟时,并且已经预 计规划使用掉 MBR 所提供的 4 个 partition ( 3P + E 或 4P )那么磁盘的全部容量需要使用光,否则剩下 的容量也不能再被使用』。不过,如果您仅是分割出 1P + 1E 的话,那么剩下的空间就还能再分割两个 功能): 使用 bash 里头,个人认为相当棒的一个功能就是『他能记忆使用过的指令!』这功能真的相当 的棒!因为我只要在指令列按『上下键』就可以找到前一个输入的指令!而在 Mandrake 9.0 预 设的指令记忆功能可以到达 1000 个!也就是说,你曾经下达过的指令都被记录下来了,记录的 档案在你的家目录内的 .bash_history !不过,需要留意的是, ~/.bash_history0 码力 | 386 页 | 11.69 MB | 1 年前3
openEuler 21.09 技术白皮书时,优先对低优先级的进程组进行内存回收,保障在线业务的正常运行。 应用场景 适用于对交互类等时延敏感型业务(比如 MySQL、Redis、Nginx 等)和 CPU 消耗且时延不敏感的业务(如 AI 离线训练) 混合部署,包括容器与容器、容器与进程、容器与虚机、虚机与虚机混合部署等多种场景。 容器操作系统 云原生是云计算发展的下一跳、k8s 事实上已经成为云原生软件基础设施的底座。业界主流操作系统厂商都推出了针对 边云智能协同架构(Sedna):基于开源 sedna 框架,提供基础的边云协同推理、联邦学习、增量学习等能力, 并实现了基础的模型管理、数据集管理等,使能开发者快速开发边云 AI 协同特性,以及提升用户边云 AI 特性的 训练与部署效率。 应用场景 可应用智能制造、城市交通、高速收费稽查、智慧加油站、医疗影像识别、智慧园区等广泛的边云协同场景。 openEuler 21.09 技术白皮书 19 嵌入式 在中国制造0 码力 | 35 页 | 3.72 MB | 1 年前3
openEuler 22.03-LTS 技术白皮书边云智能协同架构(Sedna):基于开源 Sedna 框架,提供基础的边云协同推理、联邦学习、增量学习等能力,并 实现了基础的模型管理、数据集管理等,使能开发者快速开发边云 AI 协同特性,以及提升用户边云 AI 特性的训练 与部署效率。 应用场景 可应用智能制造、城市交通、高速收费稽查、智慧加油站、医疗影像识别、智慧园区等广泛的边云协同场景。 openEuler 22.03-LTS 技术白皮书 13 openEuler 时,优先对低优先级的进程组进行内存回收,保障在线业务的正常运行。 应用场景 适用于对交互类等时延敏感型业务(比如 MySQL、Redis、Nginx 等)和 CPU 消耗且时延不敏感业务(如 AI 离线训练) 的容器混合部署。 容器操作系统 云原生是云计算发展的下一跳、K8s 事实上已经成为云原生软件基础设施的底座。业界主流操作系统厂商都推出了针 对云原生场景的 OS,如 Rehat RCHOS、AWS0 码力 | 17 页 | 6.52 MB | 1 年前3
openEuler 21.03 技术白皮书据,而且每个公司的数据只能自己公司可以访问,有一种情景, 三家公司的数据进行合并通过 AI 训练进行运算,如何避免数据 的泄露? 这三家公司可以通过机密计算技术,将数据通过加密的通道传输给对方的可信执行环境,通过远程证明的方式保证可信 执行环境及运行的代码可信,保障各家公司共享数据做 AI 训练而不泄露各自的数据。 应用场景 2:密钥管理服务 目前公有云的密钥管理服务,一般会基于硬件 HSM0 码力 | 18 页 | 1.30 MB | 1 年前3
openEuler 24.03 LTS 技术白皮书CANN 或 NVIDIA CUDA 等应用的开发和调试。同时, 可在该类容器中运行高性能计算任务,例如大规模数据处理、并行计算等。 • AI 框架镜像:用户可直接在该类容器中进行 AI 模型开发、训练及推理等任务。 • 模型应用镜像:已预置完整的 AI 软件栈和特定的模型,用户可根据自身需求选择相应的模型应用镜像来开展模型推理或微调 任务。 应用场景 场景创新 12 openEuler 智能问答服务使用指南。 EulerCopilot- 智能问答 功能描述 应用场景 当前,openEuler 和 AI 深度结合,一方面使用基础大模型,基于大量 openEuler 操作系统的代码和数据,训练出 EulerCopilot, 初步实现代码辅助生成、智能问题智能分析、系统辅助运维等功能,让 openEuler 更智能。 AI for OS 场景创新 13 openEuler 24.030 码力 | 45 页 | 6.18 MB | 1 年前3
共 49 条
- 1
- 2
- 3
- 4
- 5













