高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏管控接入 配置平台 作业平台 容器平台 数据平台 故障机替换 新版本发布 基础监控系统 扩容管理系统 …… 服务组件A 服务组件B 服务组件C 服务组件D iPaaS:API Gateway(统一接入) aPaaS(集成平台):开发框架(前后端)+工具流水线+运行环境托管 蓝鲸进化第3步:平台化开发模式让运维应用自生长 传统开发模式 应用需求 公共 组件 环境 构建 资源 准备 调度引擎 容器管理 文件传输 指令执行 编译构建 开发测试服 更新 DevOps系统 实时计算 离线计算 数据采集 实时视图 交叉分析 数据分析 调度引擎 容器管理 文件传输 指令执行 预发布环境 更新 生产环境 发布 发布系统 实时计算 离线计算 数据采集 数据存储 监控曲线 展示 智能告警 监控系统 Jenkins 版本仓库 报表编辑器 BI引擎 版本管理 配置存取 iPaaS+aPaaS 统一DevOps 统一监控&自愈自动化 统一配置管理 运维自动化 嘉为蓝鲸研发、部署、运营自动化场景 ITSM流程管理 数据分析与运营决策 嘉为蓝鲸研发、部署、运营一体化平台 CD(持续部署) 管控平台 配置平台 作业平台 容器平台 CI(持续集成) 持续集成平台 代码检查平台 CO(持续运营) 数据平台 挖掘平台 嘉为蓝鲸研发、部署、运营统一门户 统一运维 统一运营 统一研发0 码力 | 26 页 | 8.25 MB | 1 年前3
 openEuler 23.09 技术白皮书全场景 支持。增强服务器和云计算的特性,发布面向云原生的业务混部 CPU 调度算法、容器化操作系统 KubeOS 等关键技术; 同时发布边缘和嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler 22.03 LTS 版本,聚焦算力释放,持续提升资源利用率,打造全场景协同的数字基础设施操作系统。 2022 发展新趋势,创新分布式、实时加速引擎和基础服务,结合边缘、嵌入式领域竞争力探索,打造全场景协同的面向数字基 础设施的开源操作系统。 openEuler 23.09 发布面向服务器、云原生、边缘和嵌入式场景的全场景操作系统版本,统一基于 Linux Kernel 6.4 构 建,对外接口遵循 POSIX 标准,具备天然协同基础。同时 openEuler 23.09 版本集成分布式软总线、KubeEdge+ 边云协 同框架等 社区反弹,最终导致 HMM 方 案搁浅。异构加速器领域亟需高效的统一内存管理机制。 异构通用内存管理框架 GMEM (Generalized Memory Management),提供了异构内存互联的中心化管理机制,且 GMEM API 与 Linux 原生内存管理 API 保持统一,易用性强,性能与可移植性好。 加速器使用 GMEM API 将内存接入统一地址空间后,可自动获得 GMEM 面向异构内存编程优化的能力。与此同时,加0 码力 | 52 页 | 5.25 MB | 1 年前3
 多云管下的自动化运维架构-刘宇《Puppet实战手册》 《Python进阶》 • QCon金牌讲师,QCon优秀出品人 目录 ① 行业趋势分析 ② 多云下运维的挑战 ③ 多云平台架构如何设计? ④ 困难以及挑战 资源统一管理 监控 账单 ⑤ 未来的展望 行业趋势分析 2017 年主流公有云故障 2018 年主流公有云故障 2019 年主流公有云故障 1% 的机率毁掉一家公司 行业趋势分析 Ngx LVS LVS Ngx DB DB 机房 Ngx Ngx LVS LVS Ngx DB DB 海海外 云故障时,影响不及时 —〉 不可控 集中式监控成本高 —〉 难统一 排查定位问题成本高 —〉 跨度大 业务成本难以核算 —〉 账单难处理 。。。 多云下运维的挑战 Gartner:云管理平台需要具备多云管理、自服务、计量计费、资源弹性及服务编排, Influxdb MySQL RESTful API Access Layer • 云商接口不统一 • SDK • 异常 • 账单 • 参数字典及转换 • 异步任务 • 日志统一 挑战: 资源统一管理 Sprint Cloud Sprint Boot Common 挑战: 资源统一管理 Rest API API Gateway (Kong) EventBus Ser IAM0 码力 | 32 页 | 6.05 MB | 1 年前3
 Flashcat 让监控分析变简单,Flashcat产品技术交流构建了⼀个数据、平台、场景打通的⼀体化⽅案 INTERNAL OR RESTRICTED, ALL RIGHTS RESERVED © 北京快猫星云科技有限公司 Flashcat 的特点 统⼀采集 采⽤插件化思路,内置集成上百种采集插件,服务器、⽹络设备、中间件、数据库、应⽤、业务,云上 云下,均可监控,开箱即⽤。 统⼀告警 ⽀持指标告警、⽇志告警、智能告警,⽀持⼏⼗种数据源对接,收集各类监控系统的告警事件,进⾏统 层下钻的故障定位能⼒,有效缩短故障发现和定位 时间。 统一采集 INTERNAL OR RESTRICTED, ALL RIGHTS RESERVED © 北京快猫星云科技有限公司 All-in-One 的数据采集器 Categraf • 是⼀款 All-in-One 的开源的 telemetry 数据采集器,⽀持指标、⽇志采集; • ⽀持 Tracing 数据的收集; • ⽀持物 ⽀持物理机、虚拟机、交换机、容器、K8s、多种中间件/数据库的数据采集,云上云下,均可监控; • 汇聚领域最佳实践,开箱即⽤; INTERNAL OR RESTRICTED, ALL RIGHTS RESERVED © 北京快猫星云科技有限公司 内置仪表盘模板和告警模板 INTERNAL OR RESTRICTED, ALL RIGHTS RESERVED © 北京快猫星云科技有限公司 Categraf0 码力 | 43 页 | 6.54 MB | 1 年前3
 openEuler 21.09 技术白皮书09 Edge、面向嵌入式的版本 openEuler 21.09 Embedded。 openEuler 希望与广大生态伙伴、用户、开发者一起,通过联合创新、社区共建,不断增强场景化能力,最终实现统一 操作系统支持多设备,应用一次开发覆盖全场景。 openEuler 对 Linux Kernel 的持续贡献 openEuler 内核研发团队持续贡献 Linux Kernel 上游社区,回馈 高效一键式安装,百节点部署时间 <15min。 探索场景创新 边缘计算:发布面向边缘计算场景的版本 openEuler 21.09 Edge,集成 KubeEdge+ 边云协同框架,具备边云应用 统一管理和发放等基础能力。 • 嵌入式: 发布面向嵌入式领域的版本 openEuler 21.09 Embedded,镜像大小 <5M,启动时间 <5S。 繁荣社区生态 友好桌面环境:UKUI、DDE 1. 哈希表目录 : 采用哈希表来管理目录项,提高线性查找效率,减少伪共享。 2. 统一的分配器:数据结构使用统一的分配器,这样可以打破不同数据结构之间的界限,使得内存管理更加地简单 与灵活。 3. 采用软更新技术,简化了实现复杂度:软更新 (Soft Update) 是一种轻量级的保证文件系统一致性的技术。 4. 基于指针的目录双视图计数机制,减少元数据同步开销,有效提升文件系统读写性能。0 码力 | 35 页 | 3.72 MB | 1 年前3
 openEuler 22.03 LTS SP2 技术白皮书全新发布后的第一个社区版本,实现了 全场景支持。增强服务器和云计算的特性,发布面向云原生的业务混部CPU调度算法、容器化操作系统KubeOS等关键技术; 同时发布边缘和嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler 22.03 LTS 版本,聚焦算力释放,持续提升资源利用率,打造全场景协同的数字基础设施操作系统。 2022 结合边缘、嵌入式领域竞争力探索,打造全场景协同的面向数字基 础设施的开源操作系统。 openEuler 22.03 LTS SP2 发布面向服务器、云原生、边缘和嵌入式场景的全场景操作系统版本,统一基于 Linux Kernel 5.10 构建,对外接口遵循 POSIX 标准,具备天然协同基础。同时 openEuler 22.03 LTS SP2 版本集成分布式软总线、 KubeEdge+ 高效一键式安装,百节点部署时间 <15min。 新场景 • 边缘计算:发布面向边缘计算场景的版本 openEuler 22.03 LTS SP2 Edge,支持 KubeEdge+ 边云协同框架,具备边 云应用统一管理和发放等基础能力。 • 嵌入式: 发布面向嵌入式领域的版本 openEuler 22.03 LTS SP2 Embedded,镜像大小 <5M,启动时间 <5s。 繁荣社区生态 • 友好桌面环境:UKUI、DDE0 码力 | 48 页 | 5.62 MB | 1 年前3
 openEuler 24.03 LTS 技术白皮书全场景支持。 增强服务器和云计算的特性,发布面向云原生的业务混部 CPU 调度算法、容器化操作系统 KubeOS 等关键技术;同时发布边缘和 嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler 22.03 LTS 版本, 聚焦算力释放,持续提升资源利用率,打造全场景协同的数字基础设施操作系统。 2022 openEuler Edge、面 向嵌入式的版本 openEuler Embedded。 openEuler 希望与广大生态伙伴、用户、开发者一起,通过联合创新、社区共建,不断增强场景化能力,最终实现统一操作系 统支持多设备,应用一次开发覆盖全场景。 openEuler 覆盖全场景的创新平台 服务器 云计算 边缘 嵌入式 基础公共服务 服务器 开源操作系统的构建过程,也是供应链聚合优化的 创新分布式、实时加速引擎和基础服务,结合边缘、嵌入式领域竞争力探索,打造全场景协同的面向数字基础设施的开源操作系统。 openEuler 24.03 LTS 发布面向服务器、云原生、边缘和嵌入式场景的全场景操作系统版本,统一基于 Linux Kernel 6.6 构建, 对外接口遵循POSIX标准,具备天然协同基础。同时openEuler 24.03 LTS版本集成分布式软总线、KubeEdge+边云协同框架等能力,0 码力 | 45 页 | 6.18 MB | 1 年前3
 告警OnCall事件中心建设方法白皮书
Prometheus 可能有多套)或者 Nightingale, 日志的监控可能用的 Elastalert,如果上云了,可能还会有多套不同的云监控(尤其是多云场景下)。 监控系统的重心,通常是采集、存储、可视化、生成告警事件,但通常都不具有完备的事件后续处理能 力。这里说的后续处理主要包括:多渠道分级通知、告警静默、抑制、收敛聚合、降噪、排班、认领升 级、协同闭环处理等等。监控系统或多或 除了原则方面,另一个应对过多告警的方法就是靠产品工具了,比如告警事件在哪些时间段发送、如何过 滤、如何屏蔽、如何抑制等等,通常,监控系统和统一的 OnCall 中心( PagerDuty FlashDuty 这种产 品)在这些功能上会有一定的重叠,不过监控系统在这方面做得参差不齐,整体能力偏弱,使用统一的 OnCall 中心功能更强大,我们留待工具实践篇再详细阐述。 接下来我们聊一下“告警疏漏、无法闭环 通过排班、认领、升级这些机制,可以确保告警递达指定的人,但要处理告警的话,只有值班人员自己就 未必搞得定了,需要有协同机制把相关人都拉进来一起处理才可以。对于某个故障,可能同时有多个告警 事件产生,大家基于一个统一的故障协同,而不是基于一堆事件分别协同,这就需要把这多个事件收敛成 一个故障,下面我们来聊一下这个收敛逻辑。 告警收敛逻辑 一般收敛逻辑是三级收敛,event -> alert ->0 码力 | 23 页 | 1.75 MB | 1 年前3
 openEuler 22.09 技术白皮书09 Edge、面向嵌入式的版本 openEuler 22.09 Embedded。 openEuler 希望与广大生态伙伴、用户、开发者一起,通过联合创新、社区共建,不断增强场景化能力,最终实现统一操作 系统支持多设备,应用一次开发覆盖全场景。 openEuler 对 Linux Kernel 的持续贡献 openEuler 内核研发团队持续贡献 Linux Kernel 上游社区,回馈 全场景支持。 增强服务器和云计算的特性,发布面向云原生的业务混部 CPU 调度算法、容器化操作系统 KubeOS 等关键技术;同时发布边 缘和嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 openEuler 22.03 LTS 版本, 聚焦算力释放,持续提升资源利用率,打造全场景协同的数字基础设施操作系统。 2022 新趋势,创新分布式、实时加速引擎和基础服务,结合边缘、嵌入式领域竞争力探索,打造全场景协同的面向数字基础设施的开 源操作系统。 openEuler 22.09 发布面向服务器、云原生、边缘和嵌入式场景的全场景操作系统版本,统一基于 Linux Kernel 5.10 构建, 对外接口遵循 POSIX 标准,具备天然协同基础。同时 openEuler 22.09 版本集成分布式软总线、KubeEdge+ 边云协同框架等0 码力 | 13 页 | 1.39 MB | 1 年前3
 Zabbix 7.0 中文手册可以定义非常灵活的问题阈值,称为触发器,从后端数据库引用值 高度可配置的告警 • 可以针对升级计划、收件人、媒体类型自定义发送通知 • 使用宏可以使通知变得有意义和友好 • 自动化操作包括执行远程命令 实时图形 • 采集到的监控项值可以使用内置的绘图功能立即图形化 网络监控功能 • Zabbix 可以跟踪网站上的模拟鼠标点击的路径并检查功能和响应时间 丰富的可视化选项 • 创建自定义图形的能力,可以将多个监控项组合成一个聚合图形 被监控资源的高级(业务)视图 历史数据存储 • 存储在数据库中的数据 • 可配置的历史数据(保留趋势) • 内置管家程序 轻松配置 • 将受监控的设备添加为主机 • 一旦主机添加到被数据库,就会开始进行数据采集 • 将模板应用于受监控的设备 模板的使用 6 • 在模板中分组检查 • 模板可以继承其他模板 网络发现 • 网络设备自动发现 • agent 自动注册 • 发现文件系统、网络接口和 协议连接; • plaintext - 使用 plaintext 协议连接,该协议仅发送监控项的键。 10 统一的 agent/agent2 协议 Zabbix agent 和 agent 2 协议已通过将 Zabbix agent 切换为 Zabbix agent 2 协议进行了统一。Zabbix agent 和 Zabbix agent 2 请 求/响应之间的区别通过 “variant” 标签值(“1”-0 码力 | 1951 页 | 33.43 MB | 1 年前3
共 73 条
- 1
 - 2
 - 3
 - 4
 - 5
 - 6
 - 8
 













