告警OnCall事件中心建设方法白皮书事件 ONCALL 中心建设方法 一站式处理值班 OnCall,智能降噪 北京快猫星云科技有限公司 前言 市面上有众多监控系统,刨去商业软件不说,开源的就有 Nagios、Zabbix、Open-Falcon、 Nightingale、Grafana、Prometheus、Elastalert 等等,还有云厂商提供的监控系统,比如华为云的云 监控、腾 这种产品存在的价值。这些产品都是以 Duty 命名,核心就是支持告警 OnCall 值班处理的场景。 对于告警事件的后续处理,有哪些问题和需求以及何为最佳实践?我们从思路方法和工具实践两个方面分 别进行探讨,下面先行探讨思路方法,看看要解决这些问题和需求,我们有哪些可能的解法。 思路方法篇 告警事件的后续处理:多渠道分级通知、告警静默、抑制、收敛聚合、降噪、排班、认领升级、协同闭环 处理等等。看起来需求很多,最核心的痛点有两个: 这个动作可能不是立马执行处理, 但至少要创建个低优先级的工单之类的,或者提高告警阈值,等问题严重一些再告警。对于只是想通知一 下的告警,其实都不算告警,只能看作是一种另类的报表和巡检手段,这样的“告警”就按照报表和巡检 的逻辑来处理,比如把这类“告警”发到一个单独的邮件组或者单独的聊天群组,平时都不用关注,只要 每天早上上班或晚上下班之前稍微看一眼就行,这样就可以减少打扰。 制定0 码力 | 23 页 | 1.75 MB | 1 年前3
古月《ROS入门21讲》16.参数的使用与编程方法.pdf16.参数的使用与编程方法 主 讲 人 : 古 月 参数模型 创建功能包 参数命令行使用 ⚫ ⚫ ⚫ ⚫ ⚫ ⚫ 编程方法(C++) • • • parameter_config.cpp 配置代码编译规则 • • CMakeLists.txt 编译并运行发布者 编程方法(Python) • • • parameter_config.py 感谢观看0 码力 | 9 页 | 1.17 MB | 1 年前3
Zabbix 峰会、社区和公司Zabbix峰会、社区和公司 演讲嘉宾 柳霞 Sandara, zabbix商务经理,宏时数据 01 Zabbix中国峰会 Zabbix峰会是唯一一个你可以听到来自全国/全球的行业案例、 技术分享、解决方案分享的地方。 ZABBIX 2020 Conference CHINA Zabbix峰会 峰会是桥梁,我们一直想离用户更近一点 会是平台,IT专家、IT管理人员、社区成员和Zabbix创始团队集聚一堂,交流探索 认证培训 Zabbix培训为世界各地的使用者提供了向最顶级的专家学习的机会, Zabbix认证 已成为评判工程师能力的重要标准。 咨询服务 眼务帮助您在部署 Zabbix软件前后更好地理解其优势和潜力,为企业规划监 上,解决高难度问题。 现场人天支持 让专业的人做专业的事,雇用国内外Zabbix认证专家来为企业做保障。 年度订阅服务 在使用 Zabbix过程中,为用户提供专业及时的技术支持,服务通过在线客户支持 ozcrwietadtRRzcrE人 世 2020 Conference [chiNA] 参与证书和考试通过认证证书 CERTIFICATE CERTIFICATE FAMILY NAME LAST NAME 和0 码力 | 32 页 | 6.22 MB | 1 年前3
古月《ROS入门21讲》19.launch启动文件的使用方法.pdf19.launch启动文件的使用方法 主 讲 人 : 古 月 Launch文件 Launch文件语法 • • • • Launch文件语法 • • • • Launch文件语法 • • • Launch示例 simple.launch turtlesim_parameter_config.launch Launch示例 start_tf_demo_c++.launch0 码力 | 8 页 | 1.03 MB | 1 年前3
Traefik 在⼜拍云的应⽤和改造Traefik 在⼜拍云的应⽤和改造 陈卓 ⼜拍云系统开发⼯程师 公开课 分享内容 • Traefik 简介 • Traefik 跟 Ingress-Nginx 比较 • 我们为什么使用 Traefik • Traefik 改造之路 Traefik 简介 Traefik 简介 Edge Router Auto Service Discovery Traefik 简介 traefik 纯 go 语言实现,不依赖额外的存储配置组件 Traefik 和 Nginx 性能⽐较 https://www.loggly.com/blog/benchmarking-5-popular-load-balancers-nginx-haproxy-envoy-traefik-and-alb/ Traefik 和 Ingress-Nignx 组件⽐较 traefik Edge Router Load Balance a.com b.com New Router . . Load Balance a.com b.com Traefik 中间件 记录响应status和size 增加⼀个类似gin的 Traefik 中间件动态加载 Traefik 提供的中间件 Traefik 热更新⼆进制⽂件 Traefik 其它的⼀些改造 1.Traefik Hash算法跟0 码力 | 22 页 | 1.91 MB | 1 年前3
Bootarmor 入门教程和用户手册 0.1.0全应用可 以运行在安全 系统 Bootarmor 中。运行在 Bootarmor 系统中的安全应用的代码 和数据,操作系统中任何 权限的用户(包括 root 在内)也无法读取和访问, 无论是静态反编译,还是各种内核调试 器和应用层调试器,都无法获取安全 应用的代码和数据。 本文档适用于使用 Bootarmor 来保护自己应用程序的用户。 内容: 了解 Bootarmor 基本使用教程 支持平台 发布安全应用 btarmor 语法 描述 btarmor boot btarmor make btarmor deploy btarmor patch C 用户使用手册 默认保护模式 共享字符串和全局变量 保护内存堆 保护内存栈 保护数据文件 附录 btarmor-os Debian Packages 了解 Bootarmor Bootarmor 是以为软件产品提供绝对安全,确保软件产品发布之后,其代码不 内核,把原来的嵌入式系 统 的内核替换为 Bootarmor 提供的内核之后,就升级成为安全操作系统。 Bootarmor 可以直接保护二进制代码文件,例如可执行文件和动态库,对于 C#, Java,Python 等使用伪代码和虚拟机的语言,通过将解释器编译成为安 全应用, 间接的来进行保护。例如对 Python 脚本来说,首先将 Python 解释器 使用 Bootarmor 保护起来,然后把0 码力 | 25 页 | 30.29 KB | 1 年前3
Bootarmor 入门教程和用户手册 0.1.0Bootarmor 入门教程和用户手册 发布 0.1.0 赵俊德 2022 年 05 月 08 日 Contents 1 了解 Bootarmor 3 2 基本使用教程 5 2.1 支持平台 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 4.2 共享字符串和全局变量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4.3 保护内存堆 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 i ii Bootarmor 入门教程和用户手册, 发布 0.1.0 版本 0.1 主页 https://github.com/dashingsoft/bootarmor 联系方式 jondy.zhao@gmail.com 作者 赵俊德0 码力 | 29 页 | 300.11 KB | 1 年前3
curvefs client删除文件和目录功能设计© XXX Page 1 of 15 curvefs client 删除文件和目录功能设计© XXX Page 2 of 15 背景 相关调研 moosefs chubaofs 方案设计思考 1.Trash机制是实现1个(类似chubaofs),还是2个(类似moosefs)? 2. Trash放在哪里? 3. 是否需要做session机制(在metaserver打开),来维护inode的打开情况? 打开情况? 方案设计 Trash机制: Session机制: 遗留问题 工作量评估 背景 目前curvefs client版本对删除unlink和rmdir的设计只有简单的删除inode和dentry结构,遗留了nlink和lookup count相关的内容还未实现,是不完备的。本文首先调研moosefs,chubaofs等分布式系统,参考并设计解决上述遗留问题。 当前删除接口代码如下:© 一是删除时nlink字段未考虑: 文件的nlink用于实现hard link。 hard link使用nlink字段表示文件的link的引用计数,第一次创建文件是nlink字段为1。每创建一个新的指向该文件的hard link时,nlink字段+1, 每删除一个hard link或指向的原文件时,nlink字段-1。© XXX Page 4 of 15 当nlink字段减到0时,才真正删除i0 码力 | 15 页 | 325.42 KB | 6 月前3
基于 APM 的智能运维体系在京东物流的落地和实践-付正全基于APM的智能运维体系在京东物流的落地和实践 付正全 京东物流 架构师 自我介绍 付正全,京东物流架构师,国家认证信息系统项目管 理师,曾任浪潮集团系统架构师,专注监控平台研发 工作 8 年,研究过市场上数十家厂商的监控平台产品, 对 DevOps 和监控平台有比较深入的了解。目前负责 京东物流火眼监控平台的架构设计和开发工作。 目录 ⚫业界智能运维发展现状及趋势 ⚫智能运维体系建设方法论 ⚫大规模实时监控平台的实践方案 ◼目前,全球APM市场规模大约在60亿美元左右,预 计在五年内达到90亿美元 ◼APM成为ITOM成长最快的领域 ◼APM能够对企业的关键业务应用进行监测、诊断分 析、优化,最终能够提高应用的可靠性和质量,保证 良好的用户体验,降低IT成本 运维角色转变 背锅侠 救火员 被动响应 主动求变 需求提炼 产品化开发 产品化落地 产品意识 推广落地 业务数据分析 过程改进 技术运营 ⚫业界智能运维发展现状及趋势分析 ⚫智能运维体系建设方法论 ⚫大规模实时监控平台的实践方案 ⚫智能故障定位与处理实践 ⚫ APM 在京东物流的落地实践 ⚫智能运维(AIOps)落地规划 智能运维体系建设方法论 ◼统一规划、避免重复建设 ◼标准化是前提 ◼产品化设计、产品化开发 ◼服务驱动 ◼运维中台 ◼业务增值 ◼过程改进 智能运维体系建设方法论 ◼闭环 ◼生命周期管理 ◼流程管理0 码力 | 41 页 | 3.52 MB | 1 年前3
Zabbix 7.0 中文手册. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122 1 登录和配置用户 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 1 主机和主机组 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441 12 用户和用户组 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 码力 | 1951 页 | 33.43 MB | 1 年前3
共 151 条
- 1
- 2
- 3
- 4
- 5
- 6
- 16













