高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践SPEAKER 01 智能运维场景描述 整体介绍 02 单维时间序列分析 异常检测 03 多维时间序列分析 多维下钻 目录 04 Metis 的研究方向 展望未来 智能运维(AIOps) 基于机器学习的智能运维 发现问题 • 时间序列异常 • 日志分析异常 • 设备性能异常 分析问题 • 多维下钻分析 • 关联事件分析 • 容量预估分析 解决问题 • 02 单维时间序列分析 异常检测 03 多维时间序列分析 多维下钻 目录 04 Metis 的研究方向 展望未来 单维时间序列分析 海量时间序列 业务场景复杂 规则配置繁琐 1 2 3 时间序列异常检测 如何找到通用的解决方案? 单维时间序列分析 规则类告警策略 最大值告警 最小值告警 波动率告警 单维时间序列分析 无监督异常检测算法 (自编码器) 原始数据 原始数据 生成数据 单维时间序列分析 无监督异常检测算法 (N-Sigma) 单维时间序列分析 有监督异常检测算法 (特征工程) 时间序列的统计特征 • 最大值,最小值,值域 • 均值,中位数 • 方差,偏度,峰度 • 同比,环比,周期性 • 自相关系数,变异系数 时间序列的拟合特征 • 移动平均算法 • 带权重的移动平均算法 • 指数移动平均算法 • 二次指数移动平均算法0 码力 | 28 页 | 1.88 MB | 1 年前3
FIT2CLOUD CloudExplorer 产品白皮书 v1.7、南京电大、华中科技大 学、厦门理工大学、中南财大、中科院高能物理研究所、自然资源物探 遥感中心、中电二十八所、中科边缘智慧 政府医院(8) 河北省气象局、国家卫健委科研所、远盟康健、湖北环境检测、张家港 卫健委、奉贤区人民政府、南京市公安局高淳分局、江苏省银保监局、 零售(3) 百盛集团、复兴云济、复兴地产 互联网及游戏 (3) 中手游、米哈游、汇通达 图 6: 部分云管客户案例 3)费用分析方面 支持账单分析以及分摊分析、趋势分析。 其中账单分析支持查看各个云账号当月及历史月份的总费用以及各类服务的费用,以及 各类产生费用的明细;帮助了解成本投入情况,以及在费用有异常时,方便查看找到导致费 用异常的原因。 分摊分析支持针对虚拟机实例资源,通过打标签方式支持对虚拟机费用的分摊,比如按 部门、按业务、按环境等等。 趋势分析支持从不同维度方面查看费用的增长变化情况,给申请预算以及进行费用管控0 码力 | 60 页 | 0 Bytes | 1 年前3
CloudExplorer 3.0 部署运维手册v1.2...................................................................................... 27 9.1 连接资产异常................................................................................................... .................................................................................... 27 9.4 设备管理信息异常.................................................................................................28 log 七、监控服务 7.1 服务说明 1)此监控服务采用部署包形式通过云管平台导入进行安装部署,能自动拉取客户端监控数 据,通过数据可视化展示,并且将异常数据通过监控告警邮件直接发送至管理员邮箱。解决 了服务器信息数据不直观、异常信息不能及时发现等问题。 2)组件: 使用 Exporter 收集客户机指标 使用 Prometheus Server 抓取数据 使用 Alertmanager0 码力 | 29 页 | 0 Bytes | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏器、业务应用、基础服务 运维自动化 数据中心自 动化 应用运维自 动化 业务运维自 动化 CMP 跨系统编排 与调度 运行监控和故障管理 第三方监控接入 基础监控 采集 存储 检测 告警 故障自愈 蓝鲸平台 管控平台 PaaS平台:开发框架/API集成 统一配置管理 模型定义 自动采集 配置维护 拓扑视图 配置消费 统一运维门户 可视化大屏、统一报表、统一权限、移动运维 MySQL kafka Redis ElasticSearch Beanstalkd 监控对象 硬件服务器 虚拟化 网络 OS 数据库 中间件 容器 应用 服务 服务能力 处理服务 告警服务 检测服务 日志服务 告警通知 告警收敛聚合 故障自动处理 告警人工工单 静态阈值 动态阈值 日志分析 日志检索 指标服务 指标组合 指标管理 IT监控功能示例 Apache监控 Nginx监控0 码力 | 26 页 | 8.25 MB | 1 年前3
Zadig 面向开发者的云原生 DevOps 平台倍 验证有效性提升 100% 解放测试,全面自动化 提升效率,建设质量体系 安全 安全建设被动: • 安全建设缺乏时机和抓手 • 出现问题,影响业务进度 前置安全服务:全流程嵌入安全检测,避免流入业务环节。 全流程安全门禁:关键环节设置安全门禁,快速反馈研发改进 故障拦截率提升 1-3 倍 业务响应效率提升 3-5 倍 全流程安全建设 更多价值体现 组织 靠流程和个人,效率越来越低 能力完成车端和云端服务的迭代更新 过程: 主机方式接入资源设备 • 支持系统主机管理的同时支持了项目级别的主机管理,项目成员可 以自己上下线资源设备 • 主机管理支持强大的探活机制 (TCP/HTTP 协议 ) ,精准检测资源设 备是否在线。 • 服务可以查看到关联的主机资源,支持登录主机,方便开发登录资 源设备诊断问题 • 完备的权限控制,极大降低了管理成本,实现安全风险可控。 IoT 端云混合场景:异构环境下,为开发者提供更好体验0 码力 | 59 页 | 81.43 MB | 1 年前3
Zadig 面向开发者的云原生 DevOps 平台1-5 倍 验证有效性提升 100% 解放测试,全面自动化 提升效率,建设质量体系 安全 安全建设被动: • 安全建设缺乏时机和抓手 • 出现问题,影响业务进度 前置安全服务:全流程嵌入安全检测,避免流入业务环节。 全流程安全门禁:关键环节设置安全门禁,快速反馈研发改进 故障拦截率提升 1-3 倍 业务响应效率提升 3-5 倍 全流程安全建设 更多价值体现 组织 靠流程和个人,效率越来越低 能力完成车端和云端服务的迭代更新 过程: 主机方式接入资源设备 • 支持系统主机管理的同时支持了项目级别的主机管理,项目成员可 以自己上下线资源设备 • 主机管理支持强大的探活机制(TCP/HTTP 协议),精准检测资源设 备是否在线。 • 服务可以查看到关联的主机资源,支持登录主机,方便开发登录资 源设备诊断问题 • 完备的权限控制,极大降低了管理成本,实现安全风险可控。 IoT 端云混合场景:异构环境下,为开发者提供更好体验0 码力 | 59 页 | 23.57 MB | 1 年前3
CloudExplorer 3.0 管理员手册v1.2支持公有云账单分析以及分摊分析、趋势分析。 杭州飞致云信息科技有限公司 240 账单分析支持查看各个云账号当月及历史月份的总费用以及各类服务的费用,以及各 类产生费用的明细;帮助了解成本投入情况,以及在费用有异常时,方便查看找到导 致费用异常的原因。 分摊分析支持针对虚拟机实例资源,通过打标签方式支持对虚拟机费用的分摊,比如 按部门、按业务、按环境等等。 趋势分析支持从不同维度方面查看费用的增长变化情况,给申请预算以及进行费用管0 码力 | 308 页 | 0 Bytes | 1 年前3
Red Hat OpenShift GitOps 1.13 了解 OpenShift GitOps执行以下操作的控制器: 持续监控 Git 存储库的更改 监控正在运行的应用程序 将 live 状态与所需的目标状态进行比较 部署新更改 示例包括 Argo CD Application Controller 检测 OutOfSync 应用程序状态,并选择性地采取纠正操 作。 应 应用程序 用程序 自定 自定义资 义资源 源(CR) 描述如何部署 Argo CD 应用程序的资源的 YAML 清单。 应 应用程序0 码力 | 17 页 | 203.28 KB | 1 年前3
CloudExplorer 3.0 用户手册v1.2资源日志】可以查看订单执行日志记录。 杭州飞致云信息科技有限公司 31 点击要查看订单的【订单编号】打开【订单详情】页面,可以查看订单详细信息及审批 进度,如图 3-10 所示。 图 3-10 订单详情 对于异常状态的订单,可以选择【重试订单】或者【作废订单】,如图 3-11 所示。选 择需要重试的订单,在【操作】下拉菜单中选择【重试订单】会重新执行订单命令,【作 废订单】即中止订单审批流程,订单做作废处理。0 码力 | 102 页 | 0 Bytes | 1 年前3
共 9 条
- 1













