APM 深水区:构建连接运维与业务之桥-赵宇辰
APM 深水区: 赵宇辰 @ 听云 构建连接运维与业务之桥 目录 • APM现状和痛点 • 什么是APM深水区 • 技术原理 • 实际案例 APM现状:全链路监控 基础架构 业务系统 SaaS 原生App 浏览器 H5/Webview 应用性能监控 第一代APM: 主动拨测 APP监控 浏览器监控 基础架构监控 模拟用户 拨测节点 真实用户 小程序监控 哪些错误是真正紧急、影响业务的? 哪些业务被影响了?是否是核心业务? 如何补救? 运维现状: • 系统响应时间、错误率上升 • 不知道影响了哪些业务/BU/部门/用户 • 企业损失、成本消耗无法衡量、补救 现状:运维和业务的割裂(互联网场景) 业务洞察: ⚫ 转化率 / 收入 / 活跃用户 / KPI 迅速下降 ⚫ 业务团队不知具体原因 ⚫ 多团队、部门之间解决方案不明确 ⚫ 公司业务、健康状况时刻受到影响 公司业务、健康状况时刻受到影响 业务现状: • 系统响应慢 • 营销流程中点击“提交”要等很久 • 领导批准审批超时、报错 现状:运维和业务的割裂(企业场景) 运维困境: ⚫ 各系统看似正常 ⚫ OA系统响应及时 ⚫ 网络正常 ⚫ 数据库没有报错 ⚫ 业务和IT系统的对应关系缺失 ⚫ 难以迅速定位问题 ⚫ IT / CIO / 业务部门:KPI、考核、管理层压力 目录 • APM现状和痛点0 码力 | 24 页 | 5.87 MB | 1 年前3高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践
冲上云霄—腾讯海量业务上云实践 腾讯云高级工程师 黄宏东 自我介绍 ⚫ 业务开发出身的运维 ⚫ 先后在腾讯负责游戏、安全、医疗类业务运维 ⚫ 经历数年业务爆量、成本优化、业务上云、智能运维等重点项目 ⚫ 目前负责腾讯自研业务的运维与上云工作 01 腾讯业务为什么要上云 02 业务上云的价值 03 如何上云 目录 04 上云案例分享 腾讯业务为什么要上云 接入服务 业务 服务框架 服务框架 KV/RDS CVM/Docker 接入服务 业务 服务框架 KV/RDS CVM/Docker 接入服务 业务 服务框架 KV/RDS CVM/Docker 接入服务 业务 服务框架 KV/RDS CVM/Docker IEG PCG WXG CDG “烟囱式”的业务支持体系 幸福的烦恼 ⚫ 重复造轮子,每个部门一套轮子 ⚫ 缺乏统一规范,包括开源代码在内 将原有七大事业群(BG)重组整合,新成立云与智慧产业事业群(CSIG)、平台与内容 事业群(PCG)。在连接人、连接数字内容、连接服务的基础上,更加彰显了腾讯推动由消费 互联网,向产业互联网的升级的决心。 业务上云价值 • 开发效率更高 • 云上特性(VM热迁移等) • 丰富的标准化云服务 • 云原生TKE、研发CICD流程 • 计算资源重用 • 公共组件产品化 • 丰富的公有云海外资源 •0 码力 | 26 页 | 2.39 MB | 1 年前3Zadig 面向开发者的云原生 DevOps 平台
DevOps 平台 角色: 产品/架构 开发 测试 运维 运维/开发 技术支持 事件 需求设计 架构设计 拆任务、写代码 代码集成 xN 单元测试验证 xN 代码扫描 xN 自测、联调 xN 集成验证 xN 写测试用例 系统验证 xN 自动化测试 xN 性能测试 xN 安全测试 xN 数据变更 xN 代码变更 xN 配置变更 xN 部署测试环境 xN 部署预发环境 xN 部署生产环境 数据度量 xN 服务、工单管理 事件、缺陷管理 想 法 用 户 运行阶段 需求阶段 研发阶段 现代软件交付挑战:开发 5 分钟,上线 2 小时 服务一:设计 | 代码编写 | 构建 | 测试 | 部署 | 发布 服务二:设计 | 代码编写 | 构建 | 测试 | 部署 | 发布 服务三:设计 | 代码编写 | 构建 | 测试 | 部署 | 发布 以前:面向代码片段的串行交付 现在 服务一: 服务定义 | 构建 | 部署 | 测试 | 发布 服务二: 服务定义 | 构建 | 部署 | 测试 | 发布 服务三: 服务定义 | 构建 | 部署 | 测试 | 发布 代码一: 代码编写 | 构建 | 部署 | 测试 | 发布 代码二: 代码编写 | 构建 | 部署 | 测试 | 发布 代码三: 代码编写 | 构建 | 部署 | 测试 | 发布 特点: ● 重复流程自动化0 码力 | 59 页 | 23.57 MB | 1 年前3Zadig 面向开发者的云原生 DevOps 平台
架构 开发 测试 运维 运维 / 开发 技术支持 事件 需求设计 架构设计 拆任务、写代码 代码集成 xN 单元测试验证 xN 代码扫描 xN 自测、联调 xN 集成验证 xN 写测试用例 系统验证 xN 自动化测试 xN 性能测试 xN 安全测试 xN 数据变更 xN 代码变更 xN 配置变更 xN 部署测试环境 xN 服务、工单管理 事件、缺陷管理 想 法 用 户 运行阶段 需求阶段 研发阶段 现代软件交付挑战:开发 5 分钟,上线 2 小时 服务一:设计 | 代码编写 | 构建 | 测试 | 部署 | 发布 服务二:设计 | 代码编写 | 构建 | 测试 | 部署 | 发布 服务三:设计 测试 | 部署 | 发布 以前:面向代码片段的串行交付 现在:面向多个服务编排的产品级自动化并行交付 服务一: 服务定义 | 构建 | 部署 | 测试 | 发布 服务二: 服务定义 | 构建 | 部署 | 测试 | 发布 服务三: 服务定义 | 构建 | 部署 | 测试 |0 码力 | 59 页 | 81.43 MB | 1 年前3CloudExplorer 3.0 管理员手册v1.2
...............................................237 8.4.1 开发测试环境多项目资源都部署到 1 个 VLAN..........................................238 8.4.2 开发测试环境多项目共用多个 VLAN、多个公有云 VPC 子网............... 238 9 IT 投入使用分析.. ..........254 9.3.8 查看各个部门历史月份费用变化情况及趋势............................................255 9.3.9 查看各个业务或项目历史月份费用变化情况及趋势................................255 9.3.10 查看各个云账号下资源使用情况......................... 使用方法。 1.2 阅读对象 杭州飞致云信息科技有限公司 7 IT 系统管理员、云平台管理员、运营人员 云管平台实施人员 云管平台开发测试人员 1.3 名词术语 名词 解释 基础架构平台 指为业务系统开发测试、运行提供运行环境资源的各类虚拟化平台、超融 合平台、私有云平台以及公有云平台。 虚拟化平台 指以 VMware 为代表的基于虚拟化技术整合物理机以虚拟机方式提供资源0 码力 | 308 页 | 0 Bytes | 1 年前3Zabbix 6.0 Manual
可以跟踪网站上的模拟鼠标点击路径并检查功能和响应时间 广泛的可视化选项 • 创建自定义图形的能力,可以将多个监控项组合成一个聚合图形 • 网络拓扑图 • 在仪表盘中显示幻灯片 • 报表 • 受监控资源的高级(业务)视图 历史数据存储 • 存储在数据库中的数据 • 可配置的历史(保留趋势) • 内置管家程序 建议的配置 • 将受监控的设备添加为主机 • 一旦主机被数据库添加,就会开始进行数据采集 • 安全用户认证 • 某些用户可以被限制仅访问某些视图 全功能且易于扩展的 agent • 部署在被监控目标上 • Linux 和 Windows 操作系统都适用于 二进制守护进程 • 用 C 编写,用于提高性能和减少内存占用 • 轻量级、便携 为复杂环境做好准备 • 使用 Zabbix proxy 轻松实现远程监控 4 Zabbix 概述 结构体系 Zabbix 由几个主要的软件组件组成。他们的职责概述如下。 数据报告给 Zabbix server。从 Zabbix 4.4 开始, 有两种类型的 agent 可用:Zabbix agent (轻量级,在许多平台上支持,用 C 编写)和Zabbix agent 2 (非常灵活,易于使用插件扩展, 用 Go 编写)。 数据流 此外,回顾一下 Zabbix 中的整体数据流也是很重要的。为了创建一个收集数据的监控项,必须首先创建一个主机。另一方面 Zabbix0 码力 | 1741 页 | 22.78 MB | 1 年前3openEuler 23.09 技术白皮书
算能力。 2021 年 9 月 30 日,全新 openEuler 21.09 创新版如期而至,这是欧拉全新发布后的第一个社区版本,实现了全场景 支持。增强服务器和云计算的特性,发布面向云原生的业务混部 CPU 调度算法、容器化操作系统 KubeOS 等关键技术; 同时发布边缘和嵌入式版本。 2022 年 3 月 30 日,基于统一的 5.10 内核,发布面向服务器、云计算、边缘计算、嵌入式的全场景 30 日,发布 openEuler 22.09 创新版本,持续补齐全场景的支持。 2022 年 12 月 30 日,发布 openEuler 22.03 LTS SP1 版本,打造最佳迁移工具实现业务无感迁移,性能持续领先。 2023 年 3 月 30 日,发布 openEuler 23.03 内核创新版本,采用 Linux Kernel 6.1 内核,为未来 openEuler 长生命周 期版本采用 最小硬件要求 架构 ARM64、x86_64 内存 为了获得更好的体验,建议不小于 4GB 硬盘 为了获得更好的体验,建议不小于 20GB openEuler 安装时,应注意虚拟机的兼容性问题,当前已测试可以兼容的虚拟机及组件列表如下: • centos-6 qemu 6.2.0-79.oe2309 libvirt 6.2.0-59.oe2309 virt-manager 4.1.0.2-oe23090 码力 | 52 页 | 5.25 MB | 1 年前3Curve质量监控与运维 - 网易数帆
质量——向用户交付稳定可靠的软件; 监控——直观地展示Curve运行状态; 运维——保障Curve始终稳定高效运行。 质量 ✓ 质量管理体系(设计、开发、review、CI) ✓ 测试方法论(单元测试、集成测试、系统测试) 监控 ✓ 监控架构 ✓ 指标采集、后端处理、可视化展示 运维 ✓ 运维特性 (易部署、易升级、自治) ✓ 运维工具(部署工具、管理工具) 4/33背景 01 02 软件质量的定义是:软件与明确地和隐含地定义的需求相一致的程度。 为了确保最终交付的软件满足需求,必须将质量控制贯穿于设计、开发到测试的整个流程中。 设计 设计流程 文档规范 开发 编码规范与提交流程 版本管理 测试 测试方法论 CI与异常测试 6/33设计流程 Curve团队采用敏捷开发模式,负责人在制定迭代计划时,确认哪些任务需要设计 文档: 小需 Dailybuild测试 提交issue 开发设计 提交PR review +1 CI测试(编译、静态检 查、单元测试、集成测 试、覆盖率80%卡点) 合入master 分支 代码提交流程 异常自动化 测试 混沌测试 (每周一次) CI测试(编译、静态检 查、单元测试、集成测 试、覆盖率80%卡点) 邮件通知 Curve所有代码均在github托管。新 代码需要通过CI测试和code0 码力 | 33 页 | 2.64 MB | 5 月前3Zabbix 7.0 中文手册
可以跟踪网站上的模拟鼠标点击的路径并检查功能和响应时间 丰富的可视化选项 • 创建自定义图形的能力,可以将多个监控项组合成一个聚合图形 • 网络拓扑图 • 在仪表盘中显示幻灯片 • 报表 • 被监控资源的高级(业务)视图 历史数据存储 • 存储在数据库中的数据 • 可配置的历史数据(保留趋势) • 内置管家程序 轻松配置 • 将受监控的设备添加为主机 • 一旦主机添加到被数据库,就会开始进行数据采集 • 安全用户认证 • 某些用户可以被限制仅访问某些视图 功能齐全且易于扩展的 agent • 部署在被监控目标上 • Linux 和 Windows 操作系统都适用于 二进制守护进程 • 用 C 编写,用于提高性能和减少内存占用 • 轻量级、便携 为复杂环境做好准备 • 使用 Zabbix proxy 轻松实现远程监控 4 Zabbix 概述 结构体系 Zabbix 由几个主要的软件组件组成。他们的职责概述如下。 数据报告给 Zabbix server。从 Zabbix 4.4 开始, 有两种类型的 agent 可用:Zabbix agent (轻量级,在许多平台上支持,用 C 编写)和Zabbix agent 2 (非常灵活,易于使用插件扩展, 用 Go 编写)。 数据流 此外,回顾一下 Zabbix 中的整体数据流也是很重要的。为了创建一个收集数据的监控项,必须首先创建一个主机。另一方面 Zabbix0 码力 | 1951 页 | 33.43 MB | 1 年前3Zadig 产品使用手册
/ 数 据 迭 代 方 式 已 经 无 法 适 应 , 软 件 工 程 化 时 代 已 然 到 来 。 Z a d i g 软 件 工 程 平 台 是 国 内 落 地 程 度 最 深 、 使 用 范 围 最 广 ( 近 千 家 企 业 ) 的 云 原 生 D e v O p s 平 台 。 领先企业抢先实践 Zadig Zadig 研发数字化转型方案正成为产业数字化战略的核心环节 Rainbond KubeSphere KubeVela 面向资源管理的运维工具集 面向开发者,需结合 CI/CD 工具额外 搭建全流程能力 专门面向开发者的生产力平台,涵盖需求到开 发,测试,运维的云原生一体化技术底座支撑 云厂商 DevOps 平台 华为云 DevCloud 阿里云效 腾讯 CODING 云厂商引流为主,锁定风险高 对多云跨地域支持不够 实施负担较重难以推广 通用性、可扩展性、技术先进性强,可以灵活 广泛接入各种技术和业务场景 基于代码管理的 DevOps 方案 Gitee 平台 GitLab 平台 局限性大、全流程安全性低 维护成本高 支持多个服务并行构建部署、产品级发布,可 灵活安全接入多个代码仓及周边工具链 开发 Zadig 核心特性: 运维 真正意义的持续交付:以工程师体验为核心,价值交付为理念,完成需求到发布的全路径。 测试 发布 洞察 一堆复杂脚本、维护成本极高0 码力 | 52 页 | 22.95 MB | 1 年前3
共 144 条
- 1
- 2
- 3
- 4
- 5
- 6
- 15