高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏实现企业IT经营管理模式升级和自主化。 承载数百款 腾讯业务 管控数十万 台服务器 孵化700+ 应用系统 全球多云 管控 培养数百蓝鲸运 维开发 工具驱动运维:采用运维 开发的模式,实现所有运维任 务自动化、工具化、可视化。 数据驱动运维:基于大数据 的接入、存储、分析技术,对运 维数据进行全面挖掘和分析,实 现数据驱动自动化运维。 机器驱动运维:基于智能算法 的机器自我学习,训练机器智能运 有重客户端游戏,网页游戏,各类官网,移动终端游戏, 大型游戏平台; 平铺式架构,拓扑关系复杂,模块数量上百,服务器数量 几千…… 腾讯游戏300多款业务中,大多数是由世界各地开发商开发 出来。 所使用的开发语言、开发框架、操作系统、数据库等技术, 是没有直观规律的。 开发商很难为了运维体系而对架构或技术做大规模的修改。 有几乎所有的业务类型 有几乎所有的流行技术 300多款游戏相互之间是没有关系的。 发布变更、故障处理等运维操作场景和操作流程是没有直 服务组件C 服务组件D 故障机替换 新版本发布 基础监控系统 扩容管理系统 …… …… 原子A 原子B 原子C 原子D 原子E IaaS管理 配置平台 作业平台 容器管理 DB管理 什么叫 PaaS …… 原子A 原子B 原子C 原子D 原子E 管控接入 配置平台 作业平台 容器平台 数据平台 故障机替换 新版本发布 基础监控系统 扩容管理系统 …… 服务组件A 服务组件B 服务组件C 服务组件D0 码力 | 26 页 | 8.25 MB | 1 年前3
CloudExplorer 3.0 管理员手册v1.2.................................103 6.3.1 创建单级标签进行分组分类查看操作、统计分析..................................... 103 6.3.2 创建多级标签进行分级分组分类查看操作、统计分析............................. 105 6.3.3 给虚拟机批量打标签分组分类......... 2 添加 CentOS7.6 虚拟机服务产品...............................................................170 7.4.3 配置操作系统部署后初始化......................................................................... 176 7.4.4 添加 Tomcat9 ...........................238 8.4.2 开发测试环境多项目共用多个 VLAN、多个公有云 VPC 子网............... 238 9 IT 投入使用分析...................................................................................................0 码力 | 308 页 | 0 Bytes | 1 年前3
FIT2CLOUD CloudExplorer 产品白皮书 v1.7的产品与解决方案涵盖软件测试、云原生运行时、多云管理、安全合规、 数据分析可视化、内容管理,其旗舰产品包括:MeterSphere 开源持续测试平台、 KubeOperator 开源容器平台、CloudExplorer 多云管理平台、JumpServer 开源堡垒机、 DataEase 开源数据可视化分析平台、Halo 开源博客/CMS 系统。FIT2CLOUD 旗下的开 源项目在开源社区表现出了卓越的成长性,在代码托管平台 ..12 1.5.3 实现运维工具深度整合、联动自动化........................................................ 12 1.5.4 实现运营分析、IT 投入透明化及时回收优化.............................................12 1.5.5 建立数据中心 IT 体系演进框架支持迭代扩展建设..... .............................................................................. 38 2.4.11 IT 投入可视化、分析回收优化...................................................................40 三、核心能力..................0 码力 | 60 页 | 0 Bytes | 1 年前3
Zadig 面向开发者的云原生 DevOps 平台开发 技术支持 事件 需求设计 架构设计 拆任务、写代码 代码集成 xN 单元测试验证 xN 代码扫描 xN 自测、联调 xN 集成验证 xN 写测试用例 系统验证 xN 自动化测试 xN 性能测试 xN 安全测试 xN 数据变更 xN 代码变更 xN 配置变更 xN 部署测试环境 xN 部署预发环境 xN 传统 DevOps 体系 Zadig 云原生 DevOps 平台 高人效 低人效 低人效 / 低质量 / 低效率 / 高成 本: 人淹没在系统的海洋里,无数平台手工切换 高人效 / 高质量 / 高效率 / 低成 本: 人在系统之外 / 上,复杂性下沉到单一平台 希望 工程师不再花时间在开发写代码之外的脏活累活,比如服务部署、找环境,服务编排等 Infra 的事情。 1 0 今天发版、明早升级 嗷嗷待哺状态 Zadig 优势、使用场景、解决问题域 Zadig 解决问题域 Zadig 云原生开放性:极简、 0 负担接入 Zadig 业务架构 Zadig 系统架构 1 Zadig 行业方案 对比分析 职能 传统 DevOps 方案 ZadigX 云原生 DevOps 方案 降本提效 组织能力提升 业务负责人 研发不透明,规划凭感觉: • 发版时间靠运气 • 团队熬夜冲进度0 码力 | 59 页 | 81.43 MB | 1 年前3
Zadig 面向开发者的云原生 DevOps 平台产品/架构 开发 测试 运维 运维/开发 技术支持 事件 需求设计 架构设计 拆任务、写代码 代码集成 xN 单元测试验证 xN 代码扫描 xN 自测、联调 xN 集成验证 xN 写测试用例 系统验证 xN 自动化测试 xN 性能测试 xN 安全测试 xN 数据变更 xN 代码变更 xN 配置变更 xN 部署测试环境 xN 部署预发环境 xN 部署生产环境 xN 部署/灰度上线 重视开发者体验,工程师不再做脏活累活 传统 DevOps 体系 Zadig 云原生 DevOps 平台 高人效 低人效 低人效/低质量/低效率/高成本: 人淹没在系统的海洋里,无数平台手工切换 高人效/高质量/高效率/低成本: 人在系统之外/上,复杂性下沉到单一平台 希望 工程师不再花时间在开发写代码之外的脏活累活,比如服务部署、找环境,服务编排等Infra的事情。 1 0 0 % 开 源 开发者常处于“今天发版、明早升级”嗷嗷待哺状态 Zadig 优势、使用场景、解决问题域 Zadig 解决问题域 Zadig 云原生开放性:极简、0 负担接入 Zadig 业务架构 Zadig 系统架构 Zadig 行业方案 对比分析 职能 传统 DevOps 方案 ZadigX 云原生 DevOps方案 降本提效 组织能力提升 业务负责人 研发不透明,规划凭感觉: • 发版时间靠运气 • 团队熬夜冲进度0 码力 | 59 页 | 23.57 MB | 1 年前3
CloudExplorer 3.0 部署运维手册v1.2.........................................................................................21 6.1.2 系统内服务查看.......................................................................................... 22 ........................................................................................ 28 9.6 运行分析报告报错............................................................................................... 本手册包含了云管理平台的软件架构、部署升级、服务操作、日志、监控、备份等详细 说明。CloudExplorer 云管平台采用微服务架构设计,通过本手册能快速了解 CloudExplorer 云管理平台的基础组件构成这样更方便以后在系统运维中更方便的去排查 问题、处理问题。解决了部署环境不统一、部署速度慢、遇到问题无从查起等问题。 二、逻辑架构 2.1 组件说明 CloudExplorer 平台采用 docker-compose0 码力 | 29 页 | 0 Bytes | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践2015年加入腾讯科技(深圳)有限公司,机器学习岗位; • 智能推荐系统:神盾推荐项目,2015年7月-2016年5月 • 智能安全系统:机器学习+安全业务,2016年6月-2017年7月 • 智能运维系统:机器学习+业务运维,2017年8月-至今 SPEAKER 01 智能运维场景描述 整体介绍 02 单维时间序列分析 异常检测 03 多维时间序列分析 多维下钻 目录 04 Metis 的研究方向 时间序列异常 • 日志分析异常 • 设备性能异常 分析问题 • 多维下钻分析 • 关联事件分析 • 容量预估分析 解决问题 • 扩容 • 决策 • 调度 • 优化 智能运维学件库 • 可重用 • 可演进 • 可了解 智能运维学件库 智能运维能力框架体系 AIOps 团队角色划分 01 智能运维场景描述 整体介绍 02 单维时间序列分析 异常检测 03 多维时间序列分析 多维下钻 目录 04 Metis 的研究方向 展望未来 单维时间序列分析 海量时间序列 业务场景复杂 规则配置繁琐 1 2 3 时间序列异常检测 如何找到通用的解决方案? 单维时间序列分析 规则类告警策略 最大值告警 最小值告警 波动率告警 单维时间序列分析 无监督异常检测算法 (自编码器) 原始数据 生成数据 单维时间序列分析 无监督异常检测算法0 码力 | 28 页 | 1.88 MB | 1 年前3
CloudExplorer 3.0 用户手册v1.2维人员,通过该手册了解云管平台的用户侧功能及相应的使用场景、操作使用方法。 1.2 阅读对象 应用开发测试人员 应用运维人员 云管平台实施人员 1.3 名词术语 名词 解释 基础架构平台 指为业务系统开发测试、运行提供运行环境资源的各类虚拟化平 台、超融合平台、私有云平台以及公有云平台。 虚拟化平台 指以 VMware 为代表的基于虚拟化技术整合物理机以虚拟机方 式提供资源的平台,除 VMware 操作云平台需要的授权云平台 API 账号。 项目生命周期 指项目从开发测试、投产到系统运维、应用运维的整个过程。 杭州飞致云信息科技有限公司 7 应用系统 由多个应用组成的分布式系统。 应用 指独立部署运行的应用程序。 应用运行环境 支持应用系统运行的各类资源和环境,包括各类基础架构平台的 虚拟机、操作系统、云磁盘、网络、安全组、弹性 IP,负载均衡、 RDS、对象存储、DNS 等。 Machine,指通过软件模拟的具有完整硬件系统功能的、 运行在一个完全隔离环境中的完整计算机系统。在实体计算机中 能够完成的工作在虚拟机中都能够实现。 云磁盘 云硬盘(Elastic Volume Service)是一种为 ECS 等计算服务提 供持久性块存储的服务,通过数据冗余和缓存加速等多项技术, 提供高可用性和持久性,以及稳定的低时延性能。您可以对云硬 盘做格式化、创建文件系统等操作,并对数据做持久化存储0 码力 | 102 页 | 0 Bytes | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践⚫公有云专线与自研互通 ⚫使用公有云服务 ⚫改造较大的搬迁组件上云 ⚫使用云原生PaaS ⚫边上云边改造 CFS 业务上云五部曲 规划 设计 实施 验证 维护 信息收集 需求评估 应用分析 风险分析 上云策略 方案设计 风险应对 上云计划 技术准备 功能测试 性能测试 数据备份 云上部署 业务验证 效果评估 问题优化 正式上云 运营维护 上云各环节注意点 业务上云 资料关系链 OIDB 漫游系统 消息系统 状态系统 群/讨论组 SSO接入 鉴权平台 资料关系链 OIDB 漫游系统 消息系统 状态系统 群/讨论组 SSO接入 鉴权平台 资料关系链 OIDB 漫游系统 消息系统 状态系统 华北云 华东云 深圳自研 群/讨论组 SSO接入 鉴权平台 资料关系链 OIDB 漫游系统 消息系统 状态系统 广州云 华南地区 QQ三地混合云0 码力 | 26 页 | 2.39 MB | 1 年前3
Zadig 产品使用手册生态开放:广泛开放系统 模块和 OpenAPI ,链接 一切流程、服务、工具和 上下游伙伴 安全简单自主可控:私有化 部署,现有服务 0 迁移成本 、体验丝滑接入容易、学习 使用门槛极低 现存做法大多以「单点工具 + 写脚本」或运管类平台为主, Zadig 则是面向开发者视角,中立,云原生一体化价值链平台。 与现存 DevOps 方案对比: 现存方案 典型代表 方案特点分析 Zadig 赋能开发、员工成就感高 碎片化:手工协作 + 复杂工具链 工程化:一个平台 一键发布 工作流、环境配置自动更新、高 效调试、消除手工操作、精准快 速迭代、研发生产力 / 幸福感提 升 自助运行、系统化管理、自动化 程度高、测试有效性提升、质量 有保障、横向赋能、技能提升 随时调用工程基线提供的能力、 产品视角开发交付、团队高效协 同、稳定迭代 产研数字化过程数据透明、关键 指标易抽取、有能力合理调动资 工作流更新环境进行集成验证 包括步骤:构建 -> 部署 sit 环境 -> 接口测试 -> IM 通知 Sprint 发布 需求开发 变更发布 产品规划 测试验证 自动化测试——测试结果分析 Sprint 发布 需求开发 变更发布 产品规划 测试验证 uat 发布——执行 uat 工作流做预发布验证 步骤包含:质量门禁 -> 构建 ->nacos 变更 -> 部署 uat0 码力 | 52 页 | 22.95 MB | 1 年前3
共 16 条
- 1
- 2













