高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏支撑着半个腾讯的技术运营体系——蓝鲸PaaS 腾讯蓝鲸智云,简称蓝鲸,是腾讯互动娱乐事业群(Interactive Entertainment Group,简称IEG)自用的一套用于 构建企业研发运营一体化体系的PaaS开发框架,提供了aPaaS(DevOps流水线、运行环境托管、前后台框架)和 iPaaS(持续集成、CMDB、作业平台、容器管理、数据平台、AI等原子平台)等模块,帮助企业技术人员快速构建基 孵化700+ 应用系统 全球多云 管控 培养数百蓝鲸运 维开发 工具驱动运维:采用运维 开发的模式,实现所有运维任 务自动化、工具化、可视化。 数据驱动运维:基于大数据 的接入、存储、分析技术,对运 维数据进行全面挖掘和分析,实 现数据驱动自动化运维。 机器驱动运维:基于智能算法 的机器自我学习,训练机器智能运 维模型,实现无人值守和智能的运 维与运营。 数据化 2015--2017 出来。 所使用的开发语言、开发框架、操作系统、数据库等技术, 是没有直观规律的。 开发商很难为了运维体系而对架构或技术做大规模的修改。 有几乎所有的业务类型 有几乎所有的流行技术 300多款游戏相互之间是没有关系的。 发布变更、故障处理等运维操作场景和操作流程是没有直 观规律的。 服务器数量,也就是操作单元,有二十余万。 随着容器技术的普及,操作单元的数量还会暴涨。 所有业务之间无关联0 码力 | 26 页 | 8.25 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - ServerlessOps云+社区技术沙龙 Serverless Ops 孔令飞 腾讯云架构师 个人简介 2013 Red Hat: 虚拟化技术 Xen、KVM 的测试 2015 联想云: KVM 研发 2016 加入腾讯:容器平台 (docker + k8s) & 微服务的架构和研发 2019 腾讯云 Serverless 产品架构师 核心诉求 Application Application Architecture0 码力 | 32 页 | 4.85 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践云+社区技术沙龙 腾讯智能运维(Metis)项目实践 张戎 机器学习高级研究员 张戎 腾讯云 云服务平台部 机器学习高级研究员 • 2015年毕业于新加坡国立大学数学专业,获博士学位; • 2015年加入腾讯科技(深圳)有限公司,机器学习岗位; • 智能推荐系统:神盾推荐项目,2015年7月-2016年5月 • 智能安全系统:机器学习+安全业务,2016年6月-2017年7月 •0 码力 | 28 页 | 1.88 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践云+社区技术沙龙 冲上云霄—腾讯海量业务上云实践 腾讯云高级工程师 黄宏东 自我介绍 ⚫ 业务开发出身的运维 ⚫ 先后在腾讯负责游戏、安全、医疗类业务运维 ⚫ 经历数年业务爆量、成本优化、业务上云、智能运维等重点项目 ⚫ 目前负责腾讯自研业务的运维与上云工作 01 腾讯业务为什么要上云 02 业务上云的价值 03 如何上云 目录 04 上云案例分享 腾讯业务为什么要上云 重复造轮子,每个部门一套轮子 ⚫ 缺乏统一规范,包括开源代码在内 Bug 多 ⚫ 开源文化落后,共享精神差,很多基础框架没有内部开源 ⚫ 技术支持不足,文档陈旧 ⚫ 数据技术不互通,部门间代码相互封闭,跟业界缺乏交流 ⚫ 缺乏维护,越来越多的历史遗留组件 ⚫ 没有技术图谱 2018年930变革 开源协同 自研上云 代码开源 相互协同 基于公有云模式研发 组件框架上云,成为云服务 将 ⚫使用云原生PaaS ⚫边上云边改造 CFS 业务上云五部曲 规划 设计 实施 验证 维护 信息收集 需求评估 应用分析 风险分析 上云策略 方案设计 风险应对 上云计划 技术准备 功能测试 性能测试 数据备份 云上部署 业务验证 效果评估 问题优化 正式上云 运营维护 上云各环节注意点 业务上云 测试 方案 迁移 混合 质量 功能、性能测试,云上云下对比0 码力 | 26 页 | 2.39 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践云+社区技术沙龙 腾讯云提高K8S集群资源利用率实践 庄鹏锐 腾讯云高级工程师 资源利用率分析 Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间 解决方案 Pod 压缩 Node 超卖 HPA VPA 动态 调度 碎片 处理 Pod 资源压缩 • MutatingAdmission0 码力 | 10 页 | 1.39 MB | 1 年前3
CloudExplorer 3.0 用户手册v1.2名词术语 名词 解释 基础架构平台 指为业务系统开发测试、运行提供运行环境资源的各类虚拟化平 台、超融合平台、私有云平台以及公有云平台。 虚拟化平台 指以 VMware 为代表的基于虚拟化技术整合物理机以虚拟机方 式提供资源的平台,除 VMware 外,常见的虚拟化平台有 IBM 的 Power 虚拟化平台、华为的 FusionCompute、FusionSphere 虚拟化平台。 超融合基础架构(Hyper Converged Infrastructure,或简称 “HCI”)是指在同一套单元设备中不仅仅具备计算、网络、存 储和服务器虚拟化等资源和技术,而且还包括备份软件、快照技 术、重复数据删除、在线数据压缩等元素,而多套单元设备可以 通过网络聚合起来,实现模块化的无缝横向扩展(scale-out), 形成统一的资源池。比较知名常见的超融合平台有 Nutanix、戴 尔的 算机中 能够完成的工作在虚拟机中都能够实现。 云磁盘 云硬盘(Elastic Volume Service)是一种为 ECS 等计算服务提 供持久性块存储的服务,通过数据冗余和缓存加速等多项技术, 提供高可用性和持久性,以及稳定的低时延性能。您可以对云硬 盘做格式化、创建文件系统等操作,并对数据做持久化存储 安全组 安全组是一种虚拟防火墙,具备有状态的数据包过滤功能,用于 设置云0 码力 | 102 页 | 0 Bytes | 1 年前3
CloudExplorer 3.0 管理员手册v1.2名词术语 名词 解释 基础架构平台 指为业务系统开发测试、运行提供运行环境资源的各类虚拟化平台、超融 合平台、私有云平台以及公有云平台。 虚拟化平台 指以 VMware 为代表的基于虚拟化技术整合物理机以虚拟机方式提供资源 的平台,除 VMware 外,常见的虚拟化平台有 IBM 的 Power 虚拟化平台、 华为的 FusionCompute、FusionSphere 虚拟化平台。 超融合基础架构(Hyper Converged Infrastructure,或简称“HCI”) 是指在同一套单元设备中不仅仅具备计算、网络、存储和服务器虚拟化等 资源和技术,而且还包括备份软件、快照技术、重复数据删除、在线数据 压缩等元素,而多套单元设备可以通过网络聚合起来,实现模块化的无缝 横向扩展(scale-out),形成统一的资源池。比较知名常见的超融合平台 有 Nutanix、戴尔的 算机中能够完成的工作在 虚拟机中都能够实现。 云磁盘 云硬盘(Elastic Volume Service)是一种为 ECS 等计算服务提供持久性 块存储的服务,通过数据冗余和缓存加速等多项技术,提供高可用性和持 久性,以及稳定的低时延性能。您可以对云硬盘做格式化、创建文件系统 等操作,并对数据做持久化存储 安全组 安全组是一种虚拟防火墙,具备有状态的数据包过滤功能,用于设置云服0 码力 | 308 页 | 0 Bytes | 1 年前3
Red Hat OpenShift GitOps 1.13 了解 OpenShift GitOps如, 如,./must-gather.local.4157245944708210399。 。 3. 从 从刚 刚才 才创 创建的目 建的目录 录中 中创 创建 建压缩 压缩文件。例如,在使用 文件。例如,在使用 Linux 操作系 操作系统 统的 的计 计算机上 算机上运 运行以下命 行以下命 令: 令: 将 将 must-gather-local 4157245944708210399 替 替换为实际 换为实际目 目录 录名称。 名称。 4. 在 在红 红帽客 帽客户门户 户门户中 中为 为您的 您的问题单 问题单附上 附上压缩 压缩文件。 文件。 3.3. 其他 其他资 资源 源 收集有关特定功能的数据 收集有关特定功能的数据 $ oc adm must-gather --image=registry0 码力 | 17 页 | 203.28 KB | 1 年前3
Zadig 面向开发者的云原生 DevOps 平台面向开发者的云原生 DevOps 平台 角色: 产品 / 架构 开发 测试 运维 运维 / 开发 技术支持 事件 需求设计 架构设计 拆任务、写代码 代码集成 xN 单元测试验证 xN 代码扫描 xN 自测、联调 xN 集成验证 xN 写测试用例 系统验证 xN 自动化测试 xN 性能测试 xN 安全测试 xN 数据变更 xN 贡献者流程建立 开 放 社 区 搭 建 2021 年 5 月 2021 年 7 月 2021 年 9 月 2021 年 11 月 2021 年 12 月 1 个月功能改造 90% 功能实现开源 技术社区雏形搭建 2022 年 3 月 生态伙伴工具 + Zadig Zadig 企业交付案例场景深化 开 发 者 场 景 挖 掘 3-5 个领域敏感型场景 建立产品发展委员会 贡献者流程优化 + 云上环境,高效验证调试 安全发布有信心: 一个平台完成日常 90% 工作,开发自助发布 需求研发总耗时降低 30% 需求迭代周期缩短 1-5 倍 解放开发,专注编码 更多的架构和技术提升 测试 效率和质量难以平衡: • 自动化测试难以开展 • 环境不稳定并行验证效率低 • 测试多苦劳,价值难以体现 测试效果提升:独立稳定环境用于测试验收、自动化建设 价值被团队感知:自动化测试从开发到发布被全团队感知0 码力 | 59 页 | 81.43 MB | 1 年前3
Zadig 面向开发者的云原生 DevOps 平台面向开发者的云原生 DevOps 平台 角色: 产品/架构 开发 测试 运维 运维/开发 技术支持 事件 需求设计 架构设计 拆任务、写代码 代码集成 xN 单元测试验证 xN 代码扫描 xN 自测、联调 xN 集成验证 xN 写测试用例 系统验证 xN 自动化测试 xN 性能测试 xN 安全测试 xN 数据变更 xN 代码变更 xN 配置变更 xN 部署测试环境 xN 部署预发环境 工作流:效率和性能、开发者体验提升 贡献者流程建立 开 放 社 区 搭 建 2021年5月 2021年7 月 2021年9 月 2021年11 月 2021年12 月 1 个月功能改造 90% 功能实现开源 技术社区雏形搭建 2022年3月 生态伙伴工具 + Zadig Zadig 企业交付案例场景深化 开 发 者 场 景 挖 掘 3-5 个领域敏感型场景 建立产品发展委员会 贡献者流程优化 自助验证更高效:自动化工作流+云上环境,高效验证调试 安全发布有信心:一个平台完成日常 90% 工作,开发自助发布 需求研发总耗时降低 30% 需求迭代周期缩短 1-5 倍 解放开发,专注编码 更多的架构和技术提升 测试 效率和质量难以平衡: • 自动化测试难以开展 • 环境不稳定并行验证效率低 • 测试多苦劳,价值难以体现 测试效果提升:独立稳定环境用于测试验收、自动化建设 价值被团队感知:自动化测试从开发到发布被全团队感知0 码力 | 59 页 | 23.57 MB | 1 年前3
共 15 条
- 1
- 2













