高效智能运维[云+社区技术沙龙第29期] - ServerlessOps云+社区技术沙龙 Serverless Ops 孔令飞 腾讯云架构师 个人简介 2013 Red Hat: 虚拟化技术 Xen、KVM 的测试 2015 联想云: KVM 研发 2016 加入腾讯:容器平台 (docker + k8s) & 微服务的架构和研发 2019 腾讯云 Serverless 产品架构师 核心诉求 Application Application Architecture0 码力 | 32 页 | 4.85 MB | 1 年前3
从十到千,响应团队规模的敏捷与DevOps实践-冯斌从十到千,响应团队规模的敏捷与DevOps实践-冯斌0 码力 | 27 页 | 8.15 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践云+社区技术沙龙 腾讯智能运维(Metis)项目实践 张戎 机器学习高级研究员 张戎 腾讯云 云服务平台部 机器学习高级研究员 • 2015年毕业于新加坡国立大学数学专业,获博士学位; • 2015年加入腾讯科技(深圳)有限公司,机器学习岗位; • 智能推荐系统:神盾推荐项目,2015年7月-2016年5月 • 智能安全系统:机器学习+安全业务,2016年6月-2017年7月 • 告警收敛 事件与事件,事件与时序,时序与时序 日志分析 日志模板提取,日志异常检测,日志聚类分析 腾讯 Metis 智能运维方向 发现问题 分析问题 解决问题 THANKS 关注云加社区公众号0 码力 | 28 页 | 1.88 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践云+社区技术沙龙 冲上云霄—腾讯海量业务上云实践 腾讯云高级工程师 黄宏东 自我介绍 ⚫ 业务开发出身的运维 ⚫ 先后在腾讯负责游戏、安全、医疗类业务运维 ⚫ 经历数年业务爆量、成本优化、业务上云、智能运维等重点项目 ⚫ 目前负责腾讯自研业务的运维与上云工作 01 腾讯业务为什么要上云 02 业务上云的价值 03 如何上云 目录 04 上云案例分享 腾讯业务为什么要上云 桥头堡 存储转发 存储转发 存储转发 存储转发 存储转发 存储转发 业务读SET dispatch 业务读SET dispatch 上海云 深圳自研 广州云 云原生 开发方法 敏捷开发、DevOps 团队 协作式DevOps团队 交付周期 短且持续 应用架构 微服务,基于API的通信 基础架构 以容器为中心 部署可预测性 可预测 弹性能力 弹性调度 恢复能力 自动化运维,快速恢复 ⚫ 借上云革新研发模式,全面DevOps(CI/CD/CO) ⚫ 组件&工具上云,服务化,培育工程师文化 ⚫ 开源生态,合作共享 ⚫ 云基础设施经受海量业务的锤炼 THANKS 关注云加社区公众号0 码力 | 26 页 | 2.39 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏测试数据 作业平台 标准运维 嘉为蓝鲸研运一体化门户 开发门户 测试门户 运维门户 项目经理门户 管理者门户 代码管理 流水线引擎 代码扫描 制品管理 自动化测试 度量数据 第三方工具 敏捷协同 集成平台 、ESB + API网关 配置平台 作业平台 数据平台 容器平台 数据平台 挖掘平台 …… 管控平台 嘉为蓝鲸CD:ITOM融合的统一运维解决方案 运维服务总线API Gateway、运维流程编排引擎0 码力 | 26 页 | 8.25 MB | 1 年前3
高效智能运维[云+社区技术沙龙第29期] - 腾讯云提高K8S集群资源利用率实践云+社区技术沙龙 腾讯云提高K8S集群资源利用率实践 庄鹏锐 腾讯云高级工程师 资源利用率分析 Node节点资源碎片 Pod Resource(requests)配置不合理 WorkLoad/HPA 副本数设置不合理 业务空闲时间 解决方案 Pod 压缩 Node 超卖 HPA VPA 动态 调度 碎片 处理 Pod 资源压缩 • MutatingAdmission requets 和 limit 比例设置 • Resource Range设置 • CheckPoint对象timeout时间 • Pod对象更新时间 ` • 资源合法性校验 THANKS 关注云加社区公众号0 码力 | 10 页 | 1.39 MB | 1 年前3
Zadig 面向开发者的云原生 DevOps 平台工程师不再花时间在开发写代码之外的脏活累活,比如服务部署、找环境,服务编排等 Infra 的事情。 1 0 0 % 开 源 基 本 能 力 开 源 1.5 个月核心重构 65% 功能实现开源 支撑开源社区开发者环境 易 用 性 增 强 接入:安装 10 分钟以内,成功率达 90% 集成环境:支持开发者 Remote debug 工作流:效率和性能、开发者体验提升 贡献者流程建立 开 放 社 区 搭 建 2021 年 5 月 2021 年 7 月 2021 年 9 月 2021 年 11 月 2021 年 12 月 1 个月功能改造 90% 功能实现开源 技术社区雏形搭建 2022 年 3 月 生态伙伴工具 + Zadig Zadig 企业交付案例场景深化 开 发 者 场 景 挖 掘 3-5 个领域敏感型场景 建立产品发展委员会 贡献者流程优化 现存方案 典型代表 方案特点分析 Zadig 方案优势 传统 Jenkins 方案 GitLab + Jenkins + 脚本化 运行效率低,管理维护成本高 方案局限性大,安全性风险高 无法支持敏捷交付模式;手工维护成本 高,阻碍业务交付效率 面向多服务并行部署,安全发布, 0 维护负担 支撑云原生构建 / 运行环境,多云异构支持及企业 级登录权限支持 传统运维管理类平台 蓝鲸 Rainbond0 码力 | 59 页 | 81.43 MB | 1 年前3
Zadig 面向开发者的云原生 DevOps 平台功能实现开源 支撑开源社区开发者环境 易 用 性 增 强 接入:安装10分钟以内,成功率达 90% 集成环境:支持开发者 Remote debug 工作流:效率和性能、开发者体验提升 贡献者流程建立 开 放 社 区 搭 建 2021年5月 2021年7 月 2021年9 月 2021年11 月 2021年12 月 1 个月功能改造 90% 功能实现开源 技术社区雏形搭建 2022年3月 现存方案 典型代表 方案特点分析 Zadig 方案优势 传统 Jenkins 方案 GitLab + Jenkins + 脚本化 运行效率低,管理维护成本高 方案局限性大,安全性风险高 无法支持敏捷交付模式;手工维护成本高, 阻碍业务交付效率 面向多服务并行部署,安全发布,0 维护负担 支撑云原生构建/运行环境,多云异构支持及企业 级登录权限支持 传统运维管理类平台 蓝鲸 Rainbond 差”极不稳定,总被其他人干扰 测试同时验证多个分支,集成合并冲突不断,自 动化测试遥遥无期,测试全靠人工验证 运维无脑排障、重启、删节点,沦为工具人…… “ “ ” ” 一系列问题(来自社区的声音): 1. 业务边界清晰 2. 权限得到控制 3. 环境公开透明 4. 更新过程可追溯 Zadig — 托管项目方案 演示-> 环境治理场景:数千开发者、5 条业务线、多分支多环境协作0 码力 | 59 页 | 23.57 MB | 1 年前3
Zadig 产品使用手册典型代表 方案特点分析 Zadig 优势 传统 Jenkins 方案 GitLab + Jenkins + 脚本化 运行效率低,管理维护成本高 方案局限性大,安全性风险高 无法支持敏捷交付模式 支持从需求到发布全流程敏捷交付。尤其面向 多服务并行部署发布,云原生构建环境和运行 环境,基础设施对接及企业级 SSO/ 权限管理 等 运维管理类平台 蓝鲸 Rainbond KubeSphere 云原生环境 对接需求管理 测试管理 Spinnaker Jenkins Rancher JMeter Sonar Tekton Jenkins KubeSphere 1 、 敏捷协作方案介绍 持续集成 (CI) -> 持续交付 (CD) -> 持续部署 (CD) -> 持续运营 (CO) 质量右移 质量左移 软件研发核心工程实践:基于质量工程的持续交付体系( CI/CD0 码力 | 52 页 | 22.95 MB | 1 年前3
Zadig 产品使用手册典型代表 方案特点分析 Zadig 优势 传统 Jenkins 方案 GitLab + Jenkins + 脚本化 运行效率低,管理维护成本高 方案局限性大,安全性风险高 无法支持敏捷交付模式 支持从需求到发布全流程敏捷交付。尤其面向 多服务并行部署发布,云原生构建环境和运行 环境,基础设施对接及企业级 SSO/权限管理等 运维管理类平台 蓝鲸 Rainbond KubeSphere KubeVela 高并发工作流 云原生环境 对接需求管理 测试管理 Spinnaker Jenkins Rancher JMeter Sonar Tekton Jenkins KubeSphere 1、 敏捷协作方案介绍 持续集成(CI) -> 持续交付(CD) -> 持续部署(CD) ->持续运营(CO) 质量右移 质量左移 软件研发核心工程实践:基于质量工程的持续交付体系(CI/CD、CO、CT、CS)0 码力 | 52 页 | 16.27 MB | 1 年前3
共 13 条
- 1
- 2













