高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践## 云+社区技术沙龙 ## 腾讯智能运维(Metis)项目实践 张戎 机器学习高级研究员  张戎 腾讯云高级研究员 ## 张戎 腾讯云 云服务平台部 机器学习高级研究员 • 2015年毕业于新加坡国立大学数学专业,获博士学位; 2015年加入腾讯科技(深圳)有限公司,机器学习岗位; - 智能推荐系统:神盾推荐项目,2015年7月-2016年5月 - 智能安全系统:机器学习+安全业务,2016年6月-2017年7月 • 智能运维系统:机器学习+业务运维,2017年8月-至今 ## 目录 01 / 智能运维场景描述 整体介绍 02 / 单维时间序列分析 异常检测 03 / 多维时间序列分析 多维时间序列分析 多维下钻 04 / Metis 的研究方向 展望未来 ## 基于机器学习的智能运维 ## 智能运维(AIOps)  发现问题 - 时间序列异常 · 日志分析异常 · 设备性能异常 分析问题0 码力 | 28 页 | 1.88 MB | 2 年前3
QCon北京2017/智能化运维/Self Hosted Infrastructure:以自动运维 Kubernetes 为例0 码力 | 73 页 | 1.58 MB | 2 年前3
高效智能运维[云+社区技术沙龙第29期] - ServerlessOps Prometheus 业务运维 平台运维 Application  f289/p4_15.jpg) Ceph ## → 系统运维 ## 目录  Serverless 介绍 什么是 Serverless、Serverless 提供的运维能力  Serverless vs. IaaS 运维能力对比 Serverless 和 虚拟机 2 种形态下运维能力对比 ![0 码力 | 32 页 | 4.85 MB | 2 年前3
新浪Redis运维实践新浪Redis运维实践 赵景波 新浪网高级DBA ’ alt=‘OCR图片’/> 自我介绍 Oracle/MySQL/NoSQL DBA 2015年加入新浪数据库平台 热爱开源DB内部原理探究 微博:@zbdba ’ alt=‘OCR图片’/> 大纲 新浪数据库平台概览 精细化运维 Redis Cluster Proxy ’ alt=‘OCR图片’/> 大纲 新浪数据库平台概览 精细化运维 Redis 大纲 新浪数据库平台概览 精细化运维 Redis Cluster Proxy ’ alt=‘OCR图片’/> 精细化运维 基础服务: 服务高可用 监控报警 服务化 细化服务: 成本优化 数据支撑 ’ alt=‘OCR图片’/> 精细化运维 基础服务: 服务高可用 监控报警 服务化 细化服务: 成本优化 数据支撑 ’ alt=‘OCR图片’/> 精细化运维 部署架构 Redis单机 Redis Redis Cluster Redis Tribe ’ alt=‘OCR图片’/> 精细化运维 高可用-Sentinel 一个sentinel集群,17sentinel节点,分布于南北共9个数据中心,监控500+个端口,1000+实例。 IDC 数量 北方IDC1 2 北方IDC2 1 北方IDC3 2 北方IDC4 3 北方IDC5 3 北方IDC6 1 北方IDC70 码力 | 41 页 | 4.90 MB | 1 月前3
高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏CI CD CO ## 支撑着半个腾讯的技术运营体系——蓝鲸PaaS 承载数百款腾讯业务 管控数十万台服务器 全球多云 管控 培养数百蓝鲸运维开发 孵化700+ 应用系统 腾讯蓝鲸智云,简称蓝鲸,是腾讯互动娱乐事业群(Interactive Entertainment Group,简称IEG)自用的一套用于构建企业研发运营一体化体系的PaaS开发框架,提供了aPaaS(DevO 腾讯蓝鲸智云秉承开放共赢的理念,以改变中国运维行业为起点,致力于推动国内企业借助研发运营一体化,低成本实现企业IT经营管理模式升级和自主化。 ## 蓝鲸目前在腾讯应用情况及发展方向  自动化 2008--2015 工具驱动运维:采用运维开发的模式,实现所有运维任务自动化、工具化、可视化。 数据驱动运维:基于大数据的接入、存储、分析技术,对运维数据进行全面挖掘和分析,实现数据驱动自动化运维。  智能化 2017—现在 机器驱动运维:基于智能算法的机器自我学习,训练机器智能运维模型,实现无人值守和智能的运维与运营。 ##0 码力 | 26 页 | 8.25 MB | 2 年前3
基于 APM 的智能运维体系在京东物流的落地和实践-付正全## 基于APM的智能运维体系在京东物流的落地和实践 ## 付正全 京东物流 架构师 ## 极客邦科技 会议推荐2019  ## QCon 北京 ## 全球软件开发大会 大会:5月6–8日 培训:5月9–10日 QCon c8bb8582c/p2_11.jpg) 12月 GITC 深圳 ## 全球大前端技术大会 大会:11月8–9日 培训:11月10–11日 ## AiCon 北京 ## 全球人工智能与机器学习大会 大会:11月21–22日 培训:11月23–24日 ## 自我介绍 落地规划 ## 业界智能运维发展趋势 阶段 7: 智能化、AIOps 阶段6: 数据化 阶段 5: 自动化、平台化 阶段4:服务驱动0 码力 | 41 页 | 3.52 MB | 2 年前3
Rainbond安装与运维原理解读## RAINBOND安装与运维 ——原理经验分享 好雨交付工程师-郭逊 ## 大纲 1. Rainbond安装与运维原理解读 1.1 安装原理 1.2 集群运维原理 2. Rainbond安装与运维经验分享 2.1 常见安装问题的排查 2.2 集群运维问题的排查 ## 写在前面 我们的培训课件PPT,在未来会越来越短,这是为什么呢? 1. 我不擅长写PPT 2. 我司升职不靠写PPT 最重要的是:我们认为,我们应该把我们产品的原理、使用经验技巧、遇到问题排查思路全部沉淀在文档中。通过引导用户阅读文档,传输我们的产品理念、复制我们的运维能力、让用户真正掌控RAINBOND这款产品。 ### 1. RAINBOND安装与运维原理解读 ### 1.1 安装原理 Rainbond安装与运维原理解读文档 https://www.rainbond.com/docs/user-operations/install/install-d/ 安装完成后,服务是怎么运行起来的,以什么样的方式,配置怎么修改能生效健康检测的机制是什么样的,失败了会怎么样等等运维问题 ### 1. RAINBOND安装与运维原理解读 1.1 安装原理 我除了会详细的讲解这篇文档,而且会以一个资深RAINBOND运维工程师的角度,随时补充文档中没有体现的干货哦~~ ### 1. RAINBOND安装与运维原理解读 干货列表 1. 同一个节点可以复用哪些属性 2. 服务组件依赖关系0 码力 | 12 页 | 311.60 KB | 2 年前3
高效智能运维[云+社区技术沙龙第29期] - 冲上云霄—腾讯海量业务上云实践## 云+社区技术沙龙 ## 冲上云霄—腾讯海量业务上云实践 腾讯云高级工程师 黄宏东 ## 自我介绍 业务开发出身的运维 - 先后在腾讯负责游戏、安全、医疗类业务运维 - 经历数年业务爆量、成本优化、业务上云、智能运维等重点项目 - 目前负责腾讯自研业务的运维与上云工作 ## 目录 01 / 腾讯业务为什么要上云 02 / 业务上云的价值 03 / 如何上云 04 / 上云案例分享 协作式DevOps团队 运维开发&应用开发 交付周期 短且持续 每天可交付数十次 应用架构 微服务,基于API的通信 TSF, Service Mesh 基础架构 以容器为中心 K8S (TKE) 部署可预测性 可预测 K8S (TKE) 弹性能力 弹性调度 K8S(TKE)+业务画像 恢复能力 自动化运维,快速恢复 K8S (TKE)0 码力 | 26 页 | 2.39 MB | 2 年前3
CloudExplorer 3.0 部署运维手册v1.2FIT2CLOUD 飞致云 杭州飞致云信息科技有限公司 # CloudExplorer 云管理平台 # 部署运维手册 版本(v1.2) FIT2CLOUD 飞致云 杭州飞致云信息科技有限公司 2022年4月 ## 目录 一、概述 ..... 4 二、逻辑架构 ..... 4 2.1 组件说明 ..... 4 2.1.1 依赖组件 ..... 4 2.1.2 基础模块 本手册包含了云管理平台的软件架构、部署升级、服务操作、日志、监控、备份等详细说明。CloudExplorer 云管平台采用微服务架构设计,通过本手册能快速了解 CloudExplorer 云管理平台的基础组件构成这样更方便以后在系统运维中更方便的去排查问题、处理问题。解决了部署环境不统一、部署速度慢、遇到问题无从查起等问题。 ## 二、 逻辑架构 ### 2.1 组件说明 CloudExplorer 平台采用 docker-compose0 码力 | 29 页 | 0 Bytes | 2 年前3
爱奇艺 CDN 运维平台实践-张强## 爱奇艺CDN运维平台实践 ## 张强 爱奇艺基础架构部 研发总监 全球技术领导力峰会 ## 500+高端科技领导者与你一起探讨 技术、管理与商业那些事儿 2019年6月14–15日 上海圣诺亚皇冠假日酒店  












