爱奇艺 CDN 运维平台实践-张强## 爱奇艺CDN运维平台实践 ## 张强 爱奇艺基础架构部 研发总监 全球技术领导力峰会 ## 500+高端科技领导者与你一起探讨 技术、管理与商业那些事儿 2019年6月14–15日 上海圣诺亚皇冠假日酒店  ![Ima S Package Manager、工具链等模块的设计与研发工作 2014年加入爱奇艺,主导了CDN数据平台、CDN调度平台、CDN运维平台研发上线,目前负责CDN相关产品开发和运维工作 ## 目录 01 爱奇艺CDN概况 02 运维痛点分析 03 运维平台架构设计 04 平台应用&实践 05 总结&展望 ## 01 爱奇艺CDN概况 数据增长趋势 节点分层策略 ## 02 运维痛点总结 软件配置管理 运维数据统计 CDN设备管理 ## 运维痛点-软件配置 连通性 不可保证 状态 不可预知 ## 周期 不可预估 ## 运维痛点-数据统计 CNC CT CMNET GWBN SCC IPTV SSH-Based-Tools 数据统计、展示 收集代理 HDFS 实时性差 迭代低效 开发繁琐 ## 运维痛点-设备管理0 码力 | 34 页 | 1.75 MB | 2 年前3
新浪Redis运维实践新浪Redis运维实践 赵景波 新浪网高级DBA ’ alt=‘OCR图片’/> 自我介绍 Oracle/MySQL/NoSQL DBA 2015年加入新浪数据库平台 热爱开源DB内部原理探究 微博:@zbdba ’ alt=‘OCR图片’/> 大纲 新浪数据库平台概览 精细化运维 Redis Cluster Proxy ’ alt=‘OCR图片’/> 大纲 新浪数据库平台概览 精细化运维 Redis Proxy ’ alt=‘OCR图片’/> 新浪数据库平台概览 平台规模: 1000亿+ hits/天 15个IDC数据中心 1200+物理机器 7000+实例 重要业务: ’ alt=‘OCR图片’/> 大纲 新浪数据库平台概览 精细化运维 Redis Cluster Proxy ’ alt=‘OCR图片’/> 精细化运维 基础服务: 服务高可用 监控报警 服务化 细化服务: 成本优化 成本优化 数据支撑 ’ alt=‘OCR图片’/> 精细化运维 基础服务: 服务高可用 监控报警 服务化 细化服务: 成本优化 数据支撑 ’ alt=‘OCR图片’/> 精细化运维 部署架构 Redis单机 Redis Cluster Redis Tribe ’ alt=‘OCR图片’/> 精细化运维 高可用-Sentinel 一个sentinel集群,17sentinel节点,分布于0 码力 | 41 页 | 4.90 MB | 1 月前3
高效智能运维[云+社区技术沙龙第29期] - 蓝鲸研发运维技术PaaS体系实践-张敏CI CD CO ## 支撑着半个腾讯的技术运营体系——蓝鲸PaaS 承载数百款腾讯业务 管控数十万台服务器 全球多云 管控 培养数百蓝鲸运维开发 孵化700+ 应用系统 腾讯蓝鲸智云,简称蓝鲸,是腾讯互动娱乐事业群(Interactive Entertainment Group,简称IEG)自用的一套用于构建企业研发运营一体化体系的PaaS开发框架,提供了aPaaS(DevOps 流水线、运行环境托管、前后台框架)和iPaaS(持续集成、CMDB、作业平台、容器管理、数据平台、AI等原子平台)等模块,帮助企业技术人员快速构建基础运营PaaS。 腾讯蓝鲸智云秉承开放共赢的理念,以改变中国运维行业为起点,致力于推动国内企业借助研发运营一体化,低成本实现企业IT经营管理模式升级和自主化。 ## 蓝鲸目前在腾讯应用情况及发展方向  数据化 2015--2017 数据驱动运维:基于大数据的接入、存储、分析技术,对运维数据进行全面挖掘和分析,实现数据驱动自动化运维。  ## QCon 北京 ## 全球软件开发大会 大会:5月6–8日 培训:5月9–10日 QCon ,专注监控平台研发工作 8 年,研究过市场上数十家厂商的监控平台产品,对 DevOps 和监控平台有比较深入的了解。目前负责京东物流火眼监控平台的架构设计和开发工作。 ## 目录 ●业界智能运维发展现状及趋势 智能运维体系建设方法论 ●大规模实时监控平台的实践方案 ●智能故障定位与处理实践 ● APM 在京东物流的落地实践 智能运维(AIOps)落地规划 ## 业界智能运维发展趋势 阶段 阶段 7: 智能化、AIOps 阶段6: 数据化 阶段 5: 自动化、平台化 阶段4:服务驱动 阶段 3: 主动的、优化的 阶段 2: 被动的、孤立的 阶段1: 混乱的、无序的 基于智能算法的监控、运维,挖掘数据价值,智能处理 将来 精细化、全方位的数据积累,使用大数据处理方式处理数据资产、全方位的数据分析 现在 问题定位自动化、变更处理流程化,管理操作规范化0 码力 | 41 页 | 3.52 MB | 2 年前3
2.5 高步双 Go在小米商城运维平台的应用与实践GO在小米商城运维平台的应用与实践 高步双 ’ alt=‘OCR图片’/> 小米商城运维:忆往昔 大大小小的业务项目繁多 需求多,运维被动,被业务牵着走 业务混部,问题难以排查,容量难以评估 运维工具级别:puppet、salt stack ’ alt=‘OCR图片’/> MAE(小米商城应用引擎) 小米商城运维团队基于docker自研的私有云PaaS平台,目的是解决传统混部在资源管理、 identity: 协议包序列号。 body-size: 用户数据长度。 ’ alt=‘OCR图片’/> 踩过的坑 docker daemon进程内存泄露(pkg/ioutils/readers.go): 运维标准:应用程序日志 踩过的坑 docker stop 命令夯死问题(daemon/container.go): // 1. Send a SIGTERM if err := container return nil } 超时 新增:重置容器状态,强制退出。 消息chan未正常close,无限等待。 GO在小米商城研发中的应用 ’ alt=‘OCR图片’/> 混合云 资源精细化运维 ’ alt=‘OCR图片’/> stormgbs Thanks!0 码力 | 31 页 | 7.25 MB | 1 月前3
运维上海2017-分布式数据库系统TiDB在Kubernetes平台的自动化运维实践-邓栓## 分布式数据库系统 TiDB 在 Kubernetes 平台的自动化运维实践 邓栓 PingCAP SRE 工程师 ## QCon 全球软件开发大会 10⽉17-19⽇上海·宝华万豪酒店  扫码锁定席位 ## 九 折即将结束 团购还享更多优惠,折扣有效期至9月17日 扫描右方二维码即可查看大会信息及购票  如果在使用过程中遇到任何问题,可联系大会主办方,欢迎咨询! 微信:qcon-0410 电话:010-84782011 项目实践## 云+社区技术沙龙 ## 腾讯智能运维(Metis)项目实践 张戎 机器学习高级研究员  张戎 腾讯云高级研究员 ## 张戎 腾讯云 云服务平台部 机器学习高级研究员 • 2015年毕业于新加坡国立大学数学专业,获博士学位; -2017年7月 • 智能运维系统:机器学习+业务运维,2017年8月-至今 ## 目录 01 / 智能运维场景描述 整体介绍 02 / 单维时间序列分析 异常检测 03 / 多维时间序列分析 多维下钻 04 / Metis 的研究方向 展望未来 ## 基于机器学习的智能运维 ## 智能运维(AIOps) 












