22-云原生的缘起、云原生底座、PaaS 以及 Service Mesh 等之道-高磊如果业务系统要升级,如何平滑升级?万一升级失败是 否能够自动回滚?整个过程线上业务持续运行不中断。 传统稳态业务环境难以高效承载敏态应用 发现故障 (假死) 创建 新实例 配置 运行环境 部署当前 应用版本 添加 监控 配置 日志采集 测试确认 服务正常运行 实例 加入集群 恢复正常 场景 1 如果生产中一台Web应用服务器故障,恢复这台服务器需要 做哪些事情? 场景 2 如果应用负载升高/降低,如何及时按需扩展/收缩所用 如果业务系统要升级,如何平滑升级?万一升级失败是 否能够自动回滚?整个过程线上业务持续运行不中断。 传统稳态业务环境难以高效承载敏态应用 发现故障 (假死) 创建 新实例 配置 运行环境 部署当前 应用版本 添加 监控 配置 日志采集 测试确认 服务正常运行 实例 加入集群 恢复正常 工作量 成本 新一代架构(微服务)应用的对承载平台提出新要求 传统实践中,主要采用虚机/物理机+Sprin 用容器技术 微服务 微服务架构成为 主流,八成用户 已经使用或者计 划使用微服务 Serverless Serverless技术显 著升温,近三成 用户已在生产环 境中应用 云原生对业务的支撑实例(数据来源于阿里云) 4982亿,2020年天猫双11再创消费新纪录。58.3万笔/秒,双11交易峰值再创新高,阿里云又一次扛住全球最大规模流量洪峰。这一切背后支撑的 “技术引擎”又是如何为近十亿全球购物者的狂欢提供着“无感知护航”?0 码力 | 42 页 | 11.17 MB | 6 月前3
36-云原生监控体系建设-秦晓辉指标生命周期变短 •微服务的流行,要监控的服务数量大幅增长,是之前的指标数量十倍都不止 •广大研发工程师也更加重视可观测能力的建设,更愿意埋点 •各种采集器层出不穷,都是本着可采尽采的原则,一个中间件实例动辄采集几千个指标 指标数量大幅增长 •老一代监控系统更多的是关注机器、交换机、中间件的监控,每个监控对象一个标识即可,没有维度的设计 •新一代监控系统更加关注应用侧的监控,没有维度标签玩不转,每个指标动辄几个、十几个标签 Kubernetes apiserver 的 proxy 接口,抓取各个node(即kubelet)的 /metrics/cadvisor 接口的 prometheus 协议的数据 • 这个抓取器只需要部署一个实例,调用 apiserver 的接口即可,维护较为简单,采集频率可以调的稍大,比 如30s或60s • 所有的拉取请求都走 apiserver,如果是几千个node的大集群,对 apiserver 可能会有较大压力 中心端统一采集:不同的中间件,可以分别使用不同的采集器实例(相当于根据中间件类型做抓取器的分片), 每次部署了一个新的中间件实例,就来这个中心配置的地方,增加一条新的采集规则,或者使用服务发现的方式, 把中间件实例注册到注册中心,由抓取器统一去注册中心拉取实例列表。这就要求,各个实例的认证信息都得一 致,没有个性化配置,要不然处理起来就略麻烦了 • 中间件实例的监控数据采集其实还是次要的,关键是采集哪些指0 码力 | 32 页 | 3.27 MB | 6 月前3
构建统一的云原生应用 可观测性数据平台看云网更清晰 Simplify the growing complexity. 数据打通并不简单 ① Trace与「非Request scope」的Metrics 例如:响应Request A的实例在一段时间内做了多少次GC? ① 看云网更清晰 Simplify the growing complexity. 数据打通并不简单 ② 应用、系统、网络的Metrics之间 例如:某个Ser App,Sidecar,Node,KVM,NFVGW? ⑥ 看云网更清晰 Simplify the growing complexity. 我们需要哪些Tag?OpenTelemetry的答案 服务属性 代码属性 实例属性 请求属性 业务属性 看云网更清晰 Simplify the growing complexity. 混合云环境下的资源属性还有哪些 HOST KVM KVM VM L2GW、OvS • 将所有标签编码为Int • Controller向Agent下发编码后的Int标签 • 仅向Agent下发最少的标签 • 标签的“基” • 如何选择基 • VPC:多租户环境下,与IP决定实例、服务 看云网更清晰 Simplify the growing complexity. Stage-2:存储时的编码 • Controller同步云API、K8s apiserver • 将所有标签编码为Int0 码力 | 35 页 | 6.75 MB | 1 年前3
23-云原生观察性、自动化交付和 IaC 等之道-高磊得可以对应不同交付 场景所要求的不同工具链。比如叠加serverless能力加快镜像构建速度、叠加安全左移能力等等。 OAM使得整体PAAS在通用化的情况下,向多种客户环境交付赋能。 OAM应用实例 从基础设施,到容器运行环境,再到应用都可以加入编排,想要在K8s上编排一切并不是容易的事情,通常一个应用,除了本身的容器之外还有许 多的依赖,常见的依赖有RDS,LB,MNS(SNS,SQS)等这 比如K8S的Yaml,这种方式有利于隔离实现细节。 ITIL 需要具体学习不同软 硬件的知识才能管理 只需要写IaC声明性代码来管 理基础设施 实施 标准化能力-让管理和运维更轻松-基础设施即代码-3-实例 IaC作为胶水,可以将对物理资源的运维直接透出到DevOps-CICD中,可以对底层资源进行云原生式的管理 DevOps是一种文化,使 得研发更加向生产环境 拉进,对于底层资源的 管理,IaC化后,也可以0 码力 | 24 页 | 5.96 MB | 6 月前3
云原生安全威胁分析与能力建设白皮书(来源:中国联通研究院)安 全防护体系建设实践。 过去一年来,我们持续深耕云原生安全领域,联合多家单位共同编写了《云 原生安全威胁分析与能力建设白皮书》。白皮书从攻击者视角介绍了云原生所面 临的安全威胁,通过具体的实例展现攻击过程,给出云原生应用保护能力建设思 路,以期与行业同仁共同推动云原生安全落地发展。 最后,白皮书内容难免有疏漏,敬请读者批评指正。 云原生安全威胁分析与能力建设白皮书 8 编写单位: 在的进程、文件、网络等多个方面。 4.2.3 网络微隔离 云原生环境中应用微服务化大幅增加了内部网络流量和服务通信端口总量, 东西向流量呈指数级增加,增加了安全监控和保护的难度。由于云原生自身资源 池化,一个主机实例背后可能存在几十上百个容器,传统基于 IP 的安全策略不 再适用云原生环境,且业务容器接受编排系统的动态调度,传统 IP 的隔离策略 也极难适应这种持续的动态变化。 (1)流量识别统计能力0 码力 | 72 页 | 2.44 MB | 1 年前3
开源多集群应用治理项目Clusternet 在多点生活的云原生实践行状态收集 应用维护,日志 查看,故障排查 应用发布 Operator API • 对使用方屏蔽多单元、多集群的存在 • 提供简单的、无需运维介入的日常维护功能 • 结合监控,可以查看每个实例的运行情况 • 支持离线日志查看,减少对容器的理解 迭代历程 2017~2019 • 基于Helm包管理 • K8S java 客户端 • CI/CD流程耦合 2019~2020 • 使用0 码力 | 22 页 | 17.18 MB | 1 年前3
云原生微服务最佳实践• 自动化回归 • 流量录制 • 流量回放 • 无损上下线 • 服务预热 • 金丝雀发布 • A/B Test • 全链路灰度 • 服务鉴权 • 漏洞防护 • 配置鉴权 • 离群实例摘除 • 限流降级 • 同AZ优先路由 • 就近容灾路由 • 服务巡检 • 标签路由 • 服务超时和重试 基础治理能力 高阶治理能力 日常环境隔离最佳实践 交易中心 购物车 mse-tag:base0 码力 | 20 页 | 6.76 MB | 1 年前3
2.2.7 云原生技术在2B交付中的实践基础云原⽣应⽤ (1)容器化运⾏ (2)计算与数据分离 (3)满⾜12 因素 (4)可伸缩性 (5)可配置性 (6)基础可观测性 L2: 具备远程交付能⼒ (1)完全的模版化定义 (2)模版⾃动实例化 (3)数据⾃动初始化 (4)业务⾼容错性 (5)业务⾼可⽤性 L3: 具备持续升级能⼒ (1)⾼容错化数据升级 (2)⾼容错化版本升级 (3)版本可回滚 (4)业务⾼观测性 ⾯向交付的应⽤模型0 码力 | 31 页 | 6.38 MB | 1 年前3
02. Kubevela 以应用为中心的渐进式发布 - 孙健波Running Instances 注册 工作负载类型 运维特征 发布/部署 CRD 注册中心 KubeVela 的 Application 对象 镜像与启动参数 多组件 如何扩容 扩容指标,实例数范围 组件类型 可灵活扩展的其 他能力 • 一个完整的应用描述文件(以 应用为中心) • 灵活的“schema”(参数由 能力模板自由组合) • 放置于应用代码库中(gitops0 码力 | 26 页 | 9.20 MB | 1 年前3
01. MOSN 高性能网络扩展实践 - 王发康多进程管理复杂 MOSN(GoLang) Extension 可复用 MOSN 现有的 filter 能力, 改造成本低; 研发效率高,灵活性高; GoLang 支持的库比较多(Consul、 Redis、Kafka etc),生态较好 引入 GoLang 扩展后,有一定性能损 耗,业务场景可接受,另外有优化 空间 扩展方案调研 MoE 背景介绍 — 方案分析 方案名称 稳定性 性能 成本 Request goroutine 3.2 async 3.1 start goroutine CGO 6 cgo response Counter Service redis MoE 方案介绍 — GMP 中 P 资源问题 Other Http filter Trace ID filter Other Http filter 1 request 2 4 Envoy0 码力 | 29 页 | 2.80 MB | 1 年前3
共 18 条
- 1
- 2













