美团点评2018技术年货对于App里运营资源、基础配置,需要根据城市、版本、平 台、渠道等不同的维度进行运营管理。如何在版本快速迭代过程中,保持运营资源能够被高效、稳定和灵 活地配置,是我们团队面临的重大考验。在这种背景下,大众点评移动开发组必须要打造一个稳定、灵 活、高效的运营配置平台。本文主要分享我们在建设高效的运营配置平台过程中,积累的一些经验,以及 面临的挑战和思考。 运营资源 运营资源 简单而言,运 简单而言,运营资源可以理解为App中经常变动的一些广告、运营活动等等,譬如下图中电影首页顶部的 Banner位,就是一个典型的运营资源。对于这类运营资源,它们有如下明显特征: 1. 时效性,只在一定时间范围内显示在C端固定位置。 2. 城市强相关,这类运营资源往往是基于LBS类服务,每个活动、广告都只会出现在固定的某些城市(或区域)。 基础配置 基础配置 基础配置,常见的有入口资源的配置、网络的配置 等。相对运营资源来说,其变更的频繁度相对较低,与 时间、城市的关系也没那么强。譬如下面大众点评App-我的页面里的入口。这类配置有如下几个特征: 1. 多维度:需要针对不同的版本、平台、渠道,做不同的配置。 2. 长期有效:这种类型的配置一般长期存在,不会存在过期问题。 APPKIT打造稳定、灵活、高效的运营配置平台 - 美团技术团队 二、遇到的问题 二、遇到的问题 在从0到1打造运营0 码力 | 229 页 | 61.61 MB | 1 年前3
2022年美团技术年货 合辑879 工程效能 CI/CD 之流水线引擎的建设实践 912 美团外卖搜索基于 Elasticsearch 的优化实践 933 美团图灵机器学习平台性能起飞的秘密(一) 953 提升资源利用率与保障服务质量,鱼与熊掌不可兼得? 971 标准化思想及组装式架构在后端 BFF 中的实践 992 外卖广告大规模深度学习模型工程实践 | 美团外卖广告工程实践专题连载 1013 数据库全量 的利用率只有 95%,还有压 榨空间,而 16 核 CPU 利用率已经超过了 1500%,几乎满负荷运转。我们推测整个 线上服务的“瓶颈”可能在 CPU,而图片预处理会使用大量 CPU 资源。 表 9 服务器资源配置 算法 < 33 3.2.1 DALI 预处理 为了解决 CPU 预处理带来的“瓶颈”,我们采用了 NVIDIA 的 DALI 库,将预处理 直接放到 GPU 中运算。该库可以在 预处理后,T4 GPU 利用率达到了 100%,而 16 核 CPU 的利 用率则下降到了 1100% 左右,部分 CPU 资源得到了“解放”。另外,我们也测试 FP16 + DALI 的吞吐,反而有略微的下降。我们推测是 DALI 抢占了部分 GPU 计 算资源,而 FP16 服务的瓶颈在 GPU,所以对整体性能产生了负面影响。 34 > 2022年美团技术年货 图 13 使用 DALI0 码力 | 1356 页 | 45.90 MB | 1 年前3
202309 MeterSphere ⼀站式开源持续测试平台0》 造成测试阻塞的三个⽅⾯ 测试平台是提⾼⽣产能效最⾼效⽅法之⼀ 开发中 等待测试 测试中 建设测试平台,提升测试整体的吞吐量 测试跟踪 测试计划 测试环境 测试数据 测试资源 API 项⽬ 管理 ⼈员 管理 接⼝ 测试 功能 测试 性能 测试 UI 测试 其他 测试 从系统⻆⾊的⻆度来看,下游的 ⽣产⼒决定上游的⽣产速度。通 过测试平台的建设,最终推动研 测试 测试⽤例管理 列表管理 脑图管理 公共⽤例库 ⽤例批量变更 ⽤例关联需求 缺陷管理 接⼝⽤例管理 接⼝ Mock 服务 内置数据函数 ⾃定义脚本 接⼝场景编排 接⼝测试报告 性能测试环境管理 性能测试脚本管理 性能测试任务管理 压测⽂件管理 压测监控 性能测试报告 统⼀元素库 测试执⾏控件 元素操作 ⿏标操作 输⼊操作 MeterSphere 测试管理核⼼:⼀体化全场景的测试计划 测试管理 测试管理⼀体化 测试⽬标 & 需求 & 策略 测试计划制定 测试计划 ⼈⼯执⾏ 制定测试的责任⼈、范围、 ⽅法、资源和进度等 接 ⼝ 测 试 功 能 测 试 性 能 测 试 安 全 测 试 其 他 测 试 测试项 ⼤量的⼈⼯确认与结果反馈机制 UI 测 试 A P P 测 试 脑图0 码力 | 45 页 | 4.65 MB | 1 年前3
202203 MeterSphere:一站式开源持续测试平台
造成测试阻塞的三个⽅⾯ 测试平台是提⾼⽣产能效最⾼效⽅法之⼀ 开发中 等待测试 测试中 建设平台,提升测试整体的吞吐量 测试跟踪 测试计划 测试跟踪 测试环境 测试数据 测试资源 API 项⽬ 管理 ⼈员 管理 接⼝ 测试 功能 测试 性能 测试 UI 测试 其他 测试 从系统⻆⾊出发来看,下游的⽣ 产⼒决定上游的的⽣产速度。通 过测试平台的建设,最终推动研 投⼊产出⽐低,研发⼈⼒成本级 别⾼; 场景: 适合团队和集成 DevOps。 - 解决现有接⼝测试的问题,覆盖多种接⼝协议,⾃由组合接⼝⾃动化测试场景- MeterSphere 灵活的接⼝场景编排设计 接⼝管理 接⼝⽤例 Mock 服务 逻辑组件 ● ⽤例集管理 ● ⽤例运⾏管理 ● 前后置脚本 ● 断⾔与提取 ● 期望列表 ● 请求参数 ● 响应状态码 ● 请求头 HTTP TCP SQL Dubbo 内置协议 MQTT 插件扩展协议 WebSocket GRPC FTP Debug ⾃定义扩展 按需扩展 ⾃动化场景编排 ● 场景管理与环境配置 ● 测试步骤拖拽式编排 ● 丰富的测试组件 ● 场景嵌套与拼接 JMeter-Pod-1 JMeter-Pod-2 JMeter-Pod-N JMeter-Pod-3 主机-1 Node-Controller0 码力 | 41 页 | 11.71 MB | 1 年前3
Django、Vue 和Element UI 前后端原理论述方便开发人员和团队的协作。 6 《51 测试天地》七十四 www.51testing.com 4、npm 介绍 在前端环境中,npm 是非常重要的工具,它主要用于管理和安装前端项目的依赖、 构建工具和其他相关资源。以下是 npm 在前端开发中的应用介绍: 依赖管理:npm 可以管理前端项目的依赖,开发者可以在项目的 package.json 文件中 声明项目所依赖的第三方模块和库,以及其版本信息。在安装项目时,运行 Framework(简称 DRF):是一个用于构建 Web API 的强大框架,它是 基于 Django(一个流行的 Python Web 框架)开发的 ---npm :用于管理和安装前端项目的依赖、构建工具和其他相关资源。 ·开发环境 PyCharm 2023.1.3 (Professional Edition) 拓展学习 [1] 【Python 自动化测试学习交流群】学习交流 咨询:微信 atstudy-js 的返回值; 找谁造数、造什么样的数,时间往往都消耗在沟通上。 基于以上痛点和难点,并结合对测试数据实际准备过程中相关问题的探索和研究形 成了长链路业务测试数据快速构造方法论,主要包括场景梳理、功能编排、数据构造、 结果反馈以及维护保鲜等几部分,总体流程如下图所示: 39 《51 测试天地》七十四 www.51testing.com 1、场景梳理 场景梳理主要是指在熟悉长链路业务流程、接口和实现逻辑的基础上,按照待造数0 码力 | 61 页 | 6.84 MB | 1 年前3
202205 MeterSphere:一站式开源持续测试平台
投⼊产出⽐低,研发⼈⼒成本级 别⾼; 场景: 适合团队和集成 DevOps。 - 解决现有接⼝测试的问题,覆盖多种接⼝协议,⾃由组合接⼝⾃动化测试场景- MeterSphere 灵活的接⼝场景编排设计 接⼝管理 接⼝⽤例 Mock 服务 逻辑组件 ● ⽤例集管理 ● ⽤例运⾏管理 ● 前后置脚本 ● 断⾔与提取 ● 期望列表 ● 请求参数 ● 响应状态码 ● 请求头 HTTP TCP SQL Dubbo 内置协议 MQTT 插件扩展协议 WebSocket GRPC FTP Debug ⾃定义扩展 按需扩展 ⾃动化场景编排 ● 场景管理与环境配置 ● 测试步骤拖拽式编排 ● 丰富的测试组件 ● 场景嵌套与拼接 JMeter-Pod-1 JMeter-Pod-2 JMeter-Pod-N JMeter-Pod-3 主机-1 Node-Controller ● 内置代码库管理 接⼝测试 ● 接⼝集管理 ● PostMan 导⼊ ● Swagger 导⼊ ● 快捷调试 1:N - 简单易⽤的图形化接⼝⾃动化编排 - MeterSphere 接⼝场景编排截图 接⼝测试 UI ⾃动化测试建设价值依旧是遵循测试⾦字塔原理。MeterSphere 开源设社 区调研了的 219 份企业表单,其中 82.19% 的报名者所在的团队正在建设0 码力 | 40 页 | 11.03 MB | 1 年前3
Service Mesh在华为公
有云的实践• 与微服务部署在⼀一个Pod • 占⽤用资源很⾼高 Mesher • Service Mesh的⼀一种实现 • 基于⾃自研的Go语⾔言微服务框架(即将开源)开发 • 使⽤用CSE注册中⼼心与配置中⼼心 • 以Sidecar的⽅方式部署在微服务所运⾏行的环境中,也可以 PerHost模式运⾏行 • ⽀支持多种部署⽅方式 • 占⽤用资源⼩小(闲置10多M,并发运⾏行时30多M) 部署复杂性提升,如何消弭? • Infrastructure as Code—开发者⾃自⾏行选型 • 命令⾏行注⼊入⼯工具—Mesher开发团队定制 • 编排服务⾃自动注⼊入—最完整的产品体验 应⽤用与Mesher集成最佳实践 • 使⽤用容器,容器⺴⽹网络与编排调度平台 • 业务代码监听在本地端⼝口,并且不要暴露业 务服务端⼝口。使⽤用Mesher端⼝口对外提供服务 • 使⽤用SideCar部署模式 ServiceMesh? 为什么要开发Mesher • Istio的性能问题 • Istio强绑定Kubernetes平台(1.7.4+) • 从成本⾓角度讲Linkerd并不适合做SideCar部署,JVM资源占⽤用较多 • 在ServiceComb和CSE中的积累 • 最⼤大优势,侵⼊入式与⾮非侵⼊入式的⽆无缝结合,混编,统⼀一的产品体验。 开源 • Service Center https://github0 码力 | 52 页 | 4.37 MB | 1 年前3
唯品会调度系统的前世今生位与选型 需要解决的问题 1 6 4 3 2 … 异构/多语言难以支持 5 缺乏统一监控、统一管理 (进程假死、运行状态未知) 缺乏容错、容灾,高可 用 缺乏分布式处理 无法合理利用机器资源 难以问题追踪 选型对比 Crontab Quartz Linux系统级的定时任务执行器 缺乏分布式运算和集中管理功能 无法做到高可用 TBSchedule Elatic-Job Java事实任务标准 功能单一,只支持Java,不支持 Shell(PHP)和消息驱动的作业调度 对任务超时、任务执行情况、监控逻辑 支持粒度功能较单一或缺乏 没有容器化选型? 调度产品的定位 简易开发、简单维护 高可用、分片并发处理、资源调度动态平衡 支持Java、Shell以及本地模式(VIP还支持消息模式) 统一配置、统一监控、统一管理 VIP弹性调度系统 -- Saturn 开源地址: Github.com/vipshop/Saturn 多种作业类型与 作业模式 资源动态平衡 框架与业务隔离 三大功能特性 Shell作业 消息作业* JAVA作业 分布式与本 地作业模式 • 完美兼容现有PHP的作业,可无缝迁移,成本最低 • 提供多种业务开发模式,满足不同的业务需求 • 多种业务运行模式,即可分布式管理也可本地管理 • 通过异步消息实现业务编排* 多种作业类型 人工指定 运行节点 系统自动 平衡负载 资源利用 • 灵活的运维配置与部署0 码力 | 58 页 | 5.40 MB | 1 年前3
降级预案在同程艺龙的工程实践-王俊翔降级预案在同程艺⻰龙的⼯工程实践 演讲者 / 王俊翔 同程艺龙 ⾃自我介绍 搜索故障 微信⼩小程序 API⽹网关 资源1 搜索引擎 统⼀一资源⽹网关 资源2 资源3 资源4 …… 资源4 ⼤大量量超时 统⼀一资源⽹网关 搜索引擎 API⽹网关 ⼤大量量请求超时 缺乏熔断设计 交易易故障 第三⽅方⽀支付 ⽀支付中⼼心 ⽀支付回写 消息队列列 ⽀支付通知 交易易中台 serviceC serviceC- degrade 弱依赖 强依赖 强依赖 备选服务 熔断、限流 降级 业界解决⽅方案 - HYSTRIX Netflix开源的一款容错框架,支持多种降级熔断技术 资源隔离 断路路器器 降级操作 请求合并 请求缓存 实践过程中遇到的问题 • 业务改造成本⾼高,代码耦合,维护成本增⾼高 • 固化策略略,需线下修改代码,测试,发布,线上应急策略略响应不不 应⽤用、服务、策略略产品化、数据化 • 应⽤用、服务指标实时监控,健康状态评估 • 实时监测服务降级执⾏行行状态,降级发⽣生点数据 快照及时回溯 • 降级策略略管理理 • 多种策略略⽅方案:失效备援、服务熔断、资源隔 离、延迟处理理 • 策略略灵活调整,实时监控策略略运⾏行行状态 应⽤用 / 服务 降级代码管理理 • 线上代码开发、测试、发布 • 降级代码统⼀一管理理 • 脚本代码动态编译,对象管理理0 码力 | 26 页 | 18.67 MB | 1 年前3
1.2 基于 Golang 构建高可扩展的云原生 PaaS 平台数据 业务系统 C 业务 数据 业务系统 A 业务 数据 业务系统 B 资源管理在统⼀平台 应⽤运⾏在统⼀平台 构建标准的交付环境 交付产物标准化 - 业务配置 - 资源配置 - 依赖配置 - 流⽔线配置 配置即代码 : 实现⼤规模交付的部署过程可被验证 PaaS 平台:资源管理,容器编排,基础监控和告警 APM 监控:应⽤诊断,链路追踪,⽇志分析 微服务治理组件 可靠的业务 APP 监控 慢SQL JVM 诊断 ⾃定义告警 APM 微服务管理 资源管理 标签管理 系统监控 集群管理 服务⽬录 埋点 数据库 ⽇志 画像 标签 报表 推荐 … 代码管理 持续集成 编排部署 应⽤运维 测试管理 协同管理 数据源管理 数据集成 数据开发 数据资产 数据服务 数据应⽤ 资源统计 运维报告 审计⽇志 K8S 管理 数据监控 多云管理平台 ⻚⾯错误 特点: ⽆埋点的实现⽅案 运⾏时拓扑 访问明细: TraceId SpanId 报告: 实时⽹络拓扑图 实时调⽤延迟展示 特点: 实时反应系统状况 运营决策 视⻆: 系统资源使⽤,系统健康度 报告: 周报 ⽇报 ⼤盘 特点: 提供⾼视⻆的IT运营决策分析 Erda 的可观察性能⼒ 可观察性数据采集 - ⾃动发现并识别 services、 jobs 和 addons0 码力 | 40 页 | 8.60 MB | 1 年前3
共 372 条
- 1
- 2
- 3
- 4
- 5
- 6
- 38













