云原生大模型数据计算系统 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

3.云原生边云协同AI框架实践

云原生边云协同AI框架实践普杰华为云边缘云创新Lab 高级工程师 KubeEdge SIG AI Tech Lead 目录 Edge AI现状与趋势 01 Sedna：边云协同AI框架 02 Sedna-GM：K8S Operator 03 实践案例 04 Edge AI现状与趋势第一部分 Why Edge AI？ • Cloud中心化的AI计算范式不足以应对端上AI Centralized Client devices Edge AI • 随着大模型的发展，AI 计算对算力需求大幅且快速增长 AI应用到越来越多的边缘场景分布式协同AI 概念将人工智能相关的部分任务部署到边缘设备，基于边缘设备、边缘服务器、云服务器，利用分布式乃至分布式协同方式实现人工智能的技术数据在边缘产生边侧逐步具备AI能力分布式协同AI 核心驱动力分布式协同AI核心驱动力分布式协同AI技术挑战 1. 边缘资源碎片化 2. 边缘数据孤岛 3. 边缘样本少 4. 边缘数据异构分布式协同AI 技术挑战边云协同AI框架第二部分首个分布式协同AI开源项目Sedna 基于KubeEdge提供的边云协同能力，支持现有AI类应用无缝下沉到边缘为分布式协同机器学习服务 ✓ 降低构建与部署成本 ✓ 提升模型性能 ✓ 保护数据隐私 SIG成员近年发表分布式协同AI顶会论文

0 码力 | 37 页 | 2.36 MB | 1 年前
3
Golang大规模云原生应用管理实践

Golang⼤规模云原⽣应⽤管理实践刘洋（炎寻）关于我 • 毕业于中国科学技术大学，定居杭州 • 就职于阿里云-云原生应用平台团队 • Problem Solver，聚焦中间件，容器，Kubernetes，PaaS平台… • OAM社区成员开局一张图规模化应用交付效率对比去年每万笔峰值交易的IT成本对比4年前提升1倍下降80% 云原生技术稳定成本效率效率云原生-程序员视角基础设施 K8s 云原生生态（CNCF）云原生应用云原生是以容器技术为基础围绕着Kubernetes进行的一场技术标准化演进。通过标准可扩展的调度，网络，存储，容器运行时接口来提供基础设施；通过标准可扩展的声明式资源和控制器来提供运维能力。两层标准化推进了细化的社会分工，各领域进一步提升规模化和专业化，全面达到成本，效率，稳定性的优化。 4 6 7 2 Custom controller Network plugins Storage plugins 统筹规划，降低成本自动化运维，提升稳定性非业务逻辑剥离，提升交付效率 Golang与云原生生态（CNCF）项目数占比: 214/1512（14.2%） Github star数占比:1265737 / 2458072（51.5%）市值占比: $8.08T/$19.46T(41.5%)

0 码力 | 23 页 | 7.70 MB | 1 年前
3
JVM 内存模型

JVM 内存模型 Heap Method Area Runtime Constant Pool Thread Thread Thread PC Register JVM Stack Native Method Stack PC Register JVM Stack Native Method Stack PC Register JVM Stack Native Method

0 码力 | 1 页 | 48.42 KB | 1 年前
3
1.每秒百万数据点 Go 应用监控系统演进

每秒百万数据点 Go 应用监控系统演进张平 AfterShip 高级 SRE 关于 AfterShip 拥抱云原生和开源系统目录监控架构概览 01 如何监控 Go 应用？ 02 Metrics 系统架构演进 03 Why VictoriaMetrics so good？ 04 总结与展望 05 监控架构概览第一部分监控系统架构概览 -- 数据源监控系统架构概览监控系统架构概览 -- 告警配置监控系统架构概览 -- 告警通道如何监控 Go 应用？第二部分基于 Prometheus Go 应用监控接入流程确定指标为应用埋点部署应用配置服务发现监控展示指标类型 ● Go 运行时指标 ○ Goroutine 数量 ● 应用层指标 ○ infra_http_request_total ● 业务指标 ○ 总 Tracking 查询量某个 ENT 客户的 Tracking 查询失败率 Metrics 系统架构演进第三部分 2018-2020 2K+ 40K 1Mil+ 2020 年指标数据业务指标数量每秒写入数据点 Active Time Series 2018-2020 年架构 2020 年底面临的问题 ● 无法查询超过 30 天的数据 ● 查询慢，平均时间超过 2 分钟 ● 跨集群指标无法聚合 ●

0 码力 | 42 页 | 2.32 MB | 1 年前
3
云原生go-zero微服务框架设计思考

云原生go-zero微服务框架设计思考万俊峰Kevin@好未来关于我万俊峰Kevin ● go-zero作者 ● 好未来资深专家 ● 晓黑板研发负责人 ● 十多年研发团队管理经验 ● 近20年开发和架构经验 Agenda ● go-zero之前世今生 ● go-zero是如何设计的 ● go-zero如何高效解决问题 go-zero之前世今生 go-zero的由来并发控制数据统计监控报警链路跟踪自动降载自动熔断超时控制 gRPC协议日志记录缓存控制调用鉴权异常捕获并发控制数据统计监控报警链路跟踪自动降载自动熔断超时控制 Redis集群 Redis集群数据库 MySQL集群 MongoDB集群 ClickHouse集群服务发现 ETCD集群 Redis集群代码未动，数据先行 ● 定义数据边界 ● 数据库互相隔离，通过RPC访问数据库互相隔离，通过RPC访问 ● No join, no pain! 用户商品订单物流如何设计缓存 ● 缓存穿透，不存在的数据 ● 缓存一分钟 ● 缓存击穿，热点key过期 ● 只拿一次数据，共享结果 ● 缓存雪崩，大量缓存同时过期 ● 过期时间设置随机偏差 service redis1 mysql/mongo clusters redis2 redis3 类似DB的缓存索引方式

0 码力 | 29 页 | 5.70 MB | 9 月前
3
1.2 基于 Golang 构建高可扩展的云原生 PaaS 平台

基于 Golang 构建⾼可扩展的云原⽣ PaaS 平台刘浩杨端点技术专家个⼈简介 - 18年加⼊端点，现任微服务和监控团队负责⼈ - 端点开源 PaaS Erda 的核⼼架构师 - 开源爱好者， Apache SkyWalking PMC 成员⽬录⾯向云原⽣的软件交付 01 端点⼀站式 PaaS - Erda 02 Erda 架构的思考 03 模块化开发框架开源新时代的挑战 05 ⾯向云原⽣的软件交付第⼀部分⾯向云原⽣的企业软件产品 - 敏捷开发 - 微服务化和容器化 - 交付标准化 - 可观察性特点：敏捷的⽬标是提升研发效能需要⼀个 DevOps 平台来⽀撑敏捷开发的落地这⾥需要有⼀个标准的交付平台运⾏环境业务数据业务系统 C 业务数据业务系统 A 业务数据业务系统 B 资源管理在统⼀平台可靠的业务贴身护航基础⽀撑持续保障系统稳定性只需很少的运维投⼊即可保证系统稳定性端点⼀站式 PaaS - Erda 第⼆部分端点 PaaS 发展历程有状态服务 Job / JobFlow 批计算流计算⽆状态服务 DaemonSet Workloads 多集群调度混合云调度跨云迁移多环境调度业务数据统⼀调度集群核⼼服务 Helm 镜像服务

0 码力 | 40 页 | 8.60 MB | 1 年前
3
云原生时代分布式链路追踪实践-曲赛

云原生时代分布式链路追踪实践 2021-08 曲赛 (saiqu) 微服务架构的困境故障定位难极高的沟通和交接成本错综难懂的模块依赖关系链路梳理难日志分散定位过程“击鼓传花” 跨端性能瓶颈分析繁杂性能分析难缺乏对系统整体认知的把控不合理的调用关系不合理的直连存储架构治理能力匮乏云原生可观测性 3 4 Trace 标准规范 5 标准责人来自Grafana，Gitlab ✓ 持续更新 OpenTelemetry 2019年，由OpenTracing和OpenCensus合并而来。 ✓ ✓ ✓ 蓬勃发展 Trace 数据模型：Trace Context，Baggage 6 Propagation Format W3C Trace-Context W3C Baggage Zipkin B3 format Jaeger 响应 traceresponse: 00-1baad25c36c11c1e7fbd6d122bd85db6- cab70b47728a8a99-01 Trace 数据模型： Trace Detail 7 Trace 数据模型： Trace Detail 示例 8 Trace 采样策略 9 1. Head-based coherent sampling 2. Tail-based coherent

0 码力 | 17 页 | 2.47 MB | 1 年前
3
2 张孝峰 Python与云 AWS的Python原生应用浅析

Python与云 ——AWS的Python原生应用浅析张孝峰亚马逊AWS资深解决方案架构师 Python 30周年 Python发展时间线 2019/10 v3.8 v2.7.17 开始实现 1989/12 v0.9.0 1991/2 v1.0.0 1994/1 v2.0 2000/10 v2.5 2006/9 v2.6 2008/10 v3.0 2008/12 网络爬虫 • 大数据分析 48 82 160 280 516 722 1017 1430 1,957 2009 2011 2012 2013 2014 2015 2016 2017 2018 发布的功能和服务数量 AWS同样功能丰富 AWS向客户提供超过165项功能全面的服务涵盖计算、存储、数据库、联网、分析、机器人、机器学习与人工智能、物联网、移动、安全、混合云、虚拟现实与增强现实、媒体，以及应用开合云、虚拟现实与增强现实、媒体，以及应用开发、部署与管理等方面。如何管理和使用海量的云API Amazon Athena Amazon Redshift 超过165项服务数千个不同的API AWS Tools and SDKs • Python (boto3) • C++ • PHP • .NET • Ruby • Java • Golang • Node.js • JavaScript

0 码力 | 42 页 | 8.12 MB | 1 年前
3
3 基于Azure的Python机器学习王大伟

基于Azure的Python机器学习平安金融壹账通大数据研究院微软MVP 王大伟目录 CONTENTS Azure与Python 如何用Azure完成机器学习 Azure与自动机器学习 Azure的相关学习资料 Azure与Python 日渐流行的Python TIOBE给出的排行榜是具有权威性质的，是判断语言流行趋势的指标。 TIOBE排行榜的网址是：https://tiobe Python的优势：易学习、大量不断更新的各领域库、尤其适合完成机器学习相关任务。 Python机器学习相关库介绍： Sklearn机器学习地图 Azure是什么？ Azure 是一个不断扩展的云计算服务集合。通过 Azure，公司和组织可以加快发展步伐，提高工作效率，节省运营成本。 Azure网站：https://azure.microsoft.com/zh-cn/ Azure行业解决方案机器学习的一般步骤包括：问题定义、数据收集、特征工程、模型选择、模型评估、模型应用。而算法工程师的工作一般是从特征工程开始。自动机器学习的自动体现在：自动特征工程、自动模型选择、自动超参数优化等。手动特征工程效率低、可移植性差、受到创造力的限制。自动特征工程自动超参数优化自动模型选择添加标题如何有效选择对应于特定数据集的模型至关重要。大量超参数如何自动优化？

0 码力 | 31 页 | 3.69 MB | 1 年前
3
Erda 基于云原生的微服务可观测性 - 刘浩杨

Erda 基于云原生的微服务可观测性刘浩杨端点科技 Erda 微服务和监控平台负责人目录微服务系统监控的挑战 01 可观测性技术理论 02 Erda 服务观测平台技术内核分析 03 Erda 服务观测平台功能概览 04 Erda:新一代企业级云原生 PaaS 平台当前微服务系统面临的挑战目录微服务系统监控的挑战 01 可观测性技术理论 02 Erda 服务观测平台技术内核分析服务观测平台技术内核分析 03 Erda 服务观测平台功能概览 04 可观测性三大支柱（一）Tracing 模型（二）Metrics 时序模型 Writes are vertical，reads are horizontal （三）数据关联目录微服务系统监控的挑战 01 可观测性技术理论 02 Erda 服务观测平台技术内核分析 03 Erda 服务观测平台功能概览 04 通过多种探针，覆盖基础设施、业务系统、用户终端全面的数据指标高实时性通过流计算平台，数据处理和告警延迟都在秒级别海量数据存储处理高性能的大数据处理架构，轻松应对海量可观测性数据处理平台架构可观测性数据采集可观测性数据处理数据存储选择 ES 数据索引管理自动路由指标到索引 01 02 03 自动索引滚动根据容量和 TTL 自动评估数据删除周期 InfluxQL

0 码力 | 25 页 | 6.96 MB | 1 年前
3

共 769 条前往

页

分类

语言

格式

3.云原生边云协同AI框架实践

Golang大规模云原生应用管理实践

JVM 内存模型

1.每秒百万数据点 Go 应用监控系统演进

云原生go-zero微服务框架设计思考

1.2 基于 Golang 构建高可扩展的云原生 PaaS 平台

云原生时代分布式链路追踪实践-曲赛

2 张孝峰 Python与云 AWS的Python原生应用浅析

3 基于Azure的Python机器学习王大伟

Erda 基于云原生的微服务可观测性 - 刘浩杨