Kubernetes 异常配置检测框架
顾静, 阿里云 邓隽, 阿里云 Kubernetes 异常配置检测框架 我们来自阿里云容器服务 • 顾静,研发工程师 • 邓隽,技术专家 我们参与打造 • 容器服务(ACK/ASK) • 容器镜像服务(ACR) • 服务网格(ASM) • … 1 Kubernetes 典型异常 2 检测框架演进 3 生产实践 4 总结 Kubernetes 使用日常 • 应用部署 • Kernel 仅能检测 Kernel 相关问题 要求熟悉 bpftrace 语言 1 Kubernetes 典型异常 2 检测框架演进 3 生产实践 4 总结 我们的目标 实现 Kubernetes 集群异常检测框架 支持集群多维度异常检测能力 支持集成开源检测组件 检测框架 Ver.1 { 自动化 Ver.1 自动化 Autopilot Engine Command Policy 边缘集群、GPU 集群 各类检测场景 • 节点、组件、配置等 • 集群升级、集群巡检 版本差异 * 类型差异 * 场景差异 检测项 Ver.1 优化点 检测代码在膨胀 检测能力迭代需要加速 检测框架 Ver.2 { 动态定制 动态扩展 Ver.2 DSL DSL (Domain-Specific Language) • 领域特定语言指专注于某个应用程序领域的计算机语言 • 目标受众为非程序员、业务员或最终客户0 码力 | 31 页 | 9.57 MB | 1 年前3OpenShift Container Platform 4.8 Service Mesh
码。 遥测 - 了解服务间的依赖关系以及服务间的网络数据流,从而可以快速发现问题。 1.2. SERVICE MESH 发行注记 1.2.1. 使开源包含更多 红帽承诺替换我们的代码、文档和网页属性中存在问题的语言。我们从这四个术语开始: master、 slave、blacklist 和 whitelist。这些更改将在即将发行的几个发行本中逐渐实施。有关更多详情,请参阅我 们的首席技术官 Schema。 首次从 Kiali 控制台访问相关服务(如分布式追踪平台和 Grafana)时,必须使用 OpenShift Container Platform 登录凭证接受证书并重新进行身份验证。这是因为框架如何显示控制台中的 内置页面中存在问题。 Bookinfo 示例应用程序不能安装在 IBM Z 和 IBM Power 上。 IBM Z 和 IBM Power 不支持 WebAsembly 扩展。 in grafana” 链接会重定向到错误的位置。只有在第一次访问 Kiali 才 会出现这个问题。 KIALI-507 Kiali 不支持 Internet Explorer 11。这是因为底层框架不支持 Internet Explorer。要访问 Kiali 控制台,请使用 Chrome 、Edge 、Firefox 或 Safari 浏览器的两个最新版本之一。 1.2.5.3. Red Hat0 码力 | 344 页 | 3.04 MB | 1 年前3OpenShift Container Platform 4.14 分布式追踪
客 客户 户端 端 (Jaeger 客户端、跟踪器、报告程序、客户端库)- 分布式追踪平台 (Jaeger) 客户端 是 OpenTracing API 的特定语言实施。它们可以用来为各种现有开源框架(如 Camel (Fuse) 、Spring Boot (RHOAR) 、MicroProfile (RHOAR/Thorntail) 、Wilfly (EAP) 等提供分布式追 踪工具。 代理 10000 es: max-num-spans: [已弃用 已弃用 - 将在以后的版 本中删除,使用 es.max-doc-count 代 替。] 在 Elasticsearch 中 每个查询每次抓取的最大 span 数量。如果同时设 置了 es.max-num- spans 和 es.max-doc- count,Elasticsearch 将使用两者中的较小的 值。 10000 es: type: Ready : 2. 运行以下命令,验证所有 TempoStack 组件 pod 是否正在运行: 3. 访问 Tempo 控制台: a. 运行以下命令来查询路由详情: b. 在网页浏览器中打开 https://。 c. 使用 Web 控制台的集群管理员凭证登录。 注意 注意 Tempo 控制台最初不会在 Tempo 控制台安装后显示 0 码力 | 100 页 | 928.24 KB | 1 年前336-云原生监控体系建设-秦晓辉
Grafana-agent Datadog-agent node-exporter Categraf Kubernetes Node 组 件的监控 Kubernetes Node - 容器负载监控 抓取方案 • Pod或者容器的负载情况,是一个需要关注的点,容器层面主要关注CPU和内存使用情况,Pod 层面主要 关注网络IO的情况,因为多个容器共享Pod的net namespace,Pod内多个容器的网络数据相同 containerd 都可以采集到,推荐 { 抓取方案一 } • 左侧这个配置大家在网上比较容易搜到,通过kubernetes_sd_configs做服务发现,查找所有node,通过 Kubernetes apiserver 的 proxy 接口,抓取各个node(即kubelet)的 /metrics/cadvisor 接口的 prometheus 协议的数据 • 这个抓取器只需要部署一个实例,调用 apiserver 比 如30s或60s • 所有的拉取请求都走 apiserver,如果是几千个node的大集群,对 apiserver 可能会有较大压力 Kubernetes Node - 容器负载监控 抓取方案 { 抓取方案二 } • 直接调用 kubelet 的接口 /metrics/cadvisor ,不走 apiserver 这个 proxy,避免对 apiserver 的请求压力 • 采用 Daemonset0 码力 | 32 页 | 3.27 MB | 6 月前3Hadoop 迁移到阿里云MaxCompute 技术方案
............................................................................. 21 6.2.1 Metadata 抓取 .................................................................................................. Alibaba Cloud MaxCompute 解决方案 6 1 概要 Hadoop 在企业构建第一代大数据平台中成为主流的技术框架,但是随着企业信息化的高 速发展,在数字化、智能化的转型过程中,Hadoop 越来越复杂的技术架构和运维成本、平台 的稳定性和安全性、资源的弹性伸缩能力都遇到了瓶颈,严重阻碍了客户数据业务的发展。随着 提供了 Spark on MaxCompute 的解决 方案,使 MaxCompute 提供的兼容开源的 Spark 计算 服务,让它在统一的计算资源和数据集权限体系之上,提 供 Spark 计算框架,支持用户以熟悉的开发使用方式提 交运行 Spark 作业。 * 支持原生多版本 Spark 作业:Spark1.x/Spark2.x 作业 都可运行; * 开源系统的使用体验:Spark-submit0 码力 | 59 页 | 4.33 MB | 1 年前3OpenShift Container Platform 4.8 Web 控制台
已知问题 Kiali 中已知的问题: KIALI-3262 在 Kiali 控制台中,当您点击导航中的分布式跟踪或跟踪标签页时,会要求您接受证 书,然后要求您提供 OpenShift 登录凭证。这是因为框架如何显示控制台中的 Trace 页面中存在 问题。解决方法是在另一个浏览器窗口中为 Jaeger 控制台打开 URL 并登录。然后您可以在 Kiali 控制台中查看内嵌的追踪页面。 KIALI-3118 in grafana” 链接会重定向到错误的位置。只有在第一次访问 Kiali 才 会出现这个问题。 KIALI-507 Kiali 不支持 Internet Explorer 11。这是因为底层框架不支持 Internet Explorer。要访问 Kiali 控制台,请使用 Chrome 、Edge 、Firefox 或 Safari 浏览器的两个最新版本之一。 1.5. 修复的问题 在当前发行本中解决了以下问题: (Tracer、Reporter、instrumented application, client libraries)- Jaeger client 是 OpenTracing API 的具体语言实现。它们可以用来为各种现有开源框架(如 Camel (Fuse) 、 Spring Boot (RHOAR) 、MicroProfile (RHOAR/Thorntail) 、Wilfly (EAP) 等提供分布式追踪工 具。 Jaeger0 码力 | 87 页 | 1.58 MB | 1 年前3⾸云容器产品Kubernetes操作指南
选择集群和命名空间,选择所需的路由(本示例中选择hello),单击右侧的移除。 3.在弹出的对话框中点击确认,即可删除路由。 53 Prometheus是⼀套开源的系统监控报警框架,它具有灵活的数据模型:监控数据由值、时间戳、标签;源 数据记录在标签中,⽀持采集时对标签进⾏修改,从⽽使得其具有强⼤的扩展能⼒。 说明:集群创建后监控服务需要⼿动开启,开启过程如下: 1. 点击集群的更多按键,之前的开启监控转变为查看监控,如图: 2. 点击查看Grafana可将prometheus监控抓取的监控数据转化为可视化的各类仪表盘进⾏显示 点击查看Grafana 跳转⾄Grafana登录⾸⻚ (3)查看详细监控 58 登录进⾸⻚后,即可查看相关仪表盘(折磨默认配置pr 61 上图中查询数据源选择prometheus,Metrics⾥输⼊PormQL表达式(为prometheus监控系统中⽤于 检索监 控数据的查询语⾔),还可以设置其他⽐如图例,抓取时间等。可以添加多个查询,点击上 图右侧AddQuery, 操作同上。在通⽤配置⾥可以设置该仪表盘名称,最后点击右上⽅左侧功能按钮 保存。 如图为上述步骤创建的简单仪表盘 ⽅0 码力 | 94 页 | 9.98 MB | 1 年前3深度解析CNCF社区⾸个基于Kubernetes的边缘计算平台KubeEdge
基于边缘计算打造智慧园区,通过视频监控+AI分析实现从⼈人防到技防,提升园区运营效率,提⾼高园区住户体验。� ➔ 对监控视频智能分析,实时感知⼊入侵、⼈人流量量⼤大等异常事件,降低园区的⼈人⼒力力成本。� ➔ 端侧⼈人脸抓取,视频分析在边缘侧执⾏行行。云端管理理边缘应⽤用全⽣生命周期,⽆无缝升级。云端AI模型训练,边缘侧推理理。� 端� 边� 云� ⼈人脸 检测 模型� 容器器� ⼈人脸检测� ⼈人流分析� 量量节点和设备难的问题。� ➔ 南向⽀支持对接物联⽹网主流的通信协议(MQTT,Bluetooth,Zigbee,BACnet等),解决了了异构硬件接⼊入难的问题。� 开源的云、边协同边缘计算框架 Why KubeEdge——CNCF & Kubernetes & KubeEdge� Central Cloud� Edge 1� Edge n� Edge 2� Cloud� Edge�0 码力 | 20 页 | 2.08 MB | 1 年前3OpenShift Container Platform 4.7 日志记录
Container Platform 4.7 日志 日志记录 记录 6 第 1 章 RED HAT OPENSHIFT LOGGING 发行注记 1.1. 使开源包含更多 红帽承诺替换我们的代码、文档和网页属性中存在问题的语言。我们从这四个术语开始: master、 slave、blacklist 和 whitelist。这些更改将在即将发行的几个发行本中逐渐实施。详情请查看 Red Hat CTO Chris Query latency:Elasticsearch 搜索查询执行的 平均时间。 获取延迟:每个 Elasticsearch 搜索查询的平 均时间获取数据。 获取延迟的时间通常比查询延迟要短。如果抓取延迟 持续增加,则代表磁盘、数据配置速度较慢,或者带 有许多结果的大量请求。 Elastic 查询率 每个 Elasticsearch 节点每秒对 Elasticsearch 实例执行 的查询总数。 FluentdNodeDown Prometheus could not scrape fluentdfor more than 10m. Fluentd 报告 Prometheus 可 能无法抓取特定的 Fluentd 实 例。 Critical FluentdQueueLengthInc reasing In the last 12h, fluentd buffer 0 码力 | 183 页 | 1.98 MB | 1 年前3动手学深度学习 v2.0
成熟的库应该自动化常见的任务,示例代码应该使从业者可以轻松地修改、应用和扩展常见的应用程序,以 满足他们的需求。以动态网页应用为例。尽管许多公司,如亚马逊,在20世纪90年代开发了成功的数据库驱 动网页应用程序。但在过去的10年里,这项技术在帮助创造性企业家方面的潜力已经得到了更大程度的发挥, 部分原因是开发了功能强大、文档完整的框架。 测试深度学习的潜力带来了独特的挑战,因为任何一个应用都会将不同的学科结合在一起。应用深度学习需 ;(2)涵盖了现代机器学习的 所有领域,技术深度丰富;(3)在一本引人入胜的教科书中,人们可以在实践教程中找到干净的可运行代码, 并从中穿插高质量的阐述。我们发现了大量关于如何使用给定的深度学习框架(例如,如何对TensorFlow中 的矩阵进行基本的数值计算)或实现特定技术的代码示例(例如,LeNet、AlexNet、ResNet的代码片段),这 些代码示例分散在各种博客帖子和GitHu )允许我们和社区 的快速更新;(5)由一个论坛2作为补充,用于技术细节的互动讨论和回答问题。 这些目标经常是相互冲突的。公式、定理和引用最好用LaTeX来管理和布局。代码最好用Python描述。网页 原生是HTML和JavaScript的。此外,我们希望内容既可以作为可执行代码访问、作为纸质书访问,作为可下 载的PDF访问,也可以作为网站在互联网上访问。目前还没有完全适合这些需求的工具和工作流程,所以我0 码力 | 797 页 | 29.45 MB | 1 年前3
共 163 条
- 1
- 2
- 3
- 4
- 5
- 6
- 17