Kubernetes 异常配置检测框架## Kubernetes 异常配置检测框架 顾静, 阿里云 邓隽, 阿里云 ## 我们来自阿里云容器服务 • 顾静,研发工程师 • 邓隽,技术专家 ## 我们参与打造 • 容器服务(ACK/ASK) • 容器镜像服务(ACR) • 服务网格(ASM) 1 Kubernetes 典型异常 2 检测框架演进 3 生产实践 4 总结 ## Kubernetes 使用日常 使用日常 • 应用部署 • 集群扩容 • 组件升级 · ... • 找出集群不正常工作的原因:( ## Kubernetes 典型异常 ## 组件异常 • API Server Load Balancer 异常 • API Server Pod 异常 ## 影响 - 通过 API Server 访问集群概率失败 • 升级集群失败 Load Balancer 时 Pod 还将在这个节点上运行多长的时间。 那么,节点发生异常到 Pod 被驱逐的时间,就取决于两个参数:1. 节点实际异常到被判断为不健康的时间;2. Pod 对节点不健康的容忍时间。 Kubernetes 集群中默认节点实际异常到被判断为不健康的时间为 40s, Pod 对节点 NotReady 的容忍时间为 5min, 也就是说, 节点实际异常 5min40s(340s) effect: "NoExecute" tolerationSeconds: 300 这种自动添加的容忍度意味着在其中一种问题 (NotReady / UnReachable) 被检测到时 Pod 默认能够继续停留在当前节点运行 5 分钟。 注: 当 DaemonSet 中的 Pod 被创建时, 针对 unreachable / not-ready 污点自动添加的 NoExecute0 码力 | 4 页 | 104.64 KB | 2 年前3
Java 应用与开发 - 异常处理# Java 应用与开发 异常处理 王晓东 wangxiaodong@ouc.edu.cn 中国海洋大学 October 30, 2018   ## 学习目标 1. 掌握 Java 异常的概念和分类 2. 深入理解 Java 异常处理机制 异常的概念及分类 ## 大纲 异常的概念及分类 Java 异常处理机制 ## C++ 中的异常处理 ## 《The C++ Programming Language》 一个库的作者可以检测出发生了运行时错误,但一般不知道怎样去处理它们(因为和用户具体的应用有关); 另一方面,库的用户知道怎样处理这些错误,但却无法检查它们何时发生(如果能检测,就可以再用户的代码里处理了,不用留给库去发现)。 ## 提供异常处理机制的基本思想 让一个函数在发现了自己无法处理的错误时抛出(throw)一个异常,然后它的(直接或者间接)调用者能够处理这个问题。 ## 《C++ primer》 将问题检测和问题处理相分离。 (Exceptions let us separate0 码力 | 33 页 | 626.40 KB | 2 年前3
基于静态分析的Rust内存安全缺陷检测研究## 基于静态分析的Rust内存安全缺陷检测研究 报告人:徐辉 复旦大学 报告日期:2022.11.25 ## 大纲 一、问题背景 二、Rust指针缺陷检测方法 三、实验结论 四、论文发表心得 ## 大纲 一、问题背景 二、Rust指针缺陷检测方法 三、实验结论 四、论文发表心得 ## Rust语言 ## 系统级安全编程语言 println("foo_=_.{:?}", foo.vec); } ## 大纲 一、问题背景 二、Rust指针缺陷检测方法 三、实验结论 四、论文发表心得 ## 研究挑战和思路 ☐ 研究挑战:指针分析是NP-hard问题 准确性:应采用路径敏感的指针分析算法,避免过多误报 分析效率:应基于Rust MIR的特点对算法进行优化,使其可行 ☐ 整体思路:基于编译过程中的生成的MIR进行静态分析 ■ 路径提取:控制流图=>生成树 别名分析:分析指针之间的关联关系 ■ 模式识别:根据预定义的缺陷模式检测指针漏洞 路径提取  别名分析0 码力 | 28 页 | 1.55 MB | 2 年前3
机器学习课程-温州大学-09深度学习-目标检测## 深度学习-目标检测 黄海广 副教授 2023年04月 ## 本章目录 01 目标检测概述 02 目标检测算法 03 YOLO算法 04 Faster RCNN算法 ### 1. 目标检测概述 01 目标检测概述 02 目标检测算法 03 YOLO算法 04 Faster RCNN算法 ### 1. 目标检测概述  分类任务关心整体,给出的是整张图片的内容描述,而检测则关注特定的物体目标,要求同时获得这一目标的类别信息和位置信息。 分割(Segmentation) 分割包括语义分割(semantic segmentation)和实例分割(instance segmentation),前者是对前背景分离的拓展,要求分离开具有不同语义的图像部分,而后者是检测任务的拓展, 的轮廓(相比检测框更为精细)。   ### 1. 目标检测概述 ## 目标检测和识别0 码力 | 43 页 | 4.12 MB | 2 年前3
高效智能运维[云+社区技术沙龙第29期] - 腾讯智能运维(Metis)项目实践年6月-2017年7月 • 智能运维系统:机器学习+业务运维,2017年8月-至今 ## 目录 01 / 智能运维场景描述 整体介绍 02 / 单维时间序列分析 异常检测 03 / 多维时间序列分析 多维下钻 04 / Metis 的研究方向 展望未来 ## 基于机器学习的智能运维 ## 智能运维(AIOps)  发现问题 - 时间序列异常 · 日志分析异常 · 设备性能异常 分析问题 · 多维下钻分析 · 关联事件分析 • 容量预估分析 解决问题 ·扩容 • 决策 • 调度 • 优化 ## 智能运维组件库 · 尝试应用:开始尝试应用AI能力,还无较成熟单点应用 主场景均实现流程化免干预AI运维能力 串联AI运维应用如故障自愈 AI运维组件(组件)库 智能预测 智能变更 问答机器人 变更机器人 建议机器人 质量 AI运维组件(组件)库 异常检测 异常预测 根因分析 舆情监控 成本 AI运维组件(组件)库 性能调优 成本分析 强化改进 碎片整理 容量管理 ## 运维开发框架及工具库 AI算法平台和算法库 离线计算 实时计算0 码力 | 28 页 | 1.88 MB | 2 年前3
《TensorFlow 2项目进阶实战》4-商品检测篇:使用RetinaNet瞄准你的货架商品商品检测篇:使用 RetinaNet 瞄准你的货架商品 ## ☐ ☐ ☐ ☐ 扫码试看/订阅 《 TensorFlow 2 项目进阶实战》视频课程 ## 目录 - 基础:目标检测问题定义与说明 - 基础:R-CNN系列二阶段模型综述 - 基础:YOLO系列一阶段模型概述 - 基础:RetinaNet 与 Facol Loss 带来了什么 - 应用:检测数据准备与标注 - 应用:划分检测训练集与测试集 应用:划分检测训练集与测试集 - 应用:生成 CSV 格式数据集与标注 - 应用:使用 TensorFlow 2 训练 RetinaNet - 应用:使用 RetinaNet 检测货架商品 - 扩展:目标检测常用数据集综述 - 扩展:目标检测更多应用场景介绍 ## 基础:目标检测问题定义与说明 ## 目标检测问题 图像分类  目标检测  狗 ## 目标检测评估:Ground Truth  ## 大纲 - 并发 - 接口 - 垃圾回收 - 调度 - 死锁检测 ## 并发  ## 并发 • goroutine提供轻量的并发机制 aa130ac07ef5c/p13_1.jpg) - 研究课题:能否实现lock-free channels? ## 大纲 - 并发 - 接口 - 垃圾回收 - 调度 - 死锁检测 ## 接口 • 接口定义了一系列方法 - 如果类型实现了这些方法,它就实现了这个接口 • 接口不依赖实现 - 避免了过度设计,比如OO里面基于继承的方式 ## 接口  - Java把所有东西都打包了,只有一个函数。(运行时累) - 研究课题:怎么样实现才合理? ## 大纲 - 并发 - 接口 - 垃圾回收 - 调度 - 死锁检测 ## 垃圾回收 • 王尼玛:内存管理太重要!交给机器我不放心 • 曹尼玛:内存管理太重要!给王尼玛管我不放心 Go还是很体贴大伙的~ 












