故障率 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

Estimation of Availability and Reliability in CurveBS

0 码力 | 2 页 | 34.51 KB | 1 年前
3
阿里巴巴超大规模神龙裸金属 Kubernetes 集群运维实践

上云效率提升 ||物理机（云下）|神龙裸金属（云上）| |---|---|---| |交付周期|周|分钟级| |弹性扩缩容|\-|支持| |性能|独占|独占（优于普通ECS）| |硬件故障率|硬盘1年故障率 2%|0.8%（无本地盘）| |硬件维修周期|\[周，月]|\[分钟，天]| ## 效率成本 ## 稳定 ## 云化架构上层业务集团业务 k8s extended Service

0 码力 | 21 页 | 7.81 MB | 1 年前
3
Greenplum 精粹文集

master，所以 master 节点的可用性直接关系到集群的稳定，但从实践经验来看，由于 master 节点只存元数据，只负责 SQL 的解析、分发以及最终计算结果的展现，所以承担的负载一般都非常小，故障率也极低，在我们维护阿里 Greenplum 集群 3 年的时间里，以及接触到的客户中，基本上没有碰到由于 master 故障导致集群不可用的情况，唯一一次，还是因为客户误操作同时将 master 和 · 分布键：均匀为第一大原则，选取更有业务意义的字段，并非必须选择原库的主键（PK）。 ## · 压缩表使用：大表都要采用压缩存储，既节省空间也节省IO资源。长远来看还可降低阵列卡和磁盘的故障率。 ## ·行存还是列存：列存储有更高的压缩率，合适于聚合运算，但不合适于宽表。一个数据库中不应只有一种存储方式，每张表应依据实际情况设计存储方式。 ## ·临时表：对于程序中所使用到的临时表和中间表，上述

0 码力 | 64 页 | 2.73 MB | 2 年前
3
PyConChina2022-深圳-Python赋能智慧物流-康昊

[Image](/uploads/documents/f/6/9/2/f692d374e70babf491cc67f5a925e030/p17_1.jpg) 3454.8公里累积里程 0 (未解决0) 当天故障数 0% 故障率 ![Image](/uploads/documents/f/6/9/2/f692d374e70babf491cc67f5a925e030/p17_2.jpg) 出入库任务运营日统计 ![

0 码力 | 22 页 | 3.81 MB | 2 年前
3
03-基于Apache APISIX的全流量API网关-温铭

[Image](/uploads/documents/4/4/6/6/44668c418367f4f67b6cff6d55c4e684/p2_3.jpg) 微服务的精细管理带来服务的弹性伸缩、开发团队变得敏捷、服务之间隔离、降低故障率但是同样的带来的一些问题: 接口之间通用的功能重复开发、膨胀的服务数量、难以管理使用API网关模式 ![Image](/uploads/documents/4/4/6/6/44668c4

0 码力 | 11 页 | 6.56 MB | 1 年前
3
可发布版-美团点评微服务OCTO-曹继光

为全体业务侧，提供一致的使用体验 • HTTP服务强依赖DNS、Nginx，调用路径依赖多，易受故障影响 ## 收敛内网 Http服务 • 内网服务统一收敛到OCTO-RPC，提升性能、降低故障率 · 降低业务开发内网服务时选择成本 ## 服务治理实践(3): 易用性 - 黄金段位轻量级服务框架 - 底层治理功能下移到SGAgent，动态功能上移到OCTO-Portal - 简化配置，减少第三方依赖

0 码力 | 35 页 | 14.10 MB | 2 年前
3
云原生虚拟数仓PieCloudDB Database产品白皮书

数仓，企业往往会需要配备运维人力，且对运维、开发人员要求高，需要相关人员掌握复杂的技术栈，技术的更新迭代迅速，相关人员需保持积极的知识更新意识。相关人才市场较小，人才匮乏。高昂的学习成本造成用户使用过程中性能差、故障率高、故障修复时间长等问题。 ## 云时代的数据处理要求随着数据量和计算能力的爆发式增长，云计算技术的迅猛发展，云原生架构愈受欢迎，云原生时代应运而生。云原生时代，越来越多的企业将应用向云上迁移

0 码力 | 17 页 | 2.02 MB | 2 年前
3
云计算白皮书

稳定性层面，云上系统稳定性挑战持续存在，系统稳定性保障体系不断完善、技术不断创新。云上系统自带“分布式”属性，各模块之间依赖关系错综复杂，给服务性能分析、故障定位、根因分析等带来了诸多困难；云上系统故障率随设备数量的增加而呈指数级增长，单一节点问题可能会被无限放大，日常运行过程中一定会伴随“异常”发生；同时，节点分布范围更广，节点数量更多，对日常运维过程中的日志采集、变更升级等都带来了新的挑战。基于

0 码力 | 47 页 | 1.22 MB | 2 年前
3
Ceph分布式存储实战 (云计算与虚拟化技术丛书)

从公式看，C（R，N）对于一个既定的Ceph集群值是不变的（从侧面也证明副本数越多，集群规模越大，PG丢失的概率也越低），所以尽量缩小Pr、M的值。从上面看出Pr值关联因素，一是缩小OSD硬盘的故障率，二是缩短恢复的时间。缩小OSD故障率就是选择可靠的硬盘。恢复时间的多与少取决于故障域的大小。默认的CRUSH的故障域是Host级。对于一个Host有3个OSD的主机，同时可恢复的OSD就是两个，如图10-7所示。

0 码力 | - 页 | 13.97 MB | 1 年前
3
美团点评2018技术年货

未注册的手机号码验证后自动创建点评账户登录登录遇到问题短信验证码暂时不可用，请使用其他登录方式！ Debug 3. 异地多活除了柔性可用，还有一种思路可以来延长不出故障的时间，那就是做冗余，冗余的越多，系统的故障率就越低，并且是呈指数级降低。不管是机房故障，还是存储故障，甚至是网络故障，都能依赖冗余去解决，比如数据库可以通过增加从库的方式做冗余，服务层可以通过分布式架构做冗余，但是冗余也会带来新的问题，比如成

0 码力 | 229 页 | 61.61 MB | 2 年前
3

共 12 条前往

页

分类

语言

格式

Estimation of Availability and Reliability in CurveBS

阿里巴巴超大规模神龙裸金属 Kubernetes 集群运维实践

Greenplum 精粹文集

PyConChina2022-深圳-Python赋能智慧物流-康昊

03-基于Apache APISIX的全流量API网关-温铭

可发布版-美团点评微服务OCTO-曹继光

云原生虚拟数仓PieCloudDB Database产品白皮书

云计算白皮书

Ceph分布式存储实战 (云计算与虚拟化技术丛书)

美团点评2018技术年货

搜索

分类

语言

格式