Estimation of Availability and Reliability in CurveBS0 码力 | 2 页 | 34.51 KB | 1 年前3
阿里巴巴超大规模神龙裸金属 Kubernetes 集群运维实践上云效率提升 ||物理机(云下)|神龙裸金属(云上)| |---|---|---| |交付周期|周|分钟级| |弹性扩缩容|\-|支持| |性能|独占|独占(优于普通ECS)| |硬件故障率|硬盘1年故障率 2%|0.8%(无本地盘)| |硬件维修周期|\[周,月]|\[分钟,天]| ## 效率 成本 ## 稳定 ## 云化架构 上层业务 集团业务 k8s extended Service0 码力 | 21 页 | 7.81 MB | 1 年前3
Greenplum 精粹文集master,所以 master 节点的可用性直接关系到集群的稳定,但从实践经验来看,由于 master 节点只存元数据,只负责 SQL 的解析、分发以及最终计算结果的展现,所以承担的负载一般都非常小,故障率也极低,在我们维护阿里 Greenplum 集群 3 年的时间里,以及接触到的客户中,基本上没有碰到由于 master 故障导致集群不可用的情况,唯一一次,还是因为客户误操作同时将 master 和 · 分布键: 均匀为第一大原则,选取更有业务意义的字段,并非必须选择原库的主键(PK)。 ## · 压缩表使用: 大表都要采用压缩存储,既节省空间也节省IO资源。长远来看还可降低阵列卡和磁盘的故障率。 ## ·行存还是列存: 列存储有更高的压缩率,合适于聚合运算,但不合适于宽表。一个数据库中不应只有一种存储方式,每张表应依据实际情况设计存储方式。 ## ·临时表: 对于程序中所使用到的临时表和中间表,上述0 码力 | 64 页 | 2.73 MB | 2 年前3
PyConChina2022-深圳-Python赋能智慧物流-康昊[Image](/uploads/documents/f/6/9/2/f692d374e70babf491cc67f5a925e030/p17_1.jpg) 3454.8公里累积里程 0 (未解决0) 当天故障数 0% 故障率  出入库任务运营日统计  微服务的精细管理带来服务的弹性伸缩、开发团队变得敏捷、服务之间隔离、降低故障率 但是同样的带来的一些问题: 接口之间通用的功能重复开发、膨胀的服务数量、难以管理 使用API网关模式 : 易用性 - 黄金段位 轻量级服务框架 - 底层治理功能下移到SGAgent,动态功能上移到OCTO-Portal - 简化配置,减少第三方依赖0 码力 | 35 页 | 14.10 MB | 2 年前3
云原生虚拟数仓PieCloudDB Database产品白皮书数仓,企业往往会需要配备运维人力,且对运维、开发人员要求高,需要相关人员掌握复杂的技术栈,技术的更新迭代迅速,相关人员需保持积极的知识更新意识。相关人才市场较小,人才匮乏。高昂的学习成本造成用户使用过程中性能差、故障率高、故障修复时间长等问题。 ## 云时代的数据处理要求 随着数据量和计算能力的爆发式增长,云计算技术的迅猛发展,云原生架构愈受欢迎,云原生时代应运而生。云原生时代,越来越多的企业将应用向云上迁移0 码力 | 17 页 | 2.02 MB | 1 年前3
云计算白皮书稳定性层面,云上系统稳定性挑战持续存在,系统稳定性保障 体系不断完善、技术不断创新。云上系统自带“分布式”属性,各模块之间依赖关系错综复杂,给服务性能分析、故障定位、根因分析等带来了诸多困难;云上系统故障率随设备数量的增加而呈指数级增长,单一节点问题可能会被无限放大,日常运行过程中一定会伴随“异常”发生;同时,节点分布范围更广,节点数量更多,对日常运维过程中的日志采集、变更升级等都带来了新的挑战。基于0 码力 | 47 页 | 1.22 MB | 2 年前3
Ceph分布式存储实战 (云计算与虚拟化技术丛书)从公式看,C(R,N)对于一个既定的Ceph集群值是不变的(从侧面也证明副本数越多,集群规模越大,PG丢失的概率也越低),所以尽量缩小Pr、M的值。 从上面看出Pr值关联因素,一是缩小OSD硬盘的故障率,二是缩短恢复的时间。 缩小OSD故障率就是选择可靠的硬盘。 恢复时间的多与少取决于故障域的大小。默认的CRUSH的故障域是Host级。对于一个Host有3个OSD的主机,同时可恢复的OSD就是两个,如图10-7所示。0 码力 | - 页 | 13.97 MB | 1 年前3
美团点评2018技术年货未注册的手机号码验证后自动创建点评账户 登录 登录遇到问题 短信验证码暂时不可用,请使用其他登录方式! Debug 3. 异地多活 除了柔性可用,还有一种思路可以来延长不出故障的时间,那就是做冗余,冗余的越多,系统的故障率就越低,并且是呈指数级降低。不管是机房故障,还是存储故障,甚至是网络故障,都能依赖冗余去解决,比如数据库可以通过增加从库的方式做冗余,服务层可以通过分布式架构做冗余,但是冗余也会带来新的问题,比如成0 码力 | 229 页 | 61.61 MB | 2 年前3
共 12 条
- 1
- 2













