副本如何用CLup管理PolarDB0 码力 | 34 页 | 3.59 MB | 1 年前3
CurveFS S3数据整理(合并碎片、清理冗余)curvefs s3数据整理(合并碎片、清理冗余) ## 背景 1. 只考虑单客户端,单metaserver 2. 为了解决的问题:客户端在对一个文件的某个部分多次写入后,同一个chunk会产生很多版本数据;而客户端在读的时候,会需要对这些chunk进行筛选和构建,得到有效的部分,越是散乱的状态,就越需要发送更多次读请求至s3.最后导致无效旧数据的堆积和读请求性能的下降,所以需要在合适的时候进行重叠元数据和数据的合并0 码力 | 3 页 | 101.58 KB | 1 年前3
如何用 MySQL 构建全方位高可用应用支持高可用性的各个层 并不仅仅是可靠地存储数据 冗余应用服务器 数据的冗余访问路径  数据路由 数据冗余存储 ## 支持高可用性的各个层 并不仅仅是可靠地存储数据 冗余应用服务器 数据的冗余访问路径  • MySQL Replication 数据冗余存储 • Shared Storage • Group Replication • MySQL Cluster ## MySQL 复制工作流 二进制日志 会话 转储 中继日志 ),Elasticsearch 也会分散到 Elasticsearch 节点上。ClusterLogging 自定义资源(CR)允许您指定如何复制分片,以提供数据冗余和故障恢复能力。您还可以使用 ClusterLogging CR 中的保留策略来指定不同类型的日志的保留的时长。 ents/5/a/9/2/5a929cacb989bfad7a4ea2e6bae9886c/p64_5.jpg) 用于配置 Kibana 的设置。通过使用 CR,您可以扩展 Kibana 来实现冗余性,并为 Kibana 节点配置 CPU 和内存。如需更多信息,请参阅配置日志可视化工具。 9.4.4 云硬盘测试 9.4.5 利用Cosbench来测试Ceph 9.5 本章小结 第10章 自定义CRUSH 10.1 CRUSH解析 10.2 CRUSH设计:两副本实例 10.3 CRUSH设计:SSD、SATA混合实例 10.3.1 场景一:快-慢存储方案 10.3.2 场景二:主-备存储方案 10.4 模拟测试CRUSH分布 10.5 本章小结 13.1.1 集群扩展 13.1.2 集群维护 13.1.3 集群监控 13.2 Ceph常见错误与解决方案 13.2.1 时间问题 13.2.2 副本数问题 13.2.3 PG问题 13.2.4 OSD问题 13.3 本章小结 ## 本书赞誉 正如OpenStack日渐成为开源云计算的标准软件栈,Ceph也被誉为软 块硬盘读写的聚合能力,又能提供硬盘故障的容错能力。 镜像技术(Mirroring)又称为复制技术(Replication),可提供数据冗余性和高可用性;条带(Striping),可提供并行的数据吞吐能力;纠删码(Erasure Code),把数据切片并增加冗余编码而提供高可用性和高速读写能力。镜像、条带和纠删码是磁盘阵列技术经典的数据分发方式,这3种经典的磁盘技术可通过组合方式提供更加丰富的数据读写性能。0 码力 | - 页 | 13.97 MB | 1 年前3
Curve核心组件之mds – 网易数帆MDS各组件详细介绍 03 Q&A ## 基本架构 ## • 元数据节点 MDS 管理元数据信息 收集集群状态信息,自动调度 - 数据节点 Chunkserver 数据存储 副本一致性 • 客户端 Client 对元数据增删改查 对数据增删改查 快照克隆服务器 ,chunkserver以一块磁盘作为最小的服务单元。 ## TOPOLOGY curve在上物理pool之上又引入逻辑pool的概念,以实现统一存储系统的需求,即在单个存储系统中多副本PageFile支持块设备、三副本AppendFile(待开发)支持在线对象存储、AppendECFile(待开发)支持近线对象存储可以共存。 如上所示LogicalPool与pool为多对一的关系,一个物理poo0 码力 | 23 页 | 1.74 MB | 1 年前3
2022年美团技术年货 合辑野,不再集中于用户的短期兴趣,能更好地满足用户口味“短聚集,长多样”的特性。 在后续的数据探查中,基于样本维度统计了二级品类 ID 检索序列、meal_time 检索序列和 distance 存在冗余信息,并且需要分别建模三个序列,带来的性能压力较大。其次,将情境割裂成一个个单独的维度进行建模,无法建模他们之间的联系,更真实准确的情况应该是对用户所处情境的不同维度进行统一建模。针对这两个问题,我们正在情境 2)用户序列计算图折叠。长序列模块的加入,给线上计算带来了巨大压力,因此考虑对线上计算图进行优化。由于一次请求中,在 Batch 内部,用户部分序列输入都是一致的,原始计算图对用户序列做投影时,会产生大量重复冗余计算。基于这一点,我们在请求模型服务时将用户侧序列的 id 查询模块以及投影计算在计算图中进行折叠,如图 8 所示,把用户侧特征 batch size 先缩小至 1,只计算一次,然后与候选商家计算 attention 店判断为不相关,从而对用户体验带来伤害。 为了获取最全面的 POI 表征,一种方案是不抽取关键词,直接将商户的所有字段拼接到模型输入中,但是这种方式会因为模型输入长度过长而严重影响线上性能,且大量冗余信息也会影响模型表现。 为构造更具信息量的 POI 侧信息作为模型输入,我们提出了 POI 匹配字段摘要抽取的方法,即结合线上 Query 的匹配情况实时抽取 POI 的匹配字段文本,并构造匹配字段摘要作为0 码力 | 1356 页 | 45.90 MB | 2 年前3
共 543 条
- 1
- 2
- 3
- 4
- 5
- 6
- 55













