缓存清理 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

CurveFS S3数据整理(合并碎片、清理冗余)

curvefs s3数据整理(合并碎片、清理冗余) ## 背景 1. 只考虑单客户端，单metaserver 2. 为了解决的问题：客户端在对一个文件的某个部分多次写入后，同一个chunk会产生很多版本数据；而客户端在读的时候，会需要对这些chunk进行筛选和构建，得到有效的部分，越是散乱的状态，就越需要发送更多次读请求至s3．最后导致无效旧数据的堆积和读请求性能的下降，所以需要在合适的时候进行重叠元数据和数据的合并 objects列表，由于新增了version字段，不会涉及到覆盖老的对象 - 加锁，增量的更新inode的s3chunkinfolist，保证原子更新，更新失败回退新增数据 - 等待N秒，保证mds已经告知client缓存失效，需要更新为新的s3chunkinfolist // 需不需要这个步骤@xuchaojie@chenwei确认 ## 问题与风险 1. 在执行变更时，在bcd步挂掉时，会造成s3数据的残留读：在执行变更删除原来的s3 object时，执行读的客户端的缓存可能还是原有的chunkinfolist，可能会去读已经删除的object，这种时候读会失败可以使用双重保证 1. 读失败的时候 retry，或许可以重拉 metadata 2. 整理后，mds在一个时间间隔内主动告知client这个inode元数据缓存失效，重拉 ## 写：只是对chunkinfolist做新增，不影响整理对原有部分的变更

0 码力 | 3 页 | 101.58 KB | 1 年前
3
Curve支持S3 数据缓存方案

Curve支持S3 数据缓存方案 |版本|时间|修改者|修改内容| |---|---|---|---| |1.0|2021/8/18|胡遥|初稿| ||||| 背景 · 整体设计 - 元数据采用2层索引 - 对象名设计 - 读写缓存分离 • 缓存层级 • 对外接口 • 后台刷数据线程 • 本地磁盘缓存 - 关键数据结构 - 详细设计 - Write流程。 ## 整体设计整个dataCache的设计思路，在写场景下能将数据尽可能的合并后flush到s3上，在读场景上，能够预读1个block大小，减少顺序读对于底层s3的访问频次。从这个思路上该缓存方案主要针对的场景是顺序写和顺序读，而对于随机写和随机读来说也会有一定性能提升，但效果可能不会太好。 ## 元数据采用2层索引由于chunk大小是固定的（默认64M），所以Inode中采用map缓存分离读写缓存的设计采用的是读写缓存分离的方案。即读写缓存相互没影响不相关，写缓存一旦flush即释放，读缓存采用可设置的策略进行淘汰（默认LRU），对于小io进行block级别的预读。 ## 缓存层级缓存层级分为fs->file->chunk->datacache 4层，通过i

0 码力 | 9 页 | 179.72 KB | 1 年前
3
2.1.1 Golang主动式内存缓存的优化探索之路

Golang主动式内存缓存的优化探索之路安晏伯学而思网校技术专家 ![Image](/uploads/documents/9/e/6/2/9e620d5d0bebcc7629a529dcbf0fae11/p2_1.jpg) 问题引入 01 难点攻克 02 主动式内存缓存框架 03 总结 04 ## 第一部分 ## 问题引入 ## 为什么能有极致的性能？主动式内存缓存如何优化？ • 主动式内存缓存，如何保证数据实时性？ - 数据太多，内存不够用，如何进行存储扩展？ ## 第二部分难点攻克 ## “ ## 数据一致性如何保证？ ## 一致性同步、更新 ![Image](/uploads/documents/9/e/6/2/9e620d5d0bebcc7629a529dcbf0fae11/p11_1.jpg) ## ➢ 被动方式 ✓ 缓存过期 ✓ 定期同步 ## 存储扩展 ![Image](/uploads/documents/9/e/6/2/9e620d5d0bebcc7629a529dcbf0fae11/p17_1.jpg) 存储空间 VS 缓存性能 ## 冷热可交换，引擎可扩展 IStore Norma $ \tilde{M} $ ap MemoryTile CMap map[int]interface{} ![Im

0 码力 | 48 页 | 6.06 MB | 2 年前
3
CurveFS S3本地缓存盘方案

Curvefs-S3 本地写缓存盘方案背景方案设计主要数据结构定义方案设计思考 POC验证 ## 背景当前，s3客户端在写底层存储的时候是直接写入远端对象存储，由于写远端时延相对会较高，所以为了提升性能，引入了写本地缓存盘方案。也即要写底层存储时，先把数据写到本地缓存硬盘，然后再把本地缓存硬盘中的数据异步上传到远端对象存储。 ## 方案设计 ![Image] jpg) S3模块接收到写入后先写入写内存缓存页，如果满足持久化的条件后，那么则准备持久化。做一个硬链接链接到该文件。本次io在本地硬盘写入好之后，异步上传模块会适时把本地硬盘写缓存目录中的文件上传到远端对象存储集群，上传成功后，删除本地写缓存目录中的对应文件。同时，缓存清理模块会定时检查本地硬盘缓存目录容量情况，如果容量已经达到阈值了，则进行文件的清理工作。另外，异常管理模块处理客户端挂掉后的文件重新上传问题。配置一个目录用于本地硬盘的文件管理，对作为缓存盘的本地硬盘进行格式化并挂载到该目录（如果没有缓存盘，那一般而言就是系统盘本身了）。 • 本地缓存盘的文件内容表示本地缓存盘存放的文件即是存储到对象存储中的对象。 • 写缓存如何作为读缓存利用除了写缓存目录，另外引入读缓存目录；当写缓存目录中有新文件加入时，则对该文件做硬链接到读缓存目录。这样，写缓存目录中的文件上传完之后就可以直接删除了，那么该文件的读缓存还是存在的。

0 码力 | 9 页 | 150.46 KB | 1 年前
3
firebird cache

0 码力 | 11 页 | 82.76 KB | 2 年前
3
Firebird 2.1.5 Installation

0 码力 | 46 页 | 217.89 KB | 2 年前
3
Cache-Friendly Design in Robot Path Planning

0 码力 | 216 页 | 10.68 MB | 1 年前
3
Apache HTTP Server Documentation Version 2.2

0 码力 | 805 页 | 2.51 MB | 1 年前
3
Apache Kyuubi 1.4.0 Documentation

0 码力 | 148 页 | 6.26 MB | 2 年前
3
Techniques to Optimise Multi-threaded Data Building During Game Development

0 码力 | 99 页 | 2.40 MB | 1 年前
3

共 803 条前往

页

分类

语言

格式

CurveFS S3数据整理(合并碎片、清理冗余)

Curve支持S3 数据缓存方案

2.1.1 Golang主动式内存缓存的优化探索之路

CurveFS S3本地缓存盘方案

firebird cache

Firebird 2.1.5 Installation

Cache-Friendly Design in Robot Path Planning

Apache HTTP Server Documentation Version 2.2

Apache Kyuubi 1.4.0 Documentation

Techniques to Optimise Multi-threaded Data Building During Game Development

搜索

分类

语言

格式