清理冗余 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

CurveFS S3数据整理(合并碎片、清理冗余)

curvefs s3数据整理(合并碎片、清理冗余) ## 背景 1. 只考虑单客户端，单metaserver 2. 为了解决的问题：客户端在对一个文件的某个部分多次写入后，同一个chunk会产生很多版本数据；而客户端在读的时候，会需要对这些chunk进行筛选和构建，得到有效的部分，越是散乱的状态，就越需要发送更多次读请求至s3．最后导致无效旧数据的堆积和读请求性能的下降，所以需要在合适的时候进行重叠元数据和数据的合并态（出现概率较小） 1. 可以在实际删除前检查当前整理的inode列表，如果在列表里就暂时跳过(同步删除)/重新丢进删除队列(异步删除) 2. 或者就不管，处理一下报错，让后续的应该会开发的数据清理工具来删除，因为出现这个冲突的概率比较小 truncate：只进行元数据里len的改变，触发一下compact就行，shrink的部分compact会进行处理

0 码力 | 3 页 | 101.58 KB | 1 年前
3
如何用 MySQL 构建全方位高可用应用

支持高可用性的各个层并不仅仅是可靠地存储数据冗余应用服务器数据的冗余访问路径 ![Image](/uploads/documents/4/8/4/c/484c9d62390ce6f7d8cf5e435c4c269f/p4_1.jpg) 数据路由数据冗余存储 ## 支持高可用性的各个层并不仅仅是可靠地存储数据冗余应用服务器数据的冗余访问路径 ![Image](/upload [Image](/uploads/documents/4/8/4/c/484c9d62390ce6f7d8cf5e435c4c269f/p5_1.jpg) • MySQL Replication 数据冗余存储 • Shared Storage • Group Replication • MySQL Cluster ## MySQL 复制工作流二进制日志会话转储中继日志 ![Image](/ 线程：接收复制事件，并将其存储在从数据库的中继日志中 - SQL 线程：读取从数据库的中继日志中的复制事件，然后将其应用到从数据库 ## 为何进行复制？ - 将数据库从 “主服务器” 复制到 “从服务器” – 数据的冗余副本奠定了高可用性的基础 – 通过在复制场中进行分布式查询来扩展 ![Image](/uploads/documents/4/8/4/c/484c9d62390ce6f7d8cf5e435c4c269f/p7_1

0 码力 | 40 页 | 2.19 MB | 2 年前
3
Firebird 2.1.5 Installation

0 码力 | 46 页 | 217.89 KB | 2 年前
3
CurveFS S3本地缓存盘方案

本次io在本地硬盘写入好之后，异步上传模块会适时把本地硬盘写缓存目录中的文件上传到远端对象存储集群，上传成功后，删除本地写缓存目录中的对应文件。同时，缓存清理模块会定时检查本地硬盘缓存目录容量情况，如果容量已经达到阈值了，则进行文件的清理工作。另外，异常管理模块处理客户端挂掉后的文件重新上传问题。 ## 主要数据结构定义 class DiskCacheManagerImpl : public 这样，写缓存目录中的文件上传完之后就可以直接删除了，那么该文件的读缓存还是存在的。 • 缓存盘空间管理当缓存文件内容达到阈值时，停止向本地缓存盘写入。同时，缓存清理模块会定时检查本地硬盘缓存目录容量情况，如果容量已经达到阈值了，则进行文件的清理工作。 • 本地缓存盘的异步上传工作队列：该队列中保存缓存盘中的待上传文件名工作线程：遍历工作队列（队列swap），从缓存盘目录读取到文件内容并上传

0 码力 | 9 页 | 150.46 KB | 1 年前
3
OpenShift Container Platform 4.7 日志记录

集群滚动重启 57 4.3.9. 将日志存储服务公开为路由 60 4.4. 配置日志可视化工具 63 4.4.1. 配置 CPU 和内存限值 63 4.4.2. 为日志可视化器节点扩展冗余性 64 4.5. 配置 OPENSHIFT LOGGING 存储 65 4.5.1. OpenShift Logging 和 OpenShift Container Platform 的存储注意事项来为分片制作备份（称为 replica（副本）），Elasticsearch 也会分散到 Elasticsearch 节点上。ClusterLogging 自定义资源（CR）允许您指定如何复制分片，以提供数据冗余和故障恢复能力。您还可以使用ClusterLogging CR中的保留策略来指定不同类型的日志的保留的时长。 ![Image](/uploads/documents/f/0/5/8/f058047 ents/f/0/5/8/f058047a6bb5b564ffd8eb060ef4374c/p34_7.jpg) 用于配置 Kibana 的设置。通过使用 CR，您可以扩展 Kibana 来实现冗余性，并为 Kibana 节点配置 CPU 和内存。如需更多信息，请参阅配置日志可视化工具。 ![Image](/uploads/documents/f/0/5/8/f058047a6bb5b564

0 码力 | 183 页 | 1.98 MB | 2 年前
3
OpenShift Container Platform 4.8 日志记录

Fluentd 是一个日志收集器，它驻留在每个 OpenShift Container Platform 节点上。它收集应用程序、基础架构和审计日志并将其转发到不同的输出。 ## 垃圾回收垃圾回收是清理集群资源的过程，如终止的容器和没有被任何正在运行的 pod 引用的镜像。 ## Elasticsearch Elasticsearch 是一个分布式搜索和分析引擎。OpenShift Container 来为分片制作备份（称为 replica（副本）），Elasticsearch 也会分散到 Elasticsearch 节点上。ClusterLogging 自定义资源（CR）允许您指定如何复制分片，以提供数据冗余和故障恢复能力。您还可以使用 ClusterLogging CR 中的保留策略来指定不同类型的日志的保留的时长。 ![Image](/uploads/documents/5/a/9/2/5a929 ents/5/a/9/2/5a929cacb989bfad7a4ea2e6bae9886c/p64_5.jpg) 用于配置 Kibana 的设置。通过使用 CR，您可以扩展 Kibana 来实现冗余性，并为 Kibana 节点配置 CPU 和内存。如需更多信息，请参阅配置日志可视化工具。 ![Image](/uploads/documents/5/a/9/2/5a929cacb989bfad

0 码力 | 223 页 | 2.28 MB | 2 年前
3
美团点评2018技术年货

此数据清空，重新请求Redis获取数据做缓存。在查询中做时效性判断可以最低程度的减少时效判断对服务的中断。当LruCache预设上限较低时，定期做全量数据清理对于服务本身影响较小。但如果LruCache的预设上限非常高，则一次全量数据清理耗时可能达到秒级甚至分钟级，将严重阻断服务本身的运行。所以将时效性判断加入到查询中，只对单一的缓存单元做时效性判断，在服务性能和数据有效性之间做了折中，满足业务需求。的策略使用完全独立，一个Location可以启用该服务的一个或者多个私有策略。如果通过Host+location_path直接关联策略数据，不同Location关联同一个私有策略时，会存在大量的数据冗余。所以我们通过服务标识（appkey，唯一标识一个应用服务）关联具体的策略数据，Host+location_path只关联当前Location使用的策略名列表，策略之间支持指定顺序。公共策略与具体服面及资源发生变更时，manifest文件内容同步更新。当浏览器监测到manifest文件有更新时，会自动重新下载manifest里面的文件。AppCache的一个缺点是缓存文件会越来越多，缓存不容易清理。AppCache未来会逐步被Service Worker所取代，无论从灵活性还是可扩展性而言，SW都更胜一筹。 2. 目前在使用的是公司平台自研的离线包框架，相比于AppCache，离线包框架在

0 码力 | 229 页 | 61.61 MB | 2 年前
3
Greenplum Database 管理员指南 6.2.1

计算实例：Instance..... -14 内联网络：Interconnect..... -14 冗余与故障切换..... -15 Instance 镜像..... -15 Instance 故障切换与恢复..... -17 Master 镜像..... -17 网络层冗余..... -18 并行数据装载..... -18 管理与监控..... -19 第二章：分布式数据库概念 425b2/p11_1.jpg) 这一章节介绍组成 GP 数据库系统的组件及如何协同工作：管理节点：Master - 计算实例：Instance 内联网络：Interconnect • 冗余与故障切换并行数据装载管理与监控 ## 管理节点：Master Master 作为 GP 的访问入口，主要负责处理客户端连接的访问以及用户提交的 SQL 语句的解析、生成执行计划、优化执行计划等。Master 协议不稳定，可以考虑使用 TCP 协议，例如只有几十台主机时。通常，还是强烈建议配备稳定的网络环境，使用 UDPIFC 协议。 ## 冗余与故障切换 GP 提供了避免单点故障的部署选项。本节讲述 GP 的冗余组件。 • Instance 镜像 Master 镜像网络层冗余 ## I nstance 镜像在部署 GP 系统时，可以选择配置 Mirror，如果初始化时没有配置 Mirror，后期也可以再次添加

0 码力 | 416 页 | 6.08 MB | 2 年前
3
Debian 参考手册（版本 2.109）

软件包活动日志 2.3 aptitude 操作范例 2.3.1 查找感兴趣的软件包 2.3.2 通过正则表达式匹配软件包名称来列出软件包 2.3.3 使用正则表达式匹配浏览 2.3.4 完整地清理已删除软件包 2.3.5 调整自动/手动安装状态 2.3.6 全面的系统升级 2.4 高级软件包管理操作 2.4.1 命令行中的高级软件包管理操作 2.4.2 验证安装的软件包文件磁盘映像 ..... 160 9.7.1 制作磁盘映像文件 ..... 160 9.7.2 直接写入硬盘 ..... 160 9.7.3 挂载磁盘映像文件 ..... 161 9.7.4 清理磁盘映像文件 ..... 162 9.7.5 制作空的磁盘映像文件 ..... 162 9.7.6 制作 ISO9660 镜像文件 ..... 163 9.7.7 直接写入文件到 CD/DVD-R/RW 镜像文件 ..... 164 9.8 二进制数据 ..... 164 9.8.1 查看和编辑二进制数据 ..... 164 9.8.2 不挂载磁盘操作文件 ..... 164 9.8.3 数据冗余 ..... 165 9.8.4 数据文件恢复和诊断分析 ..... 165 9.8.5 把大文件分成多个小文件 ..... 165 9.8.6 清空文件内容 ..... 166 9

0 码力 | 261 页 | 1.39 MB | 2 年前
3
openEuler 24.03 LTS 技术白皮书

2.jpg) ## 功能描述 ## 高可用针对 MGR 进行了大量改进和提升工作，新增支持地理标签、仲裁节点、读写节点可绑定动态 IP、快速单主模式、智能选主，并针对流控算法、事务认证队列清理算法、节点加入 & 退出机制、recovery 机制等多项 MGR 底层工作机制算法进行深度优化，进一步提升优化了 MGR 的高可用保障及性能稳定性。 - 支持地理标签特性，提升多机房架构数据可靠性。支持快速单主模式，在单主模式下更快，性能更高。 - 支持智能选主特性，高可用切换选主机制更合理。 - 采用全新流控算法，使得事务更平稳，避免剧烈抖动。 - 优化了节点加入、退出时可能导致性能剧烈抖动的问题。 - 优化事务认证队列清理算法，高负载下不复存在每 60 秒性能抖动问题。 - 解决了个别节点上磁盘空间爆满时导致 MGR 集群整体被阻塞的问题。 - 解决了长事务造成无法选主的问题。 - 修复了 recovery 过程中长时间等待的问题。的性能。 - 支持内存布局优化，通过重新排布结构体成员的位置，使得频繁访问的结构体成员放置于连续的内存空间上，提升 Cache 的命中率，提升程序运行的性能。支持冗余成员消除优化，消除结构体中从不读取的结构体成员，同时删除冗余的写语句，缩小结构体占用内存大小，降低内存带宽压力，提升性能。支持数组比较优化，实现数组元素并行比较，提高执行效率。 - 支持数组比较优化，实现数组元素并行比较，提高执行效率。

0 码力 | 45 页 | 6.18 MB | 2 年前
3

共 516 条前往

页

分类

语言

格式

CurveFS S3数据整理(合并碎片、清理冗余)

如何用 MySQL 构建全方位高可用应用

Firebird 2.1.5 Installation

CurveFS S3本地缓存盘方案

OpenShift Container Platform 4.7 日志记录

OpenShift Container Platform 4.8 日志记录

美团点评2018技术年货

Greenplum Database 管理员指南 6.2.1

Debian 参考手册（版本 2.109）

openEuler 24.03 LTS 技术白皮书

搜索

分类

语言

格式