2022 Apache Ozone 的最近进展和实践分享
• Apache Ozone的最近进展 • Apache Ozone的实践分享 ⼤数据存储的需求 能否提供⾼并发读取和写⼊ 是否兼容主流API,如HDFS/S3 是否可以扩展⾄数百PB的存储容量,数千个 物理节点以及数⼗亿个对象 扩展性 API 兼容性 性能 是否⽀持存算分离架构同时也可以兼容存算耦合 架构 应⽤对接 安全 加密 HDFS现有的⼀些解决⽅案 Namenode Federation Ozone适⽤场景 • Apache Ozone的最近进展 • Apache Ozone的实践分享 Apache Ozone • Ozone是 ⼀个分布式的KV对象存储 可扩展⾄数⼗亿个对象,从⽽对云原⽣类的应⽤更友好 强⼀致性 与HDFS 和 S3 API兼容 可在存储密集型设备中部署进⽽极⼤的减少设备开⽀ Apache Ozone – 数据存储的路径设计 Ozone的存储路径为 volumes 负责存储和汇报Storage Containers 5. Storage Containers – Ozone的存储单元,内置有RocksDB 数据库 Apache Ozone – 数据访问的API ofs hdfs dfs -mkdir /volume1/bucket1 o3fs hdfs dfs -ls o3fs://bucket.volume.om-host.com:5678/key0 码力 | 35 页 | 2.57 MB | 1 年前3Ubuntu 桌面培训 2010
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 474 X.III.I 在启动时自动运行系统命令 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 475 X.III.II 更改引导时的默认操作系统 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497 XI.VII.I Ubuntu 中文论坛上,每页都会给显示一条命令,很 酷,从哪里可以找到它们? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 497 XI.VII.IIUbuntu 中文论坛上,都有哪些求助方法? 第一次采用 GNU 通用公共许可证(GPL),发布了 Linux 的 1.0 版本。GNU 工具集连同这个自由的内核给爱好者提供了一个极富潜力的环境。为 了和 UNIX 保持相似,Linux 首先提供了一个命令行界面;此后,X 窗口系统的加入 使图形用户界面成为现实。 小提示 Linux 不隶属于任何个人或公司,甚至不属于开创 Linux 的 Linus Torvalds 本人。 但是,Torvalds0 码力 | 540 页 | 26.26 MB | 1 年前3Kubernetes Operator 实践 - MySQL容器化
extends the Kubernetes API to create, configure and manage instances of complex stateful applications on behalf of a Kubernetes user. operator 是特殊的 controller,用来管理复杂的分布式应用 ü custom resource definition(CRD) Pod、Service、Volume 等 • Kubernetes 1.7 之后增加了 CRD 自定义资源 • 二次开发扩展 Kubernetes API CRD 的基本原理 ① 观察资源的当前状态 ② 分析当前状态与期望状态的差别 ③ 调用 API 消除差别 TestCluster app=test app=test 申请扩容 期望副本数:3 当前副本数:1 VS app=test MySQL 5.5 & 5.7 Master Slave1 Slave2 MySQL 集群:1 主 2 从 MySQL 容器化系统架构 REST CLI Kubernetes Master API Server Scheduler Controller Manager NodeM kubelet kube-proxy docker mysql pod-5 mysql pod-60 码力 | 42 页 | 4.77 MB | 1 年前3强大的音视频处理工具: FFmpeg
参数去指定要扩⼤的宽度和⾼度 参数详解: pad = padding :增加视频区域,即宽度和(或)⾼度 width 和 height :(增加了padding后的)输出的视频的宽 度和⾼度 值的⽅式 固定的数值 表达式 可以借⽤内置⽀持的常量或变量 ⽐如 输⼊的原始视频的 宽度: in_w = iw ⾼度: in_h = ih 输出的padding后的视频的 宽度: ⾊ 命令: 参数说明: ⾼度 可以⽤数值: 460 也可以⽤表达式: ih+100 效果: 希望:调整多个属性 希望: ⾼度:上⾯增加 50 ,下⾯增加 100 总增加⾼度= 50+100 = 150 宽度:左右都增加 30 ,原视频居中 总增加宽度= 30*2 = 60 背景⾊: LawnGreen 透明度: 0.2 命令: pad中的值⽤⼿动计算出的值: "pad=width=0:height=ih+100: "pad=width=0:height=ih+100: 获取 23 或:pad中的值尽量⽤表达式: 效果: 附录: 前⾯折腾期间的命令记录,包括出错的命令: ffmpeg -i input.mp4 -vf ffmpeg -i input.mp4 -vf "pad=width=540:height=510:x=3 "pad=wid0 码力 | 73 页 | 11.57 MB | 1 年前3RocketMQ v3.2.4 开发指南
...................................................................................... 8 4.13 分布式事务 ................................................................................................. ................................................................................ 32 11.2.1 客户端 API 形式 ............................................................................................... BU 提供的仁仁是 Jar 包,例如要定制一个 Broker,那举只需要依赖 rocketmq-broker 返个 jar 包即可,可通过 API 迕行交互, 如果定制 client,则依赖 rocketmq-client 返个 jar 包,对其提供的 api 迕行再封装。 开源社区地址: https://github.com/alibaba/RocketMQ 在 RocketMQ0 码力 | 52 页 | 1.61 MB | 1 年前3MySQL高可用 - 多种方案
1 esac exit 0 2.4.9 Master 和 backup 的启动 启动 master 和 backup 的 mysql 以后,再在 master 和 backup 执行如下命令启 动 keepalived 和 realserver 脚本: /etc/rc.d/init.d/realserver.sh start /etc/rc.d/init.d/keepalived 1 esac exit 0 3.5.8 Master 和 backup 的启动 启动 master 和 backup 的 mysql 以后,再在 master 和 backup 执行如下命令启 动 keepalived 和 realserver 脚本: /etc/rc.d/init.d/realserver.sh start /etc/rc.d/init.d/keepalived 预期 效果,大致测试步骤如下: 停掉 master 上的 mysql,看看能写 IP 否自动切换到 sorry_server,看看读 IP 是否去掉了 master 的 mysql,使用如下命令查看:ipvsadm –ln。 停掉 master 上的 keepalived,看读写 VIP 是否会迁移到 backup 上。 启动 master 上的 mysql,看是否能切换回0 码力 | 31 页 | 874.28 KB | 1 年前3GPU Resource Management On JDOS
常规的容器服务 ,使用 gpu 的 zone , 自行设定相应的镜像即 可,有完善的周边服务 训练服务 • 提供基于 kubeflow 的分布式训练方案 – 界面化操作,用户提供代码地址和执行命令即可 – 系统内建支持安装 pip 依赖 – 自制存储插件支持分布式文件系统存储用户数据 – 支持官方镜像,不需要 JDOS 提前协助制作镜像 – 提供 tensorboard 作为训练监控实时查看训练状态 – Job 调度 (部门 quota 限制 + 优先级) • 创建训练 – 用户选择集群提供代码地址和执行命令即可 – 选择所用框架(镜像):支持官方,亦可自制 (提供 dockerfile 生成镜像服务) – 选择存储来源:对接了内部的存储 – 填写代码地址,执行的命令等 – 可以选择是否监控训练,提供 tensorboard 任务列表 可以指定 git 的 commit-id0 码力 | 11 页 | 13.40 MB | 1 年前3清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
何静 能做什么? 要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 自动化代码审查工具:自动审查代码, 发现潜在问题并提供优化建议,提升开发效 率与代码质量。 新思路:Open AI o3mini的数据应用 推 理 响 应 速 度 快 写 作 情 感 表 达 能 力 格 式 化 输 出 能 力 数 据 分 析 效 率 高 数 据 可 视 化 优 势 • 实时数据流处理与决策:利用o3mini在物 联网和工业自动化领域,快速处理来自传感器 和设备的实时数据,进行即时分析和决策,减 规划中,o3mini有助于将不同来源的数据 (如交通流量、气象数据等)进行融合分析, 预测交通拥堵,为城市规划提供决策支持。 • 交互式数据可视化:在商业智能和数据 分析领域,o3mini可以将多维数据以可视化 的方式呈现,并支持用户进行交互式分析。 • 实时数据可视化与预警:在实时监控和 数据分析中,o3mini可以实时将数据以可视 化的方式展示,并支持用户与数据进行交互。 二0 码力 | 85 页 | 8.31 MB | 8 月前3清华大学 DeepSeek 从入门到精通
文本分类 文本分类 主题标签生成(如新闻分类) 垃圾内容检测 编程与代码相关 代码调试 • 错 误 分 析 与 修 复 建议 • 代 码 性 能 优 化 提 示 技术文档处理 • API文档生成 • 代码库解释与示 例生成 代码生成 • 根 据 需 求 生 成 代 码片段(Python、 JavaScript) • 自 动 补 全 与 注 释 生成 常规绘图 如何使用DeepSeek? 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热 冗余拆解(如“先画图,再列公式”) 通用模型 显式要求分步思考,提供示例 “请分三步推导勾股定理,参考: 1. 画直角三角形…” 直接提问(易跳过关键步骤) 创意写作 推理模型 鼓励发散性,设定角色/风格 “以海明威的风格写一个冒险故事” 过度约束逻辑(如“按时间顺序列出”) 通用模型 需明确约束目标,避免自由发挥 “写一个包含‘量子’和‘沙漠’ 的短篇小说,不超过200字” 开放式指令(如“自由创作”) 代码生成0 码力 | 103 页 | 5.40 MB | 8 月前3MySQL 8.0.17 调优指南(openEuler 20.09)
适用于MySQL数据库场景。命令中 的${device}为数据盘名称,根据实 际磁盘名称进行修改。NVME盘不 支持此操作。 echo deadline > /sys/ block/${device}/queue/ scheduler /sys/block/$ {device}/queue/ nr_requests 提升磁盘吞吐量,尤其对myisam 存储引擎,可以调整到更大。命令 中的${device}为数据盘名称,根据 2020-10-15 7 方法 Linux参数 参数含义 操作 swappiness 值越大,越积极使用swap分 区,值越小,越积极使用内存。 执行命令vi /etc/sysctl.conf, 将vm.swappiness = 1添加到文 件底部,保存退出,执行命令 sysctl -p使其生效。 dirty_ratio 内存里的脏数据百分比不能超过 这个值。 echo 5 > /proc/sys/vm/ 09) 3 操作系统调优 2020-10-15 8 3.10 mysql 进程绑核 目的 将mysql的进程绑定到指定CPU上,同时内存使能interleave。 方法 使用numatl命令进行设置,其中0-92是mysql进程要运行的CPU序号,my.cnf是mysql 的配置文件路径。在华为鲲鹏920 4826处理器 + Huawei TM280 25G网卡上为mysql 绑定93个核能获得最佳性能。0 码力 | 11 页 | 223.31 KB | 1 年前3
共 18 条
- 1
- 2