大容量 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

陈宗志：大容量redis存储方案--Pika

## 大容量redis存储方案--Pika 陈宗志 360基础架构组技术经理 ## 简介 ## • 13年入职360 基础架构组 – Bada – Pika – Zeppelin – Mario, Pink, slash, floyd • https://github.com/Qihoo360 ## 概要 - 存在问题 - 分析问题 - 解决问题 - Pika vs redis redis ## I ntroduction - Pika 是DBA 和基础架构团队一起设计开发的大容量redis的解决方案 - 完全兼容redis 协议, 用户不需要修改任何代码进行迁移 ## Pika User • Redis实例数量：6000+个 • 日访问量：5000+亿 • Pika数据数量：1000+个 • 日访问量：1000+亿 • 覆盖率：80%以上业务线 • 单份数据体积：6 便捷运维设计的前提下通过持久化存储的方式解决 Redis 在大容量场景下的问题 ## Redis 问题 - 恢复时间长 - 一主多从, 主从切换代价大 - 缓冲区写满问题 - 成本问题 ## Redis 问题 ## • 恢复时间长 – 50G redis 回复时间70分钟 – 同时开启aof 和 rdb ## Redis 问题 ## • 一主多从, 主从切换代价大 ## – 主库挂掉后升级从库, 所有的从库全部重传数据

0 码力 | 47 页 | 2.18 MB | 2 年前
3
阿里云容器服务大促备战

## 全民双十一基于容器服务的大促备战 ![Image](/uploads/documents/4/7/3/a/473a77ef3e79496ce57ea869b48b9312/p1_1.jpg) 李斌阿里云容器服务 ![Image](/uploads/documents/4/7/3/a/473a77ef3e79496ce57ea869b48b9312/p1_2.jpg) ## 我是谁

0 码力 | 17 页 | 17.74 MB | 1 年前
3
开源中国 2023 大模型(LLM)技术报告

诺墨，Gitee开源社区产品负责人张力文，Gitee 公有云研发负责人李泽辰，Gitee 主编李涛，APUS董事长兼CEO 2023年12月发布设计：张琪 ## LLM 技术报告大语言模型（LLM）技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统，专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学 ## LLM Tech Map ## 大模型 ➢ 备案上线的中国大模型知名大模型知名大模型应用 LLMOps 大模型聚合平台 ## 工具和平台 ➢ 开发工具插件、IDE、终端代码生成工具 ## AI 编程 ## 算力 ## 基础设施向量数据库数据库向量支持 ➢ 大模型框架、微调 (Fine Tuning) ➢ 大模型训练平台与工具 ## LLM Agent Agent ## 编程语言 ## LLM Tech Map 大模型技术图谱 ![Image](/uploads/documents/f/4/8/5/f485f799dcd761b82375003f4bef3b91/p3_2.jpg) ## 基础设施 AquilaDB Annoy marqo MongoDB Faiss Weaviate Qdrant ScanN ROCKSET

0 码力 | 32 页 | 13.09 MB | 2 年前
3
AI大模型千问 qwen 中文文档

实现，不依赖任何外部库，并且针对 x86 架构提供了 AVX、AVX2 和 AVX512 加速支持。此外，它还提供了 2、3、4、5、6 以及 8 位量化功能，以加快推理速度并减少内存占用。对于大于总 VRAM 容量的大规模模型，该库还支持 CPU+GPU 混合推理模式进行部分加速。本质上，llama.cpp 的用途在于运行 GGUF（由 GPT 生成的统一格式）模型。欲了解更多详情，请参阅官方 GitHub 仓库。以下我们将演示如何使用 chat_response) #### 1.10.4 多卡分布式部署要提高模型的处理吞吐量，分布式服务可以通过利用更多的 GPU 设备来帮助您。特别是对于像 Qwen1.5-72B-Chat 这样的大模型，单个 GPU 无法支撑其在线服务。在这里，我们通过演示如何仅通过传入参数 tensor_parallel_size，来使用张量并行来运行 Qwen1.5-72B-Chat 模型： from vllm

0 码力 | 56 页 | 835.78 KB | 2 年前
3
3 基于Azure的Python机器学习王大伟

/e/4/f/6/e4f61af16f650f1e38c1d341f3e7a639/p1_2.jpg) ## 基于Azure的Python机器学习平安金融壹账通大数据研究院微软MVP 王大伟 ## 目录 >> Azure与Python >> 如何用Azure完成机器学习 >> Azure与自动机器学习 >>

0 码力 | 31 页 | 3.69 MB | 2 年前
3
兼容龙蜥的云原生大模型数据计算系统：πDataCS

## 兼容龙蜥的云原生大模型数据计算系统 ## --πDataCS简介 ## 吴疆拓数派产品市场总监 ![Image](/uploads/documents/7/b/a/7/7ba7d687363b394535b9914cff1a0499/p2_2.jpg) ## 吴疆拓数派(Openpie)产品市场总监深耕云计算和数据库行业十余年毕业于清华大学计算机系，先后在IBM，EM 拓数派旗下大模型数据计算系统（PieDataComputing System，缩写πDataCS），以云原生技术重构数据存储和计算，一份存储，多引擎数据计算，全面升级大数据系统至大模型时代，使得自主可控的大模型数据计算系统保持全球领先，成为AI的基础科技底座的同时，开启AI技术的新范式。πDataCS旨在助力企业优化计算瓶颈、充分利用和发挥数据规模优势，构建核心技术壁垒，让大模型技术全面赋能 PieCloudDB云原生虚拟数仓拓数派基于阿里云构建公共云数据仓库服务正式上线 4月冯雷被评为杭州市所有的独角兽和准独角兽企业中唯一“年度创业人物” 打造大模型时代立身中国的世界级团队 7月拓数派数据计算引擎PieCloudDB虚拟数仓再获信创认可首家以虚拟数仓通过信通院/可信AP数据库评测拓数派再次携WAIC创建智能驾驶科技分会

0 码力 | 29 页 | 7.46 MB | 2 年前
3
大模型时代下向量数据库的设计与应用

## 大模型时代下向量数据库的设计与应用 msup $ ^{®} $ | ARCHNOTES 架構 ## 个人简介 ![Image](/uploads/documents/7/9/1/2/7912e0d0aa09fcfba65b32c964ce9cad/p2_1.jpg) 邱培峰拓数派向量数据库负责人目前在拓数派负责向量数据库PieCloudVector产品，聚焦于大模型与大数 nplum团队，担任外部数据源访问框架，对象存储访问扩展，ETL工具等产品模块的研发，并曾参与PostgreSQL多个版本的代码贡献，拥有丰富的存储模块核心开发和性能优化等实践经验。 ## 拓数派：大模型数据计算系统先行者 - 拓数派（OpenPie）是立足于国内的基础数据计算领域高科技创新机构；拥有强大的数据库内核研发团队、数据科学团队和数字化转型团队； - 国内虚拟数仓和eMPP技术提推，预计算，Block Skipping等高级特性，全面满足各种复杂的分析查询需求 $ ^{[11]} $ 。 ## 目录 - 大模型应用和RAG - 向量近似搜索和向量数据库 - PieCloudVector架构设计与挑战 - 案例介绍音频 ## 大模型图像文本训练 ![Image](/uploads/documents/7/9/1/2/7912e0d0aa09f

0 码力 | 28 页 | 1.69 MB | 2 年前
3
微服务容灾治理

经过这么多年大流量服务端架构设计的沉淀，go-zero 在保护服务的稳定性上下足了功夫，不管是 CPU 密集型还是 IO 密集型服务，go-zero 都能很好的保护服务在如下场景不被拖垮或卡死：远超服务容量的突发大流量 CPU 打满 • 上下游故障或者超时 • MySQL、MongoDB、Redis 等中间件故障或者超负载（典型的是 CPU 飙高） ![Image](/uploads/docu [Image](/uploads/documents/b/6/e/e/b6ee3cfff0c6007096113db2ae442f78/p5_1.jpg) 总 qps 大概在 10000 左右，流量大约是系统容量的 20 倍 • 拒绝了约 95% 的过载请求成功处理请求在 360-400 qps，大概损失了 10% 的 qps，被拒绝的近 1000 qps 请求也需要消耗少量系统资源（从接受请求到被拒绝） 07096113db2ae442f78/p5_3.jpg) ### 2.3 压测结论： - 流量未知的情况下，保障系统不卡死（无过载保护情况下，CPU 满载一般表现为大量请求超时），且保证了系统容量的 400 qps 没有大幅下降 - 自动拒绝了过量的请求，避免过量请求浪费系统资源（即使处理，系统最后返回给用户的也是不可用错误、超时错误等） ### 3. 自适应过载保护原理先上一张总的

0 码力 | 13 页 | 1.68 MB | 2 年前
3
2024 中国开源开发者报告

Annual Report 聚焦大模型 2024年12月 ## 目录 ## Part 1: 中国开源开发者生态数据 04 | Gitee 数据篇 15 | OSS Compass Insight ## Part 2: TOP101-2024 大模型观点 21 | 2024 年中国开源模型：崛起与变革 26 | 开源模型未必更先进，但会更长久 30 | 大模型撞上“算力墙”，超级应用的探寻之路 2024：随需而变，从狂热到理性 51 | 大模型训练中的开源数据和算法：机遇及挑战 57 | 2024 年 AI 编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024: 大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中的「开发工具与环境」 98 | 推理中心化：构建未来 AI 基础设施的关键 ## Part 3: 国内 GenAI 生态高亮瞬间 104 | 中国 GenAI 消费应用人气榜 Top10 106 | AI 创新应用开发大赛获奖作品编委会局长，OSCHINA 副主编肖滢，OSCHINA 副主编李泽辰，Gitee

0 码力 | 111 页 | 11.44 MB | 1 年前
3
Moonshot AI 介绍

团队成员囊括NLP, CV, RL（强化学习）, Infra方面新生代人才，主导了很多有世界影响力的工___作，吸引了来自Google、Meta、Amazon等全球领先科技公司的海外人才加入： i. 大模型方面。团队成员发明了RoPE相对位置编码，是Meta LLaMa和Google PALM等大多数主流模型的重要组成部分；发明了group normalization，是Stable Diffusi 万台机器）分布式系统数量级性能优化的经验。 c. 目前团队人数超过 80 人，每个月都有在全球某个领域有显著影响力的人加入。 ### 2. 团队聚焦底层技术创新，技术Vision强 a. 引领大模型的“无损长上下文”时代。2023年10月上旬，在产品Kimi智能助手中实现“无损长上下文窗口（Lossless Long Context Window）”，支持20万汉字输入，实现对长文本的无损记手的中文实力直追 OpenAI。 b. 根据 “AI产品榜aicpb.com” 的统计数据，2024年1月Kimi智能助手的访问量 142 万，在大模型创业公司的 “AI ChatBots” 产品中排在第一；月环比增长率 94.1%，增长速度也在大模型创业公司的第一位。 ## “Kimi 智能助手” 详细介绍 Kimi 是由月之暗面（Moonshot AI）提供的超长记忆 AI 助手，支持约

0 码力 | 74 页 | 1.64 MB | 2 年前
3

共 953 条前往

页

搜索

分类

语言

格式