大模型时代下向量数据库的设计与应用## 大模型时代下向量数据库的设计与应用 msup $ ^{®} $ | ARCHNOTES 架構 ## 个人简介  邱培峰 拓数派向量数据库负责人 目前在拓数派负责向量数据库PieCloudVector产品,聚焦于大模型与大数据 plum团队,担任外部数据源访问框架,对象存储访问扩展,ETL工具等产品模块的研发,并曾参与PostgreSQL多个版本的代码贡献,拥有丰富的存储模块核心开发和性能优化等实践经验。 ## 拓数派:大模型数据计算系统先行者 - 拓数派(OpenPie)是立足于国内的基础数据计算领域高科技创新机构; 拥有强大的数据库内核研发团队、数据科学团队和数字化转型团队; - 国内虚拟数仓和eMPP技术提出 ^{[2]} $ ,根据数据授权动态创建虚拟数仓,按需灵活计算,打破数据孤岛,支撑更大模型所需的数据和计算 $ ^{[3]} $ 。在云上,数据计算资源按需扩缩容,提升数仓的敏捷性和弹性,助力企业降低数仓管理复杂度 $ ^{[4]} $ ,实现数量级增加可计算数据空间的同时,数量级降低数仓成本,打开无限数据计算空间,推进AI/BI到下一个精度 $ ^{[5]} $ 。 中文名 啟合成化 播出时间2023年3月14日0 码力 | 28 页 | 1.69 MB | 1 年前3
Curve文件系统空间分配方案Curve文件系统空间分配方案(基于块的方案,已实现) - 背景 - 本地文件系统空间分配相关特性 - 局部性 - 延迟分配/Allocate-on-flush - Inline file/data - 空间分配 - 整体设计 - 空间分配流程 - 特殊情况 - 空间回收 - 小文件处理 - 并发问题 - 文件系统扩容 - 接口设计 接口设计 - RPC接口 - 空间分配器接口 ## 背景 根据CurveFS方案设计(总体设计,只实现了部分),文件系统基于当前的块进行实现,所以需要设计基于块的空间分配器,用于分配并存储文件数据。 ## 本地文件系统空间分配相关特性 局部性 尽量分配连续的磁盘空间,存储文件的数据。这一特性主要是针对HDD进行的优化,降低磁盘寻道时间。 延迟分配/Allocate-on-flush 在sync/flush之前,尽可能多的积累更多的文件数据块才进行空间分配,一方面可以提高局部性,另一方面可以降低磁盘碎片。 Inline file/data 几百字节的小文件不单独分配磁盘空间,直接把数据存放到文件的元数据中。 针对上述的本地文件系统特性,Curve文件系统分配需要着重考虑局部性。 虽然Curve是一个分布式文件系统,但是单个文件系统的容量可能会比较大,如果在空间分配时,不考虑局部性,inode中记录0 码力 | 11 页 | 159.17 KB | 1 年前3
JVM 内存模型## JVM 内存模型 0 码力 | 1 页 | 48.42 KB | 2 年前3
机器学习课程-温州大学-09机器学习-支持向量机## 机器学习-支持向量机 黄海广 副教授 2022年02月 ## 本章目录 01 支持向量机概述 02 线性可分支持向量机 03 线性支持向量机 04 线性不可分支持向量机 ### 1. 支持向量机概述 ## 01 支持向量机概述 02 线性可分支持向量机 03 线性支持向量机 04 线性不可分支持向量机 ### 1. 支持向量机概述 支持向量机(Support Vector margin hyperplane)。 与逻辑回归和神经网络相比,支持向量机,在学习复杂的非线性方程时提供了一种更为清晰,更加强大的方式。  ### 1. 支持向量机概述 硬间隔、软间隔和非线性 SVM ),用这些点找出一个平面(称为决策面),使得支持向量到该平面的距离最大。 是一个存放工程开发相关文件的文件夹。 src: 代码空间(Source Space) build: 编译空间(Build Space) • devel: 开发空间(Development Space) • install: 安装空间(Install Space) workspace_folder/ bash setup.bash setup.sh ... catkin编译系统下的工作空间结构 ## • 创建工作空间 $ mkdir -p ~/catkin_ws/src ## 创建工作空间 $ cd ~/catkin_ws/src $ catkin_init_workspace ## 编译工作空间 $ cd ~/catkin_ws/ $ catkin_make ## 设置环境变量 roscpp ## 编译功能包 $ cd ~/catkin_ws $ catkin_make $ source ~/catkin_ws/devel/setup.bash 同一个工作空间下,不允许存在同名功能包 不同工作空间下,允许存在同名功能包 ## • 创建功能包 技术报告李泽辰,Gitee 主编 李涛,APUS董事长兼CEO 2023年12月发布 设计:张琪 ## LLM 技术报告 大语言模型(LLM)技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。 LLM 是利用深度学习和大数据训练的人工智能系统,专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法,从而能够执行各种语言相关任务。以 GPT 系列为代表,LLM 以其在自 以其在自然语言处理领域的卓越表现,成为推动语言理解、生成和应用的引擎。 LLM 在多个领域都取得了令人瞩目的成就。在自然语言处理领域,GPT 系列模型在文本生成、问答系统和对话生成等任务中展现出色的性能。在知识图谱构建、智能助手开发等方面,LLM 技术也发挥了关键作用。此外,它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。 本报告从技术人视角出发,将深入探讨 LLM 技术的背景、基础设施、应用现状,以及相关的工具和平台。 ## LLM Tech Map ## 大模型 ➢ 备案上线的中国大模型 知名大模型 知名大模型应用 LLMOps 大模型聚合平台 ## 工具和平台 ➢ 开发工具 插件、IDE、终端代码生成工具 ## AI 编程 ## 算力 ## 基础设施 向量数据库 数据库向量支持 ➢ 大模型框架、微调 (Fine Tuning) ➢ 大模型训练平台与工具 ## LLM Agent0 码力 | 32 页 | 13.09 MB | 2 年前3
RustBelt - Rust 的形式化语义模型RUST CHINA CONF 2023 第三届中国 Rust 开发者大会 王俊吉 6.17-6.18 @Shanghai ## Outline ## RustBelt - Rust 的形式化语义模型 Background Rust Semantics • RustBelt Project • Type System • Rust Types Overview • The own Predict0 码力 | 21 页 | 2.63 MB | 2 年前3
Design and Implementation of Highly Scalable Quantifiable Data Structures in C++0 码力 | 51 页 | 4.08 MB | 1 年前3
领域驱动设计&中台/架构分层模型适配## 架构分层模型适配 有效防止架构腐化实践 吴雪峰@201811 DDCHINA ## CONTENTS 01 DDD分层参考架构 02 严纪律 防腐化 — 分层模型适配 03 分层模型适配实例 ## DDD分层参考架构 ## DDD分层参考架构 前端应用  给用户提供界面,关注用户交互和体验 为前端应用提供API服务,关注事务和分布式等技术性问题 领域模型和领域逻辑,关注业务概念。 访问外界系统(调用外界系统)的技术相关实现。 分层依据: 干系人和技术点 ## DDD分层参考架构 - 前端应用 前端应用 UX关注的层  ## 腐化案例: 亏空 大量技术术语业务人员完全看不懂领域模型和领域逻辑,关注业务概念。0 码力 | 39 页 | 2.54 MB | 2 年前3
AI大模型千问 qwen 中文文档AI agent, etc. 最新版本 Qwen1.5 有以下特点: • 6 种模型规模,包括 0.5B、1.8B、4B、7B、14B 和 72B; - 针对每种尺寸提供基础模型和 Chat 模型,并确保聊天模型按照人类偏好进行校准; • 对基础模型和 Chat 模型的多语言支持 - 基础模型和聊天模型都支持多种语言; - 支持工具调用、RAG(检索增强文本生成)、角色扮演、AI Agent 微信群。很期待见到你们! ## 文档 ### 1.1 安装 要快速上手 Qwen1.5,您可以从 Hugging Face 安装 transformers 库,并使用 Qwen1.5 Collection 中的模型。我们建议您安装最新版本的 transformers 库,或者至少安装 4.37.0 版本。 #### 1.1.1 Pip 安装 pip install transformers -U #### 我们建议您首先尝试使用 transformers 进行推理。请确保已安装了 transformers>=4.37.0 版本。以下是一个非常简单的代码片段示例,展示如何运行 Qwen1.5-Chat 模型,其中包含 Qwen1.5-7B-Chat 的实例: from transformers import AutoModelForCausalLM, AutoTokenizer device = "cuda"0 码力 | 56 页 | 835.78 KB | 2 年前3
共 1000 条
- 1
- 2
- 3
- 4
- 5
- 6
- 100













