大模型时代下向量数据库的设计与应用[Image](/uploads/documents/7/9/1/2/7912e0d0aa09fcfba65b32c964ce9cad/p2_1.jpg) 邱培峰 拓数派向量数据库负责人 目前在拓数派负责向量数据库PieCloudVector产品,聚焦于大模型与大数据领域。拥有多年数据库内核研发和配套解决方案架构经验,在加入拓数派前曾就职于开源大数据平台Greenplum团队,担任外部数据源访问框架,对象存储访问扩展,ETL 计算,Block Skipping等高级特性,全面满足各种复杂的分析查询需求 $ ^{[11]} $ 。 ## 目录 - 大模型应用和RAG - 向量近似搜索和向量数据库 - PieCloudVector架构设计与挑战 - 案例介绍 音频 ## 大模型 图像 文本 训练  ## PieCloudVector ## •0 码力 | 28 页 | 1.69 MB | 1 年前3
兼容龙蜥的云原生大模型数据计算系统:πDataCS,市场上相关人才储备量不多,技术兜底依赖于Cloudera,国内第三方公司主要是基础运维和开发为主。 ## πDataCS优势2:全面支持大语言基础模型和私域数据结合做垂直应用 ## PieCloudVector与LLM在私域知识库领域的应用实践路径  ## πDataCS 计算引擎之 PieCloudVector 云原生向量数据库,为大模型提供独特记忆 ## πDataCS的第二个计算引擎 πCloudVector  ## PieCloudVector 竞争优势 ## 专用向量数据库  1. 准备数据+切分 2. 创建 embeddings 3. 存储向量 4. 向量搜索 (Vector Search) ## PieCloudVector 竞争优势 ## 专用向量数据库  ## 多引擎计算: Apache Iceberg ## JANM Table Formats OLAP数据库,如PieCloudDB 向量数据库,如PieCloudVector ➢ 流批一体引擎,如Spark、Flink ➢ 机器学习相关,如PieCloudML ➢ 通用大模型、领域大模型 ## 开放生态: 数据跨湖共享 ## DELTA LAKE 数据 共享 并行计算 流程管理 复杂查询 PieCloudDB HTAP计算引擎 ADS 预计算 高可用 DWS DWD 锁管理 事务管理 Embeddings PieCloudVector 向量引擎 向量索引 向量检索 Spark Connector PieDataCS数据计算系统 PieCloudML 机器学习引擎 模型算法 Spark 实时同步0 码力 | 26 页 | 2.84 MB | 1 年前3
共 4 条
- 1













