文本生成 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

PieCloudDB Database V2.1 版本说明

，减少数据读取量提高查询性能。 • 极速 Analyze（Smart Analyze）： PieCloudDB 实现极速 Analyze，更快的生成精确的查询规划统计信息，从而在查询时可以生成更优的查询计划。 • 全新的缓存机制：在 PieCloudDB 的计算层，各个计算节点针对元数据都设计了多层缓存结构。其中，针对元数据，PieCloudDB 实现了元数据层全新的缓存机制，有效减少了访问元系统上支持原生存储格式。 • 对 Orca 的支持：PieCloudDB 支持查询优化器 Orca。Orca 是一款开源的、基于 Cascades 模型的模块化查询优化器，帮助用户对 SQL 进行优化，生成高效的查询计划。 • 支持超大数据量字段 • 支持快速 ETL/ELT： Kafka 流数据导入支持，copy 性能大幅提升。 • 外部数据源的查询（实验性功能）： o 支持执行请求时自由切入/切出页面，不影响用户进行其他操作 o 支持快捷键执行请求 o 支持 sql 文本查找/替换 • 数据导入优化： o 支持数据导入时自由切入/切出页面，无需用户在导入界面停留等待 o 支持 text 文本格式 o 统一报错信息 • 数据库信息：增加表的大小（size）信息展示 • 计算集群：外部

0 码力 | 3 页 | 257.15 KB | 1 年前
3
大模型时代下向量数据库的设计与应用

PieCloudVector架构设计与挑战 • 案例介绍大模型检索增强生成(RAG) 使用大模型可以构造问答，聊天等应用，但同时也存在以下问题 • 数据时效 - LLM训练数据有截止日期，不包含最新信息，无法准确回答相关信息 • 私域数据 - LLM训练数据多来源于公开渠道，无法接触到私域数据，对特定领域的生成任务质量不高。 • 长期记忆 - LLM本身却没有长期记忆能力，对长时间交互的上下文互的上下文 Query LLM Response 检索增强生成(RAG) • 将辅助增强数据通过embedding过程转换为向量，加载到向量数据库中并做索引 • 对每个用户输入同样通过embedding过程得到向量，从向量数据库中搜索距离相近数据 • 将这些辅助数据与用户输入同时输入给大模型之后输出向量数据库 • embedding通过大模型将各种形式的数据转换成向量向量数据库 • 采用自研大模型东吴秀财GPT + LangChain开发框架 + PieCloudVector向量数据库构建了AIGC应用平台，接入了交易应用的结构化数据和非结构化数据，其中非结构化数据主要是文本类数据下一步展望 • GraphRAG 欢迎关注我们！麦思博(msup)有限公司是一家面向技术型企业的培训咨询机构，携手2000余位中外客座导师，服务于技术团队的能力提升、软件工程效能和产品创新迭代，

0 码力 | 28 页 | 1.69 MB | 1 年前
3
PieCloudDB Database 产品白皮书

力; 用户或者应用可直接调用 PieCloudDB 云原生虚拟数仓服务进行数据分析，提供标准的 SQL 接口，且内置各种分析工具，并原生兼容 Postgres 生态，可以很好地处理地理信息数据和文本，未来会扩展其他 Ap| 接口，支持常见的数仓的数据分析和人工智能、数据科学等功能。 Openl SN Pie | PiecloudDB 基于 eMPP (弹性大规模并行计算) 的云原生虚拟数仓 PiecloudDB 基于eMPP (弹性大规模并行计算) 的云原生虚拟数仓产品白皮书 SN PieCloudDB 实现了全自动 Analyze，可以在数据发生变化的时候自动完成Analyze，及时生成准确的统计信息。 PieCloudDB 支持元数据和用户数据的缓存，计算节点在执行查询时不再需要频繁的访问元数据服务和存储服务，降低了元数据访问的网络延迟，加快了用户数据的访问速度。 pieCloudDB 还支持查询优化器Orca。Orca是一款开源的、基于Cascades 模型的模块化查询优化器, 可以帮助用户对SQL进行优化，生成高效的查询计划。此外，PieCloudDB 兼容 ORCA 优化器 (DORCA 是一款开源的、基于 Cascades 模型的模块化查询优化器，可以帮助用户对 SQL 进行优化，生成高效的查询计划) 。 * 原生多租户支持 PieCloudDB 通过独特的设计，具备原生多租户能力，

0 码力 | 17 页 | 2.68 MB | 1 年前
3
云原生虚拟数仓PieCloudDB Database产品白皮书

数据应用层：用户或者应用可直接调用 PieCloudDB 云原生虚拟数仓服务进行数据分析，提供标准的 SQL 接口，且内置各种分析工具，并原生兼容 Postgres 生态，可以很好地处理地理信息数据和文本，未来会扩展其他 API 接口，支持常见的数仓的数据分析和人工智能、数据科学等功能。 PieCloudDB 产品概述拓数派旗下旗舰产品PieCloudDB，是以对行业顶级数据库的抽象思考 PieCloudDB 集群，满足业务应用的并发需求。 8 原生多租户支持人性化的管控平台 PieCloudDB 实现了全自动 Analyze，可以在数据发生变化的时候自动完成Analyze，及时生成准确的统计信息。 PieCloudDB 支持元数据和用户数据的缓存，计算节点在执行查询时不再需要频繁的访问元数据服务和存储服务，降低了元数据访问的网络延迟，加快了用户数据的访问速度。提高了数据分析的实时性。此外，PieCloudDB 兼容 ORCA 优化器（ORCA 是一款开源的、基于 Cascades 模型的模块化查询优化器，可以帮助用户对 SQL 进行优化，生成高效的查询计划）。 PieCloudDB 通过独特的设计，具备原生多租户能力，每个租户有自己的数据库和虚拟数仓。不同的租户互相隔离，租户之间数据和元数据彼此都不可见。每个租户可以按需创建不同

0 码力 | 17 页 | 2.02 MB | 1 年前
3
PieCloudDB 的云原生之路

高效的文件格式，可在节省网络请求的同时提高计算效率。全新的优化器「达奇」 PieCloudDB 可以更智能高效地生成统计信息，并生成更高效的查询计划，达奇优化器支持聚集下推，预计算，Block Skipping 等高级特性，全面满足各种复杂的分析查询需求。 IvorySQL开源数据库社区文本时间序列分析机器学习数据转换深度学习传统BI 地理信息 PieCloudDB 设计原则：100%符合DB标准

0 码力 | 47 页 | 1.80 MB | 1 年前
3
PieCloudDB Database 社区版集群安装部署手册 V2.1

击，界面会显示计划图以及文本内容。 4.6 评估查询表现 1. 如果需要查看所有查询语句的历史，可以点击菜单栏的进入请求历史界面，可以查看每条 SQL 文本的内容、状态、请求 id、请求耗时以及开始时间。也可以通过最上面的筛选框来筛选查询语句的状态、起始日期和结束日期。 2. 如果需要下载的某次查询的结果，可以点击该SQL文本最右侧的，将结果以 csv 格式下载到

0 码力 | 42 页 | 1.58 MB | 1 年前
3
云原生数据库 PieCloudDB : Unbreakable 安全特性剖析

技术挑战（1） • 不可避免的性能损失 • 选用支持硬件加速的加密算法 • SIMD 支持 • 减少因为密钥泄露而造成的损失 • 多级密钥 • 密钥加密密钥 • 用户无感知 • 自动生成次级密钥 • 密钥自管理 • 分区加密技术挑战（2） • 和数据库存储结合 • 不影响数据库内核（执行器，优化器） • 不修改/添加元数据表格式 • 业务拟合 • 不影响原有用户的查询\业务透明加密组件数据函数接口密钥管理模块加密模块加密算法库租户密钥生成主密钥用户信任域租户创建请求租户密钥生成主密钥用户信任域密钥生成租户创建请求加密租户密钥生成持久化存储区域主密钥用户信任域密钥生成租户创建请求加密存储次级密钥生成对应存储区域密钥生成查询请求加密存储密钥储存区上级密钥租户密钥读取持久化存储区域

0 码力 | 34 页 | 599.00 KB | 1 年前
3
PieCloudDB云原生数仓虚拟化之路

算，Block Skipping等高级特性，全面满足各种复杂的分析查询需求。 @2022 OpenPie. All rights reserved. OpenPie Confidential 文本时间序列分析机器学习数据转换深度学习传统BI 地理信息 P i e C l o u d D B 设计原则： 1 0 0 % 符合 D B 标准 100%兼容DW生态体系

0 码力 | 44 页 | 1.64 MB | 1 年前
3
PieCloudDB Database V2.8 Release Note

参数 pdb_enable_janm_toast，控制 JANM 访问方法中的 Toast。 n 新增建表选项 page_size，设置生成新 Page 的大小限制，以兆字节为单位。 n 新增建表选项 block_file_size，设置生成新文件的 Block 文件大小限制，以兆字节为单位。 n 新增建表选项 num_stat_col，控制文件内统计列数，为每个 JANM pdb_temptable_local_limit_filenum，控制临时表的数据文件溢出到远端存储。 n 支持 autovacuum 清理孤立的临时表。 l pgaudit 插件支持使用 pgaudit 插件生成审计日志。 l Kafka 接口 n 支持获取 Kafka FDW 统计数据。 n Kafka FDW 支持 JSON 格式。 l 执行计划信息支持在 EXPLAIN ANALYZE

0 码力 | 4 页 | 144.49 KB | 1 年前
3
云原生虚拟数仓 PieCloudDB ETL 方案设计与实现

与现有数据没有逻辑关联的时序数据流 • INSERT 模式，步骤1 Ø PieCloudDB Foreign Table，postgres扩展，需要为数据源单独开发 Ø 控制节点上读取数据源信息，决定是否拆分，生成任务信息 Ø 计算节点上根据任务信息读取数据源，返回raw数据和元信息 CREATE FOREIGN TABLE foreign_table(meta text, raw bytea); SELECT FROM foreign_table; • INSERT 模式，步骤2 Ø PieCloudDB Formatter Ø 解析 Foreign Table产生的 raw 数据，转换为内部行格式，生成需要的各列 CREATE FUNCTION formatter(input bytea) RETURNS user_type …; SELECT meta, raw FROM foreign_table

0 码力 | 29 页 | 5.24 MB | 1 年前
3

共 13 条前往

页

分类

语言

格式

PieCloudDB Database V2.1 版本说明

大模型时代下向量数据库的设计与应用

PieCloudDB Database 产品白皮书

云原生虚拟数仓PieCloudDB Database产品白皮书

PieCloudDB 的云原生之路

PieCloudDB Database 社区版集群安装部署手册 V2.1

云原生数据库 PieCloudDB : Unbreakable 安全特性剖析

PieCloudDB云原生数仓虚拟化之路

PieCloudDB Database V2.8 Release Note

云原生虚拟数仓 PieCloudDB ETL 方案设计与实现