-
## 兼容龙蜥的云原生大模型数据计算系统
## --πDataCS简介
## 吴疆
拓数派产品市场总监

## 吴疆
拓数派(Openpie)产品市场总监
深耕云计算和数据库行业十余年
毕业于清华大学计算机系,先后在IBM,EM C,Pivotal,VMWare参与多个云平台和数据库项目
01
拓数派简介
02
πDataCS简介
03
πDataCS与龙晰
### 01. 拓数派简介
# 全球数据计算系统引领者
杭州拓数派科技发展有限公司(又称"OpenPie")是立足于国内,基础数据计算领域的高科技创新机构。作为国内云上数据库和数据计算领域的引领者,拓数派以“Data Computing for for New Discoveries”「数据计算,只为新发现」为使命,致力于在数字原生时代,运用突破性计算理论、独创的云原生数据库旗舰产品以及之上的算法和数学模型,建立下一代云原生数据平台的前沿标准,驱动企业实现从"软件公司"到"数据公司"再到"数学公司"的持续进阶。
拓数派旗下大模型数据计算系统(PieDataComputing System
0 码力 |
29 页 |
7.46 MB
| 1 年前 3
-
## 大模型时代下向量数据库的设计与应用
msup $ ^{®} $ | ARCHNOTES 架構
## 个人简介

邱培峰
拓数派向量数据库负责人
目前在拓数派负责向量数据库PieCloudVector产品,聚焦于大模型与大数据 领域。拥有多年数据库内核研发和配套解决方案架构经验,在加入拓数派前曾就职于开源大数据平台Greenplum团队,担任外部数据源访问框架,对象存储访问扩展,ETL工具等产品模块的研发,并曾参与PostgreSQL多个版本的代码贡献,拥有丰富的存储模块核心开发和性能优化等实践经验。
## 拓数派:大模型数据计算系统先行者
- 拓数派(OpenPie)是立足于国内的基础数据计算领域高科技创新机构;
拥有强大的数据库内核研发团队、数据科学团队和数字化转型团队;
- 国内虚拟数仓和eMPP技术提出者,不断在数据计算引擎方向进行创新,全面拥抱AI技术趋势。
# 虚拟数仓
拓数派/数仓虚拟化
PieCloudDB产品技术
数企虚拟化由拓数派(杭州拓数派科技发展有限公司,又称“OpenPie”)于2023年3月正式提出。
数仓虚拟化 $ ^{[1]} $ 可将物理数仓整合到云原生数据计算平台 $
0 码力 |
28 页 |
1.69 MB
| 1 年前 3
-
李涛,APUS董事长兼CEO
2023年12月发布
设计:张琪
## LLM 技术报告
大语言模型(LLM)技术作为人工智能领域的一项重要创新在今年引起了广泛的关注。
LLM 是利用深度学习和大数据训练的人工智能系统,专门设计来理解、生成和回应自然语言。这些模型通过分析大量的文本数据来学习语言的结构和用法,从而能够执行各种语言相关任务。以 GPT 系列为代表,LLM 以其在自然语言处 以其在自然语言处理领域的卓越表现,成为推动语言理解、生成和应用的引擎。
LLM 在多个领域都取得了令人瞩目的成就。在自然语言处理领域,GPT 系列模型在文本生成、问答系统和对话生成等任务中展现出色的性能。在知识图谱构建、智能助手开发等方面,LLM 技术也发挥了关键作用。此外,它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。
本报告从技术人视角出发,将深入探讨 LLM 技术的背景、基础设施、应用现状,以及相关的工具和平台。 ## LLM Tech Map
## 大模型
➢ 备案上线的中国大模型
知名大模型
知名大模型应用
LLMOps
大模型聚合平台
## 工具和平台
➢ 开发工具
插件、IDE、终端代码生成工具
## AI 编程
## 算力
## 基础设施
向量数据库
数据库向量支持
➢ 大模型框架、微调 (Fine Tuning)
➢ 大模型训练平台与工具
## LLM Agent
0 码力 |
32 页 |
13.09 MB
| 2 年前 3
-
AI agent, etc.
最新版本 Qwen1.5 有以下特点:
• 6 种模型规模,包括 0.5B、1.8B、4B、7B、14B 和 72B;
- 针对每种尺寸提供基础模型和 Chat 模型,并确保聊天模型按照人类偏好进行校准;
• 对基础模型和 Chat 模型的多语言支持
- 基础模型和聊天模型都支持多种语言;
- 支持工具调用、RAG(检索增强文本生成)、角色扮演、AI Agent 微信群。很期待见到你们!
## 文档
### 1.1 安装
要快速上手 Qwen1.5,您可以从 Hugging Face 安装 transformers 库,并使用 Qwen1.5 Collection 中的模型。我们建议您安装最新版本的 transformers 库,或者至少安装 4.37.0 版本。
#### 1.1.1 Pip 安装
pip install transformers -U
#### 我们建议您首先尝试使用 transformers 进行推理。请确保已安装了 transformers>=4.37.0 版本。以下是一个非常简单的代码片段示例,展示如何运行 Qwen1.5-Chat 模型,其中包含 Qwen1.5-7B-Chat 的实例:
from transformers import AutoModelForCausalLM, AutoTokenizer
device = "cuda"
0 码力 |
56 页 |
835.78 KB
| 2 年前 3
-
· 上海站 · 第 104 期
AGI趋势下的云原生数据计算系统
演讲人:徐阳
## 拓数派:大模型数据计算系统先行者 企业介绍
● 拓数派(OpenPie)是立足于国内的基础数据计
算领域高科技创新机构;
● 拥有强大的数据库内核研发团队、数据科学家团队和数字化转型团队;
● 国内虚拟数仓和eMPP技术提出者,不断在数据
计算引擎方向进行创新,全面拥抱AI技术趋势。
## 经濟日報 s/e/b/7/c/eb7c6de079426c7bf43ef4dfa4ab8c6a/p2_2.jpg)
发明名称:一种元数据访问方法、装置和存储介质
发明人:王湜舟:杨峻峰:冯雷
专利号:ZL202211418015.0
“在大模型数据计算系,AI数学模型、数据和三者将前所未有地无接、互为增强,创造出的社会经济效益,成为社会高质量发展的新力。”杭州拓数派科技有限公司(以下简称效派)创始 在接受记者采访时说。目前,拓数派已发布基APP分布式技术的存算件一体机,适配信能够为企业降低运省开发时间;旗下拟数仓,可将物理到云原生数据计算量更大模型所需的算。冯留说,自成石数派专注于数据,即将推出拓数派据计算系统,成为科技底座,开启AI范式,助力企业充分发挥数据规模优能业务发展。
本报记者 李治国
数仓虚拟化
PieCloudDB产品技术
编辑 讨论 上传视频
拓数派/数仓虚拟化
0 码力 |
26 页 |
2.84 MB
| 1 年前 3
-
## 云时代下多数据计算引擎的设计与实现
郭罡 CTO 拓数派(OpenPie)
## 关于拓数派
- 成立于2021年,以 “Data Computing for New Discoveries” 「数据计算,只为新发现」为使命。
- 核心团队来自于各大厂名校,有丰富的数据库(Greenplum,DB2,ClickHouse等)研发和产业经验.
- 产品 πDataCS:多计算引擎,包括自研 πDataCS:多计算引擎,包括自研分布式数据库PieCloudDB,自研分布式向量数据库等.
• PieCloudDB 存储底座是各计算引擎的载体.
• 已落地或者正在落地:IoT、金融、新能源、医疗等行业.
## 云时代
多数据模态支持
广泛的生态支持
## 数据计算
“一份数据,多引擎计算”的述求
让数据流动起来
## PieCloudDB 简介
## 一 款云原生分布式
## 分析型数据库
• 元数据、用户数据、计算完全分离 元数据、用户数据、计算完全分离.
- 用户数据(code name: Janm)支持 S3/HDFS/Posix.
• 架构:Share Nothing on share storage.
• 丰富的外围产品支持.
## Postgres生态
• 将来会支持单机和HTAP.
## 软件交付版本
(最新版本:v2.11)
• 社区版
· 企业版
· CoC(云上云)版
## PDB数据库产品体系
0 码力 |
15 页 |
3.09 MB
| 1 年前 3
-
Greenplum数据仓库 UDW
产品文档
优刻得科技股份有限公司 版权所有
## 目录
目录
2
概览
6
产品架构
7
云数据仓库产品架构
7
高可用
8
快速上手
10
一、创建数据仓库
10
二、连接数据仓库
16
操作指南
38
关闭数据仓库
38
启动数据仓库
39
重启数据仓库
39
查看数据仓库详情
39
扩容数据仓库
40
更改数据仓库密码
43
续费
44
删除数据仓库
45
查看操作日志
46
查看监控
47
访问UDW数据仓库 50
1 客户端工具访问UDW 50
2 图形界面的方式访问UDW 71
数据导入 73
insert加载数据 73
copy加载数据 73 73
外部表并行加载数据 74
从hdfs加载数据 74
从mysql中导入数据 74
从oracle中导入数据 74
从file加载数据 75
开发指南 76
1、连接数据库 76
2、数据库管理 79
3、模式管理 81
4、表格设计 82
5、加载数据 90
6、分区表 92
0 码力 |
206 页 |
5.35 MB
| 2 年前 3
-
[Image](/uploads/documents/c/d/1/1/cd11ba0b707be61cb140b86841b53505/p1_1.jpg)
BEIJING 2017
# 构建基于富媒体大数据的弹性深度学习计算平台 SPEAKER / 土土@七牛 AtLab
## 促进软件开发领域知识与创新的传播

+ Ideea
## Connect
数据处理
数据存储
直播点播
数据加速
QINIU QCon[北京站]2017

CHICHE
0
## 9
色情 0.01
性感 0.98
正常 0.01

0 码力 |
1 页 |
48.42 KB
| 2 年前 3
-
## 全民双十一 基于容器服务的
大促备战

李斌
阿里云容器服务

## 我是谁 >敏捷调度
弹性 | 安全加固 | | 离线计算 | 开发运维一体化 | 极致性能 | 故障演练 |
| 大数据 | 边缘计算 | 全链路压测 | 全站上云 |
高可用< [Image](/uploads/documents/4/7/3/a/473a77ef3e79496ce57ea869b48b9312/p9_11.jpg)
云日志
限流,熔断,
降级,系统保护
日志类数据采集、
消费、投递及查询
分析功能
挂卷
![Image](/uploads/documents/4/7/3/a/473a77ef3e79496ce57ea869b48b9312/p9_12 0 码力 |
17 页 |
17.74 MB
| 1 年前 3
|