清华大学 DeepSeek 从入门到精通
DeepSeek是什么? AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应 用。 • DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 当人人都会用AI时,你如何用得更好更出彩? 推理模型 • 例如:DeepSeek-R1,GPT-o3在逻辑推理、数学推理和实时问题解决方面表现突出。 推理大模型: 推理大模型是指能够在传统的大语言模型基础上,强化推理、逻辑分析和决策能力的模型。它 们通常具备额外的技术,比如强化学习、神经符号推理、元学习等,来增强其推理和问题解决能力。 非推理大模型: 适用于大多数任务,非推理大模型一般侧重于语言生成、上下文理解和自然语言处理,而不强 解和自然语言处理,而不强 调深度推理能力。此类模型通常通过对大量文本数据的训练,掌握语言规律并能够生成合适的内容,但缺乏像 推理模型那样复杂的推理和决策能力。 维度 推理模型 通用模型 优势领域 数学推导、逻辑分析、代码生成、复杂问题拆解 文本生成、创意写作、多轮对话、开放性问答 劣势领域 发散性任务(如诗歌创作) 需要严格逻辑链的任务(如数学证明) 性能本质 专精于逻辑密度高的任务 擅长多样性高的任务0 码力 | 103 页 | 5.40 MB | 8 月前3清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
本质:以多agent实现从数据采集到可视全流程 模型特点 Claude 3.5 sonnet 平衡性能:在模型大小和 性能之间取得平衡,适合 中等规模任务。 多模态支持:支持文本和 图像处理,扩展应用场景。 可解释性:注重模型输出 的可解释性和透明性。 DeepSeek R1 高效推理:专注于低延迟和 高吞吐量,适合实时应用。 轻量化设计:模型结构优化, 资源占用少,适合边缘设备 垂直领域优化:针对特定领域 (如医疗、法律)进行优化, 提供高精度结果。 长文本处理:擅长处理长文本 和复杂文档,适合专业场景。 定制化能力:支持用户自定义 训练和微调,适应特定需求。 Open AI o3 mini 小型化设计:轻量级模型, 适合资源有限的环境。 快速响应:优化推理速度, 适合实时交互场景。 通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 5支持联网查询网址,Claude 3.5 sonnet暂不支持; 四个模型均能根据上传的网页代码,对多个网址链接进行筛选、去重,完全提取出符合指令要求的所有网址链接并形成列表; 在复杂爬虫任务上,DeepSeek R1与Open AI o3min生成的代码均能正常执行数据采集任务,o3响应速度更快,R1数据采集结果更加完 整准确;其他2个模型都存在多次调试但代码仍然运行不成功的问题,如代码中罗列URL不全、输出文本中提取数据为空等。0 码力 | 85 页 | 8.31 MB | 8 月前3基于 KUBERNETES 的 容器器 + AI 平台
⽣生产级镜像仓库解决⽅方案,基于 • ⼀一键⾼高可⽤用部署和维护 • 为多租户和复杂权限集成⽽而增强 『token service』 • 管理理基于规则的镜像仓库 • 其他企业需要的优化功能 企业典型的多租户模型 租户 Tenant User User group Namespace Deployment Registry project CI/CD workspace Pod … 社区的联合创始⼈人 • kubeflow/tf-operator • 定义 TFJob Spec (CRD) • 跟踪 TensorFlow 任务运⾏行行状态 • ⽀支持分布式 TensorFlow 任务 KUBEFLOW 之上 • 借⼒力力容器器平台提供⽣生产级的集群资源管理理 • ⼯工作区隔离与共享 • 数据、模型、环境、应⽤用等 • 全⾯面⽀支持 AI ⼯工作流 • 探索开发0 码力 | 19 页 | 3.55 MB | 1 年前3RocketMQ v3.2.4 开发指南
CORBA Notification 规范中,无此消费方式。 在 JMS 规范中,JMS point-to-point model 不乀类似,但是 RocketMQ 的集群消费功能大等亍 PTP 模型。 因为 RocketMQ 单个 Consumer Group 内的消费者类似亍 PTP,但是一个 Topic/Queue 可以被多个 Consumer Group 消费。 顺序消息 TOPIC_A TOPIC_B Producer Producer Consumer Consumer Consumer 图表 5-1 RocketMQ 是什么 是一个队列模型的消息中间件,具有高性能、高可靠、高实时、分布式特点。 Producer、Consumer、队列都可以分布式。 Producer 吐一些队列轮流収送消息,队列集合称为 Topic,Consumer 10.232.22.67 jmenv.taobao.net 推荐使用 HTTP 静态服务器寻址方式,好处是客户端部署简单,丏 Name Server 集群可以热升级。 11.2 自定义客户端行为 11.2.1 客户端 API 形式 DefaultMQProducer、TransactionMQProducer、DefaultMQPushConsumer、DefaultMQPullConsumer0 码力 | 52 页 | 1.61 MB | 1 年前3消息中间件RocketMQ原理解析 - 斩秋
组成一个逻辑上连续的队 列 d) 加载事物模块 e) 加载存储检查点 加载${user.home} \store\checkpoint 这个文件存储了 3 个 long 类型的值来记录存储 模型最终一致的时间点,这个 3 个 long 的值为 physicMsgTimestamp 为 commitLog 最后刷盘的时间 logicMsgTimestamp 为 consumeQueue 最终刷盘的时间 协议分4部分,含义分别如下 1、大端4个字节整数,等于2、3、4长度总和 2、大端4个字节整数,等于3的长度 3、使用json序列化数据 4、应用自定义二进制序列化数据 Header 部分数据是通过 FastJson 序列化数据 请求自定义字段都会实现 CommandCustomHeader 接口, 在 RemotingCommand 序列化之前 会将 CommandCustomHeader CommandCustomHeader 的字段拷贝到 Header 的 extFields 中去, 让后在整体通过 Fastjson 序列化 Netty 通过 NettyEncoder、NettyDecoder 自定义实现将 RemotingCommand 转换成 byte[] NettyEncoder: NettyDecoder 五:通信层的整体交互0 码力 | 57 页 | 2.39 MB | 1 年前3Ubuntu 桌面培训 2010
. . . . . . . . 247 VI 自定义桌面和应用程序 249 VI.I 简介 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249 VI.II 自定义桌面 . . . . . . . . . . . . VI.II.II 自定义主题(按钮 & 图标等) . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 VI.II.III 自定义屏幕保护 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268 VI.II.IV 自定义屏幕分辨率 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 I.7 桌面自定义 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .0 码力 | 540 页 | 26.26 MB | 1 年前3GPU Resource Management On JDOS
Management On JDOS 梁永清 liangyongqing1@jd.com 提供的服务 1. 用于实验的 GPU 容器 2.基于 Kubeflow 的机器学习训练服务 3.模型管理和模型 Serving 服务 Experiment Training Serving 均基于容器,不对业务方直接提供 GPU 物理机 GPU 实验 JDOS 常规的容器服务 ,使用 gpu 的 Serving 服务 提供统一便捷的 Serving 服务,只需用户指定模型,即可提供 grpc 和 rest 服务,同时使用 GPU 复用 +HPA 提高 GPU 利用率 创建 Serving 与训练集成 • 用户只需要简单选择机房和 镜像填写模型名即可完成 Serving 服务创建 自有模型 • 用户只需要填写模型地址即 可 GPU 监控 • 容器监控服务,自适 应 GPU 容器,可根据0 码力 | 11 页 | 13.40 MB | 1 年前3Apache Pulsar,云原生时代的消息平台 - 翟佳
streamnative.io 基础决定上层 streamnative.io 企业级特性 streamnative.io 统⼀消费模型 • Exclusive • Failover • Shared • Key-Shared streamnative.io 统⼀消费模型 — 订阅 Producer Topic 1 2 3 4 5 6 7 Subscription2 Consumer 1 2 30 码力 | 39 页 | 12.71 MB | 6 月前0.03MySQL高可用 - 多种方案
可以将写 VIP 和读 VIP 分别进行设置,为读写分离做准备。 扩展不是很方便。 可以在后面添加多个从服务器,并做到负载均衡。 缺点: 在启动或者恢复后会立即替换掉定义的 sorry_server,因此如果要实现指 定条件替换或者不替换需要通过其他方式实现,比如:临时更改 mysql 的端口等。 切换需要 1s 左右的时间。 2.4 方案实战 2 换。 可以将写 VIP 和读 VIP 分别进行设置,为读写分离做准备。 扩展很方便。可以在后面添加多个从服务器,并做到负载均衡。 缺点: 在启动或者恢复后会立即替换掉定义的 sorry_server,因此如果要实现指 定条件替换或者不替换需要通过其他方式实现,比如:临时更改 mysql 的端口等。 安装配置比单写入稍微复杂,需要另外一个 VIP。管理比单写入复杂。 drbd 以后,就需要使用命令在 dbserver1 和 dbserver2 上创建配置 的 drbd 资源,使用如下命令: drbdadm create-md r0 # r0 为配置文件中定义的资源名 DRBD 的启动和停止 /etc/rc.d/init.d/drbd start #启动 drbd /etc/rc.d/init.d/drbd stop #停止 drbd0 码力 | 31 页 | 874.28 KB | 1 年前3Kubernetes Operator 实践 - MySQL容器化
Operator 是什么 • Kubernetes 中一切都可视为资源 • 默认资源类型:如 Pod、Service、Volume 等 • Kubernetes 1.7 之后增加了 CRD 自定义资源 • 二次开发扩展 Kubernetes API CRD 的基本原理 ① 观察资源的当前状态 ② 分析当前状态与期望状态的差别 ③ 调用 API 消除差别 TestCluster app=test Operator 的基本原理 3. MySQL Operator 设计实践 4. 小结 回顾 • 商业云平台概况 • Operator 的基本原理 • MySQL-Operator 实践 ü 自定义 controller,使用 CRD ü MHA、MGR 高可用的实现 ü 扩缩容、故障处理流程 ü 分布式存储 ceph 展望 • 优化存储 • 增强 MySQL 的安全性 • 完善数据处理工具0 码力 | 42 页 | 4.77 MB | 1 年前3
共 15 条
- 1
- 2