DeepSeek从入门到精通(20250204)择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 题分析到创意生成,再到结果优化的全过程。 语境理解能力使设计者能够在复杂的社会和文化背景 下工作;抽象化能力有助于提高工作效率和拓展应用 范围;批判性思考是确保AI应用可靠性和公平性的关 键;创新思维能力推动了AI应用的边界拓展,而伦理 意识则确保了AI的发展与社会价值观相符。 提示语的DNA:解构强大提示语的基本元素 提示语的基本元素分类 信息类元素决定了AI在生成过程中需要处理的具体内 提示语的基本元素可以根据其功能和作用分为三个大类:信息类元素、结构类元素和控制类元素: 结构类元素用于定义生成内容的组织形式和呈现方式, 决定了AI输出的结构、格式和风格。 控制类元素用于管理和引导AI的生成过程,确保输出 符合预期并能够进行必要的调整,是实现高级提示语 工程的重要工具。 提示语的DNA:解构强大提示语的基本元素 提示语元素组合矩阵 提示语元素协同效应理论的核心观点包括: ▪ 互0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通择合 适的模型,实现最佳效果。 提示语策略差异 1 2 推理模型 通用模型 • 提示语更简洁,只需明确任务目标和 需求(因其已内化推理逻辑)。 • 无需逐步指导,模型自动生成结构化 推理过程(若强行拆解步骤,反而可 能限制其能力)。 • 需显式引导推理步骤(如通过CoT提 示),否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板(如要求分 步思考、提供示例)。 关键原则 3 题分析到创意生成,再到结果优化的全过程。 语境理解能力使设计者能够在复杂的社会和文化背景 下工作;抽象化能力有助于提高工作效率和拓展应用 范围;批判性思考是确保AI应用可靠性和公平性的关 键;创新思维能力推动了AI应用的边界拓展,而伦理 意识则确保了AI的发展与社会价值观相符。 提示语的DNA:解构强大提示语的基本元素 提示语的基本元素分类 信息类元素决定了AI在生成过程中需要处理的具体内 提示语的基本元素可以根据其功能和作用分为三个大类:信息类元素、结构类元素和控制类元素: 结构类元素用于定义生成内容的组织形式和呈现方式, 决定了AI输出的结构、格式和风格。 控制类元素用于管理和引导AI的生成过程,确保输出 符合预期并能够进行必要的调整,是实现高级提示语 工程的重要工具。 提示语的DNA:解构强大提示语的基本元素 提示语元素组合矩阵 提示语元素协同效应理论的核心观点包括: ▪ 互0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单量评估或产品验证的最终依据。 文本数据集成 一般文本处理任务中,DeepSeek R1所提取的文本数据维度最为全面,但容易受文本长度或模型稳定性影响出现失误;其他三个模型在文本数 据提取过程中,都存在对部分数据的忽略问题,没有完整集成到可视化表格中; 长文本处理任务中,Kimi k1.5相较短文本处理表现更加突出,提取准确的同时数据维度更加全面;由于文本过长DeepSeek R1无法完成任务; 基于数据集,在整体数据概括后提供多个 深入数据挖掘方向,根据需求输入研究倾 向,高效生成多个维度的数据分析,语言 简洁,挖掘深度较浅。 Kimi k1.5 提供数据的潜在用途方向,深入分 析过程中,从多个维度(如时间、 语言、地区)深入挖掘数据意义和 关联性,进一步总结趋势结论并提 出相关建议。 Kimi k1.5该任务中表现最为出色,对特征进行精准分类,从多维度深入挖掘指定数据的深层内涵和关联性; ,每行只给出一个句子 所提供段落的语言是中文,以下是按要求的标记表格式翻译成英文的译文: Original (Chinese) Translation (English) 捕食是一个基本的生态过程,捕食的定义为:一种生物(捕食 者)捕食了另一种生物(猎物)(Begon等,1997)。 Predation is a fundamental ecological process,defined0 码力 | 85 页 | 8.31 MB | 8 月前3
人工智能安全治理框架 1.0秉持共同、综合、合作、可持续的安全观,坚持发展和安全并重,以促 进人工智能创新发展为第一要务,以有效防范化解人工智能安全风险为出发点 和落脚点,构建各方共同参与、技管结合、分工协作的治理机制,压实相关主 体安全责任,打造全过程全要素治理链条,培育安全、可靠、公平、透明的人 工智能技术研发和应用生态,推动人工智能健康发展和规范应用,切实维护国 家主权、安全和发展利益,保障公民、法人和其他组织的合法权益,确保人工 智能技术造福于人类。 全风险,提出针对性防范应对 措施。关注安全风险发展变化,快速动态精准调整治理措施,持续优化治理机 制和方式,对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程,综合运用技术、 管理相结合的安全治理措施,防范应对不同类型安全风险。围绕人工智能研发 应用生态链,明确模型算法研发者、服务提供者、使用者等相关主体的安全责 任,有机发挥政府监管、行业自律、社会监督等治理机制作用。 之变化,防范应对措施也将相 应动态调整更新,需要各方共同对治理框架持续优化完善。 2.1 安全风险方面。通过分析人工智能技术特性,以及在不同行业领域 应用场景,梳理人工智能技术本身,及其在应用过程中面临的各种安全风险 隐患。 2.2 技术应对措施方面。针对模型算法、训练数据、算力设施、产品服务、 应用场景,提出通过安全软件开发、数据质量提升、安全建设运维、测评监测 加固等技术手段提升0 码力 | 20 页 | 3.79 MB | 1 月前3
DeepSeek图解10页PDFDeepSeek-R1 完整训练过程 . . . . . . . . . . . . . . . . . . . 7 3.1.1 核心创新 1:含 R1-Zero 的中间推理模型 . . . . . . . 8 3.1.2 核心创新 2:通用强化学习 . . . . . . . . . . . . . . . 8 3.2 含 R1-Zero 的中间推理模型训练过程 . . . . . . . . . . . . . . 9 3.3 通用强化学习训练过程 . . . . . . . . . . . . . . . . . . . . . . 10 3.4 总结 DeepSeek-R1 . . . . . . . . . . . . . . . . . . . . . . . . 11 4 参考文献 . . . . . . . . . . . . . . . . . . . . . 本地部署三个步骤 一共只需要三步,就能做到 DeepSeek 在本地运行并与它对话。 第一步,使用的是 ollama 管理各种不同大模型,ollama 比较直接、干净, 一键下载后安装就行,安装过程基本都是下一步。 不知道去哪里下载的,可以直接在我的公众号后台回复:ollama,下载这个 软件,然后装上,可以拿着手机扫码下图1直达我的公众号: 教程作者:郭震,工作 8 年目前美国 AI 博士在读,公众号:郭震0 码力 | 11 页 | 2.64 MB | 8 月前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-20250230政企、创业者必读 DeepSeek在用户体验上实现了三件事 更加理解用户需求,降低Prompt要求 直接呈现思维过程,展现像真人一样思考的能力 可实时联网,把搜索能力与推理能力结合 DeepSeek颠覆式创新——用户体验 具备强大推理能力,思维过程更加缜密,智能性提升 用起来更像真人,写作能力更强,想象力更丰富 31政企、创业者必读 DeepSeek-R1用户体验改善的作用 49政企、创业者必读 闭源云端通用大模型功能强大 但在政府企业场景中使用存在若干问题 训练知识为网上通用,缺少政府和企业内部知识,不懂业务,无 法解决实际问题 闭源模型云端部署,使用过程中数据外传上网,存在泄密风险 闭源模型规模庞大,无法为企业进行定制,无法本地部署 成本高昂,一般企业难以负担 50政企、创业者必读 不追求用一个大模型解决企业所有问题,而是找垂直场景,做专业技能大模型 十倍”原则 示例:人员招聘就是一个太大的、笼统的场景 需要细分成职位描述、简历筛选、面试评估等粒度更合适的场景 56政企、创业者必读 某省39家钢铁企业,联合打造钢铁基础大模型,将钢铁制造全过程拆分为142个场景 1· 原料 转 炉 炼 钢 热轧 煤 铁 矿 石 石 灰 石 废钢 合金 炼焦 烧结 球团 高炉炼铁 电 炉 炼 钢 精炼 连铸 冷轧/镀锌 调度 营销0 码力 | 76 页 | 5.02 MB | 6 月前3
清华大学 普通人如何抓住DeepSeek红利· 柱状图 · 饼图 · 散点图 · 雷达图 · 组合图表 SVG矢量图 · 基础图形 · 图标 · 简单插图 · 流程图 · 组织架构图 常规绘图 DeepSeek的深度思考过程独树一帜 《香料三重奏》茄椒肠卷配酸奶薄荷酱 ??? 灵感地图:巴尔干半岛香料 × 地中海清新感 × 日式天妇罗手 法 ??? 结构解构: 1.青椒薄片 - 采用日式天妇罗手法炸至半透明,形成琥珀色脆网 素数位数关系理论及其思考—— 邵宇捷 各思路具体化及 Python验算 人类提供已有参考案例(拉马努金数、 阿姆斯特朗数等) AI提出可能思路 要求AI迭代调整或人 类介入提供具体设想 AI发现魔法数字的一般过程 思路可用,并非刻 意构造 有刻意构造嫌疑 方案可行 输出结果及理论 体系化 方案不可行 Python验算 无符合数字 有符合数字 如何使用DeepSeek处理生活中的事务 第一步先问AI:这些事情我是否可能全部完成 p 第二步再问AI:如果能完成,哪些事情要优先 做,先后顺序是什么? p 第三步继续问:是否有高效的工具或者办法我 可以使用? p 第四部最后问:这个过程中有任何风险吗?如 何评估? 较高难度:工作与生活平衡的决策支持 建议的优先顺序 处理时间冲突: 短期内(今天或近期):首先确定当日最紧急的冲突。一般来说,孩子的重要 表演往往具有不可替代0 码力 | 65 页 | 4.47 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告Tuning) 大模型框架有哪些特点: :大模型开发框架通过提供高 层次的 API 简化了复杂模型的构建过程。这 些 API 抽象掉了许多底层细节,使开发者能 够专注于模型的设计和训练策略。 :这些框架经过优化,以充分利用 GPU、TPU 等高性能计算硬件,以加速模型 的训练和推理过程。 :为了处理大型数据集和大规模参 数网络,这些框架通常设计得易于水平扩展, 支持在多个处理器或多个服务器上并行处理。 微调训练:在任务特定数据上训练预训练的模型, 调整模型参数以适应特定任务; 4.评估:在验证集上评估模型性能,确保模型对新 数据有良好的泛化能力; 5.部署:将性能经验证的模型部署到实际应用中去。 微调的过程也是分类模型训练的过程 (图源:https://medium.com/mlearning-ai/what-is-a-fine-tuned-llm-67bf0b5df081) 10 / 32 LLM 基础设施:大模型训练平台与工具 基础设施:大模型训练平台与工具 大模型训练平台和工具提供了强大且灵活的基础设施,使得开发和训练复杂的语言模型变得可行且高 效。 这些工具提供了先进的算法、预训练模型和优化技术,极大地简化了模型开发过程,加速了实验周期, 并使得模型能够更好地适应各种不同的应用场景。此外,它们还促进了学术界和工业界之间的合作与 知识共享,推动了自然语言处理技术的快速发展和广泛应用。 相比前边的大模型框架和微调,一言以蔽之:0 码力 | 32 页 | 13.09 MB | 1 年前3
普通人学AI指南开源项目,提供零代码网站开发功能,易于使用。 2.4.6 Cursor 开源的 AI 代码编辑器,旨在通过 AI 技术助力快速软件开发。 2.4.7 Tabby 自托管的 AI 编程助手,开源,支持开发人员优化编码过程。 2.4.8 Codeium 开源的 AI 编程工具,用于自动化代码生成和优化。 2.4.9 GitHub Copilot 由 GitHub 推出的开源 AI 编程助手,能够根据代码库提供编程建议和代码片 下载界面如图 21 所示: Figure 21: win、mac 及 linux 下载 docker 软件 4.2.3 安装 docker 安装 docker 非常简单,基本都是下一步。注意在安装过程中,我们需要确 保”Use WSL 2 instead of Hyper-V (recommended)” 这一功能被启用。 docker 有 UI 界面,如图 22所示: 21 Figure 22: 后端,安装完 docker 后,执行下面命令获取到 MaxKB 的镜像到本地,如下图 30所示: Figure 29: 执行命令获取到 MaxKB 的镜像到本地 下图是正在安装的过程: Figure 30: 安装过程:执行命令获取 MaxKB 到本地 整个 MaxKb 的镜像大小为 2GB 左右。 28 5.3 docker 配置 MaxKB 安装完成后,打开 docker,按照下图 31逐步操作:0 码力 | 42 页 | 8.39 MB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)(二)基础支撑标准 基础支撑标准主要包括基础数据服务、智能芯片、智能传感 器、计算设备、算力中心、系统软件、开发框架、软硬件协同等 标准。 1. 基础数据服务标准。规范人工智能研发、测试、应用等 过程中涉及数据服务的要求,包括数据采集、数据标注、数据治 理、数据质量等标准。 2. 智能芯片标准。规范智能芯片相关的通用技术要求,包 括智能芯片架构、指令集、统一编程接口及相关测试要求、芯片 数据格式和协议等标准。 研发设计标准。研制跨领域知识整合、新型设计模式生 成、人机协同研发设计等标准。 2. 中试验证标准。围绕高精度、全流程仿真模型,研制智 能虚拟中试标准,以及复杂工业场景新技术应用验证标准。 3. 生产制造标准。研制生产过程智能化、产线监测及维护 等标准。 4. 营销服务标准。围绕营销服务效率提升,研制智能客服、 数字人、商品三维模型标准,以及用户体验等标准。 5. 运营管理标准。围绕运营管理智能化能力提升,研制相0 码力 | 13 页 | 701.84 KB | 1 年前3
共 11 条
- 1
- 2













