依赖管理 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

DeepSeek从入门到精通(20250204)

发散性任务（如诗歌创作）需要严格逻辑链的任务（如数学证明）性能本质专精于逻辑密度高的任务擅长多样性高的任务强弱判断并非全面更强，仅在其训练目标领域显著优于通用模型通用场景更灵活，但专项任务需依赖提示语补偿能力 • 例如：GPT-3、GPT-4（OpenAI），BERT（Google），主要用于语言生成、语言理解、文本分类、翻译等任务。快思慢想：效能兼顾全局视野概率预测（快速反应模型，如ChatGPT 响应速度快，算力成本低慢速思考，算力成本高运算原理基于概率预测，通过大量数据训练来快速预测可能的答案基于链式思维（Chain-of-Thought），逐步推理问题的每个步骤来得到答案决策能力依赖预设算法和规则进行决策能够自主分析情况，实时做出决策创造力限于模式识别和优化，缺乏真正的创新能力能够生成新的创意和解决方案，具备创新能力人机互动能力按照预设脚本响应，较难理解人类情感和意图需求（因其已内化推理逻辑）。 • 无需逐步指导，模型自动生成结构化推理过程（若强行拆解步骤，反而可能限制其能力）。 • 需显式引导推理步骤（如通过CoT提示），否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板（如要求分步思考、提供示例）。关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热度选择（如数学任务选推理模型，创意任务选通用模型）。提示语设计

0 码力 | 104 页 | 5.37 MB | 7 月前
3
清华大学 DeepSeek 从入门到精通

发散性任务（如诗歌创作）需要严格逻辑链的任务（如数学证明）性能本质专精于逻辑密度高的任务擅长多样性高的任务强弱判断并非全面更强，仅在其训练目标领域显著优于通用模型通用场景更灵活，但专项任务需依赖提示语补偿能力 • 例如：GPT-3、GPT-4（OpenAI），BERT（Google），主要用于语言生成、语言理解、文本分类、翻译等任务。快思慢想：效能兼顾全局视野概率预测（快速反应模型，如ChatGPT 响应速度快，算力成本低慢速思考，算力成本高运算原理基于概率预测，通过大量数据训练来快速预测可能的答案基于链式思维（Chain-of-Thought），逐步推理问题的每个步骤来得到答案决策能力依赖预设算法和规则进行决策能够自主分析情况，实时做出决策创造力限于模式识别和优化，缺乏真正的创新能力能够生成新的创意和解决方案，具备创新能力人机互动能力按照预设脚本响应，较难理解人类情感和意图需求（因其已内化推理逻辑）。 • 无需逐步指导，模型自动生成结构化推理过程（若强行拆解步骤，反而可能限制其能力）。 • 需显式引导推理步骤（如通过CoT提示），否则可能跳过关键逻辑。 • 依赖提示语补偿能力短板（如要求分步思考、提供示例）。关键原则 3 2 1 模型选择 • 优先根据任务类型而非模型热度选择（如数学任务选推理模型，创意任务选通用模型）。提示语设计

0 码力 | 103 页 | 5.40 MB | 8 月前
3
清华大学普通人如何抓住DeepSeek红利

结构、内部系统以及行业情况。然而，公司的产品手册复杂，部门间的职责不清晰，内部系统操作繁琐，行业信息量庞大，这些都让小李感到不知所措。他担心自己无法在短时间内快速上手，影响工作效率和表现。以往的解决方式： • 依赖同事的口头介绍，容易遗漏重要信息。 • 手动查阅厚重的产品手册和内部文档，耗时较长。 • 参加多部门的培训，但信息量大，难以消化。 • 通过网络搜索行业信息，但信息分散，难以整合。信息的准确性和全面性更高，减少了因信息不全而导致的误解和错误。通过DeepSeek的数据分析功能，新员工可以更深入地理解行业动态和公司运营，做出更明智的决策。成本更低：减少了对培训资源的依赖，新员工可以通过DeepSeek 自主学习，降低培训成本。通过提高工作效率，减少了人力资源的浪费，降低了整体运营成本。场景3：日常客户沟通与问题反馈处理常见问题：与甲方客户的沟通效率低，信息不对称，导致响应不及时或错误体系化方案不可行 Python验算无符合数字有符合数字如何使用DeepSeek处理生活中的事务 “生活太累？DeepSeek帮你‘减负’到家！场景1：职场妈妈的晨间战役（日常琐事管理）优先级排序（幼儿园事务＞会议准备＞生活采购）生成最优动线：地图标注幼儿园/干洗店/超市与公司的位置关系即时服务对接： ✓ 调用社区跑腿API下单手工材料配送 ✓ 接入干洗店智能柜系统预约取件码

0 码力 | 65 页 | 4.47 MB | 7 月前
3
人工智能安全治理框架 1.0

对措施。关注安全风险发展变化，快速动态精准调整治理措施，持续优化治理机制和方式，对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程，综合运用技术、管理相结合的安全治理措施，防范应对不同类型安全风险。围绕人工智能研发应用生态链，明确模型算法研发者、服务提供者、使用者等相关主体的安全责任，有机发挥政府监管、行业自律、社会监督等治理机制作用。共享最佳实践，提倡建立开放性平台，通过跨学科、跨领域、跨地区、跨国界的对话和合作，推动形成具有广泛共识的全球人工智能治理体系。 2. 人工智能安全治理框架构成基于风险管理理念，本框架针对不同类型的人工智能安全风险，从技术、管理两方面提出防范应对措施。同时，目前人工智能研发应用仍在快速发展，安全风险的表现形式、影响程度、认识感知亦随之变化，防范应对措施也将相应动态调整更新，需要各方共同对治理框架持续优化完善。的标准接口、特性库和工具包，以及开发界面和执行平台可能存在逻辑缺陷、- 5 - 人工智能安全治理框架漏洞等脆弱点，还可能被恶意植入后门，存在被触发和攻击利用的风险。（b）算力安全风险。人工智能训练运行所依赖的算力基础设施，涉及多源、泛在算力节点，不同类型计算资源，面临算力资源恶意消耗、算力层面风险跨边界传递等风险。（c）供应链安全风险。人工智能产业链呈现高度全球化分工协作格局。但个别国

0 码力 | 20 页 | 3.79 MB | 28 天前
3
DeepSeek图解10页PDF

脑配置要求降到最低，普通电脑也能飞速运行。 1.2 DeepSeek 本地部署三个步骤一共只需要三步，就能做到 DeepSeek 在本地运行并与它对话。第一步，使用的是 ollama 管理各种不同大模型，ollama 比较直接、干净，一键下载后安装就行，安装过程基本都是下一步。不知道去哪里下载的，可以直接在我的公众号后台回复：ollama，下载这个软件，然后装上，可以拿着手机扫码下图1直达我的公众号：知识，严禁拿此资料引流、出书、等形式的商业活动图 1: 我的公众号：郭震 AI 安装后，打开命令窗口，输入 ollama，然后就能看到它的相关指令，一共 10 个左右的命令，如下图2所示，就能帮我们管理好不同大模型：图 2: Ollama 常用的命令第二步，命令窗口输入：ollama pull deepseek-r1:1.5b，下载大模型 deepseek- r1 到我们自己的电脑，如下图3所示：就是自然语言处理领域实现扩展规律的最好的网络结构。 2.2 Transformer 基础架构 LLM 依赖于 2017 年 Google 提出的 Transformer 模型，该架构相比传统的 RNN（递归神经网络）和 LSTM（长短时记忆网络）具有更高的训练效率和更强的长距离依赖建模能力。Transformer 由多个关键组件组成：1. 自注意力机制（Self-Attention）

0 码力 | 11 页 | 2.64 MB | 7 月前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

案、法律意见书等，提高律师工作效率。 • 智能医疗数据分析与诊断：构建智能医疗平台，分析病历、检查报告和基因数据，帮助医生提供更准确的诊断与治疗方案。 • 金融风险预测与管理：开发金融风险分析工具，收集并分析市场数据，预测风险并为金融机构提供管理建议。 • 智能文学创作辅助：为作家提供创作灵感和文本构思，生成符合中文文学传统的故事情节和诗句，助力突破创作瓶颈。 • 智能广告创意生成：根据产品特点和目标高频交易数据分析：利用o3mini快速处理高频交易数据，识别市场趋势和交易模式，为交易者提供实时决策支持。 • 数据报告自动化生成：基于o3mini自动生成格式化的数据报告，包括图表、表格和文字说明，帮助管理者快速理解分析结果。 • 数据接口标准化：根据标准格式输出数据，利用o3mini方便不同系统和平台之间的数据共享，提升跨机构协作效率。 • 情感分析与数据解读：利用o3mini结合情感分析，对数据进行深入解读，帮助市场调转化文献为连贯文章：可以将现有的文献资料进行分析和整合，转化为逻辑连贯的新文章，为学者和知识工作者提供了极大的便利。  多智能体协作对话：Co-STORM模式引入了协作对话机制，并采用轮次管理策略，实现流畅的协作式AI学术研究。用户体验对比：使用步骤 PubScholar平台官网：https://pubscholar.cn/  输入关键词：进入官网后，在搜索框键入关键词进行文献检索。

0 码力 | 85 页 | 8.31 MB | 7 月前
3
开源中国 2023 大模型(LLM)技术报告

提供高效的存储和检索能力。通过数据向量化，实现了在向量数据库中进行高效的相似性计算和查询。根据向量数据库的的实现方式,可以将向量数据库大致分为两类：原生的向量数据库专门为存储和检索向量而设计，所管理的数据是基于对象或数据点的向量表示进行组织和索引。包括等均属于原生向量数据库。除了选择专业的向量数据库，对传统数据库添加 “向量支持”也是主流方案。比如等传统数据库均已支持向量检索。基础设施：大模型框架及微调 (Fine Tuning) 大模型框架指专门设计用于构建、训练和部署大型机器学习模型和深度学习模型的软件框架。这些框架提供了必要的工具和库，使开发者能够更容易地处理大量的数据、管理巨大的网络参数量，并有效地利用硬件资源。微调（Fine Tuning）是在大模型框架基础上进行的一个关键步骤。在模型经过初步的大规模预训练后，微调是用较小、特定领域的数据集对模型进行后续训练，以使 / 32 大模型应用现状：首批备案上线的中国大模型 8 月 31 日，百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等 8 家企业 / 机构的大模型产品首批通过《生成式人工智能服务管理暂行办法》备案，可正式上线面向公众提供服务。具体包括：百度（文心一言）、抖音（云雀大模型）、智谱 AI（GLM 大模型）、中科院（紫东太初大模型）、百川智能（百川大模型）、商汤（日日新大模型）、MiniMax

0 码力 | 32 页 | 13.09 MB | 1 年前
3
国家人工智能产业综合标准化体系建设指南（2024版）

、安全/治理等 7 个部分组成，如图 2 所示。 5 图 2 人工智能标准体系框架图 6 四、重点方向（一）基础共性标准基础共性标准主要包括人工智能术语、参考架构、测试评估、管理、可持续等标准。 1. 术语标准。规范人工智能相关技术、应用的概念定义，为其它标准的制定和人工智能研究提供参考，包括人工智能相关术语定义、范畴、实例等标准。 2. 参考架构标准。规范人工智能相关技术、应用及系统的方面的测试及评估的指标要求，包括与人工智能相关的服务能力成熟度评估，人工智能通用性测试指南、评估原则和等级要求，企业智能化能力框架及测评要求等标准。 4. 管理标准。规范人工智能技术、产品、系统、服务等全生命周期涉及的人员、组织管理要求和评价，包括面向人工智能组织的管理要求，人工智能管理体系、分类方法、评级流程等标准。 5. 可持续标准。规范人工智能影响环境的技术框架、方法和指标，平衡产业发展与环境保护，包括促进生态可持续的人工模型表达和格式、模型效果评价等，包括自监督学习、无监督学习、半监督学习、深度学习、强化学习等标准。 2. 知识图谱标准。规范知识图谱的描述、构建、运维、共享、管理和应用，包括知识表示与建模、知识获取与存储、知识融合与可视化、知识计算与管理、知识图谱质量评价与互联互通、 9 知识图谱交付与应用、知识图谱系统架构与性能要求等标准。 3. 大模型标准。规范大模型训练、推理、部署等环节的技术

0 码力 | 13 页 | 701.84 KB | 1 年前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

多轮对话图像生成视频生成音频生成 A I 数字人生物制药新材料研究脑机接口基础科学能源自由宇宙探索生命科学科学能力 6 AI Fo r Science 知识管理（内部知识管理、外部情报分析、大数据分析、工作流知识）专家经验模型（专业模型训练）业务流程自动化（ A g e n t框架）组织协同（工作流）人机交互赋能个人和企业员工生产力提升不能处理复杂流程，无法下地干活儿通用大模型不了解企业内部业务情况、行业情况 58政企、创业者必读知识管理是大模型更懂企业的基础 59 解决企业应用，需要打造专业大模型要解决四个关键基础以业务大模型为基础，打造自主工作的数字员工和AI团队实现多个Agent、多个数字化系统、多个组织之间的协同知识管理融合工作流业务大模型打造构建智能体基于政府企业场景和专业多模态数据处理和理解非结构化文档处理和理解搜索，辅助内部办公和外部客户服务为业务大模型RAG做准备内部知识管理 • 把企业内部的碎片化知识，把专家头脑中的经验转化为显性知识管理起来，如员工邮件、文档文件、聊天记录、工作记录等工作流知识管理 1 外部情报分析 • 抓取外部情报，例如行业报告、市场情报等 2 多模态处理 • 用大模型多模态能力把非结构化

0 码力 | 76 页 | 5.02 MB | 5 月前
3
TVM工具组

caffe 前端有利于提高竞争力。开源社区存量的开源 caffe 网络模型众多，TVM 直接支持 caffe 让大家更方便尝试 caffe 资源。绝赞招聘中当前进度无 caffe 依赖 from_caffe 直接导入 caffe 模型文件，不需要预先安装 caffe 。 net 已测试网络：alexnet / densenet121 / inception v1 / inception

0 码力 | 6 页 | 326.80 KB | 5 月前
3

共 14 条前往

页

分类

语言

格式