稳定性与性能建议 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

将数据转化为统计图、热力图、网络关系图、词云、树形图等，用于揭示数据中蕴含的模式、趋势、异常和洞见。本质：以多agent实现从数据采集到可视全流程模型特点 Claude 3.5 sonnet  平衡性能：在模型大小和性能之间取得平衡，适合中等规模任务。  多模态支持：支持文本和图像处理，扩展应用场景。  可解释性：注重模型输出的可解释性和透明性。 DeepSeek R1  高效推理：专注于低延迟和 5支持联网查询网址，Claude 3.5 sonnet暂不支持；  四个模型均能根据上传的网页代码，对多个网址链接进行筛选、去重，完全提取出符合指令要求的所有网址链接并形成列表；  在复杂爬虫任务上，DeepSeek R1与Open AI o3min生成的代码均能正常执行数据采集任务，o3响应速度更快，R1数据采集结果更加完整准确；其他2个模型都存在多次调试但代码仍然运行不成功的问题，如代码中罗列URL不全、输出文本中提取数据为空等。很好地完成了数据读取及提取任务，没有漏数据指标，数据逻辑性很好 Kimi k1.5 能够快速读取文件数据，并整理成可视化数据表格，但填入数据有所缺失。  DeepSeek R1与Claude 3.5 sonnet均能很好的完成文件数据读取任务，生成的表格逻辑性强、数据指标清晰，Claude 3.5 sonnet一次性完成表格生成后支持直接复制和表格文件下载。  Open

0 码力 | 85 页 | 8.31 MB | 8 月前
3
DeepSeek从入门到精通(20250204)

团队：余梦珑博士后清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室 • Deepseek是什么？ • Deepseek能够做什么？ • 如何使用Deepseek？ DeepSeek是什么？ AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek- 补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）代码注释、文档撰写结构化生成文章/故事/诗歌写作营销文案、广告语生成社交媒体内容（如推文、帖子）剧本或对话设计文本创作长文本摘要（论文、报告）文本简化（降低复杂度）多语言翻译与本地化摘要与改写 02 文本生成自然语言理解与分析知识推理知识推理逻辑问题解答（数学、常识推理）因果分析（事件关联性）语义分析语义解析情感分析（评论、反馈）意图识别（客服对话、用户查询）实体提取（人名、地点、事件）文本分类文本分类主题标签生成（如新闻分类）垃圾内容检测编程与代码相关代码调试 • 错误分析与修复建议 • 代码性能优

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

• DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成文本简化（降低复杂度）多语言翻译与本地化摘要与改写 02 01 03 文本生成自然语言理解与分析知识推理知识推理逻辑问题解答（数学、常识推理）因果分析（事件关联性）语义分析语义解析情感分析（评论、反馈）意图识别（客服对话、用户查询）实体提取（人名、地点、事件）文本分类文本分类主题标签生成（如新闻分类）垃圾内容检测编程与代码相关代码调试代码调试 • 错误分析与修复建议 • 代码性能优化提示技术文档处理 • API文档生成 • 代码库解释与示例生成代码生成 • 根据需求生成代码片段（Python、 JavaScript） • 自动补全与注释生成常规绘图如何使用DeepSeek？网页端：https://chat.deepseek.com APP：DeepSeek

0 码力 | 103 页 | 5.40 MB | 9 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

国人工智能产业高质量发展提供坚实的技术支撑。到 2026 年，标准与产业科技创新的联动水平持续提升，新制定国家标准和行业标准 50 项以上，引领人工智能产业高质量发展的标准体系加快形成。开展标准宣贯和实施推广的企业超过 1000 家，标准服务企业创新发展的成效更加凸显。参与制定国际标准 20 项以上，促进人工智能产业全球化发展。坚持创新驱动。优化产业科技创新与标准化联动机制，加快人工智能领域关键共性技术研究，推动先进适用的科技同，加强跨行业、跨领域标准化技术组织的协作，打造大中小企业融通发展的标准化模式。坚持开放合作。深化国际标准化交流与合作，鼓励我国企事业单位积极参与国际标准化活动，携手全球产业链上下游企业共同制定国际标准。三、建设思路（一）人工智能标准体系结构人工智能标准体系结构包括基础共性、基础支撑、关键技术、智能产品与服务、赋能新型工业化、行业应用、安全 /治理等 7 个部分，如图 1 所示。其中，基础共性标准是人规范数据、算力、算法等技术要求，为人工智能产业发展夯实技术底座。关键技术标准主要规范人工智能文本、语音、图像，以及人机混合增强智能、智能体、跨媒体智能、具身智能等的技术要求，推动人工智能技术创新和应用。智能产品与服务标准主要规范由人工智能技术形成的智能产品和服务模式。赋能新型工业化标准主要规范人工智能技术赋能制造业全流程智能化以及重点行业智能升级的技术要求。行业应用标准主要规范人工智能赋能各行业的技术要求，为人

0 码力 | 13 页 | 701.84 KB | 1 年前
3
DeepSeek图解10页PDF

如： 1. 保护隐私与数据安全。数据不外传：本地运行模型可以完全避免数据上传至云端，确保敏感信息不被第三方访问。 2. 可定制化与优化。支持微调（Fine-tuning）：可以根据特定业务需求对模型进行微调，以适应特定任务，如行业术语、企业内部知识库等。 3. 离线运行，适用于无网络环境。可在离线环境下运行：适用于无互联网连接或网络受限的场景。提高系统稳定性：即使云服务宕机，本地大模型依依然可以正常工作，不受外部因素影响。本教程搭建 DeepSeek 好处本地搭建 DeepSeek 三个比较实际的好处： • 本教程接入的是 DeepSeek 推理模型 R1，开源免费，性能强劲 • 本教程搭建方法零成本，不需花一分钱。 • 为了照顾到大部分读者，推荐的搭建方法已将电脑配置要求降到最低，普通电脑也能飞速运行。 1.2 DeepSeek 本地部署三个步骤一共只需要三步，就能做到 DeepSeek-R1 精华图解 3.1 DeepSeek-R1 完整训练过程 DeepSeek-R1 主要亮点在于出色的数学和逻辑推理能力，区别于一般的通用 AI 模型。其训练方式结合了强化学习（RL）与监督微调（SFT），创造了一种高效训练，高推理能力 AI 模型的方法。整个训练过程分为核心两阶段，第一步训练基于 DeepSeek-V3 论文中的基础模型（而非最终版本），并经历了 SFT

0 码力 | 11 页 | 2.64 MB | 8 月前
3
人工智能安全治理框架 1.0

，可能带来性能下降、决策错误等诸多问题。- 4 - 人工智能安全治理框架（d）被窃取、篡改的风险。参数、结构、功能等算法核心信息，面临被逆向攻击窃取、修改，甚至嵌入后门的风险，可导致知识产权被侵犯、商业机密泄露，推理过程不可信、决策输出错误，甚至运行故障。（e）输出不可靠风险。生成式人工智能可能产生 “幻觉”，即生成看似合理，实则不符常理的内容，造成知识偏见与误导。（的对抗样本数据，隐蔽地误导、影响，以至操纵人工智能模型，使其产生错误的输出，甚至造成运行瘫痪。 3.1.2 数据安全风险（a）违规收集使用数据风险。人工智能训练数据的获取，以及提供服务与用户交互过程中，存在未经同意收集、不当使用数据和个人信息的安全风险。（b）训练数据含不当内容、被 “投毒” 风险。训练数据中含有虚假、偏见、侵犯知识产权等违法有害信息，或者来源缺乏多样性，导致输出违法的、不良现实域安全风险（a）诱发传统经济社会安全风险。人工智能应用于金融、能源、电信、交通、民生等传统行业领域，如自动驾驶、智能诊疗等，模型算法存在的幻觉输出、错误决策，以及因不当使用、外部攻击等原因出现系统性能下降、中断、失控等问题，将对用户人身生命财产安全、经济社会安全稳定等造成安全威胁。（b）用于违法犯罪活动的风险。人工智能可能被利用于涉恐、涉暴、涉赌、涉毒等传统违法犯罪活动，包括传授违法犯罪技巧、隐匿违法犯罪行为、制作

0 码力 | 20 页 | 3.79 MB | 1 月前
3
清华大学普通人如何抓住DeepSeek红利

清华大学新闻与传播学院新媒体研究中心元宇宙文化实验室 @新媒沈阳团队：陶炜博士生普通人如何抓住DeepSeek红利 p Deepseek是什么？ p Deepseek能够做什么？ ——在工作、学习、生活和社会关系中解决问题 p 如何提问？让AI一次性生成你想要的东西卷不动了？DeepSeek帮你一键“躺赢”！学习太难？DeepSeek带你“开挂”逆袭！面对AI提供的多种解法，人类需具备批判性思维与逻辑判断能力，通过选择最优答案，实现解决方案的创新性再生。 p 智慧赋能的决策力提出问题与甄别答案的能力，使人类在信息爆炸与AI辅助的时代，通过决策行为实现价值创造，成为社会发展的持续动力。善用DeepSeek的两大关键：提出问题鉴别答案 DeepSeek是什么? • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司，主攻大模型研发与应用。 • • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力。在数学、代码、自然语言推理等任务上，性能比肩OpenAl-o1正式版。 (Pass@1) (Percentile)

0 码力 | 65 页 | 4.47 MB | 8 月前
3
Deepseek R1 本地部署完全手册

是⽀持复杂推理、多模态处理、技术⽂档⽣成的⾼性能通⽤⼤语⾔模型。本⼿册为技术团队提供完整的本地部署指南，涵盖硬件配置、国产芯⽚适配、量化⽅案、云端替代⽅案及完整671B MoE模型的Ollama部署⽅法。核⼼提示：个⼈⽤户：不建议部署32B及以上模型，硬件成本极⾼且运维复杂。企业⽤户：需专业团队⽀持，部署前需评估ROI（投资回报率）。⼆、本地部署核⼼配置要求 1. 模型参数与硬件对应表模型参 2*H20 GPU 三、国产芯⽚与硬件适配⽅案 1. 国内⽣态合作伙伴动态企业适配内容性能对标（vs NVIDIA）华为昇腾昇腾910B原⽣⽀持R1全系列，提供端到端推理优化⽅案等效A100（FP16）沐曦 GPU MXN系列⽀持70B模型BF16推理，显存利⽤率提升 30% 等效RTX 3090 海光 DCU 适配V3/R1模型，性能对标NVIDIA A100 等效A100（BF16）壁彻算⼒平台+昇腾910B集群科研计算与多模态处理四、云端部署替代⽅案 1. 国内云服务商推荐平台核⼼优势适⽤场景硅基流动官⽅推荐API，低延迟，⽀持多模态模型企业级⾼并发推理腾讯云⼀键部署+限时免费体验，⽀持VPC私有化中⼩规模模型快速上线 PPIO派欧云价格仅为OpenAI 1/20，注册赠5000万tokens 低成本尝鲜与测试 2. 国际接⼊渠道（需魔法或外企上⽹环境

0 码力 | 7 页 | 932.77 KB | 8 月前
3
开源中国 2023 大模型(LLM)技术报告

以其在自然语言处理领域的卓越表现，成为推动语言理解、生成和应用的引擎。 LLM 在多个领域都取得了令人瞩目的成就。在自然语言处理领域，GPT 系列模型在文本生成、问答系统和对话生成等任务中展现出色的性能。在知识图谱构建、智能助手开发等方面，LLM 技术也发挥了关键作用。此外，它还在代码生成、文本摘要、翻译等任务中展现了强大的通用性。本报告从技术人视角出发，将深入探讨 LLM 技术的背景、 Tuning)  大模型训练平台与工具基础设施 LLM Agent  备案上线的中国大模型  知名大模型  知名大模型应用大模型算力工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  插件、IDE、终端  代码生成工具编程语言 3 / 32 LLM 技术背景 Transformer 架构和预训练与微调策略是 LLM 技术的核心，随着大规模语言数据集的可用性和计算能以提高对语言复杂性的理解。 GPT (Generative Pre-trained Transformer) 的提出标志着 LLM 技术的飞速发展，其预训练和微调的方法为语言任务提供了前所未有的性能，以此为基础，多模态融合的应用使得 LLM 更全面地处理各种信息，支持更广泛的应用领域。图源：https://postgresml.org/docs/.gitbook/assets/ml_system

0 码力 | 32 页 | 13.09 MB | 1 年前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

DeepSeek出现之前的十大预判之五知识的质量和密度决定大模型能力  高质量数据、合成数据使模型知识密度的快速增长  大模型能以更少的参数量达到更高的性能  360联合北大研发：5%参数量逼近Deepseek-R1满血性能 18政企、创业者必读 DeepSeek出现之前的十大预判之六成本越来越低  过去一年，大模型成本「自由落体」  国外：GPT-4等效智能在过去18个月内价格下降240倍降240倍  国内：大模型「亏本」卖，可以「白嫖」大模型API能力 19政企、创业者必读 DeepSeek出现之前的十大预判之七多模态越来越重要  由文本生成迈向图像、视频、3D内容与世界模拟  多模态模态在能力变强的同时，规模正在变小 20政企、创业者必读 21 DeepSeek出现之前的十大预判之八智能体推动大模型快速落地  能够调用各种工具，具有行动能力  Law • 利用合成数据解决数据用尽问题 • 利用self-play强化学习，在不增大参数规模前提下，大幅提升复杂推理能力 • 通过后训练算力和推理算力，在不增加预训练算力前提下，大幅提升模型性能 DeepSeek颠覆式创新——技术创新 26政企、创业者必读  预训练模型如GPT——疯狂读书，积累知识，Scaling law撞墙  预训练模型思考深度不够  算力见顶，变成少数巨头游戏

0 码力 | 76 页 | 5.02 MB | 6 月前
3

共 14 条前往

页

分类

语言

格式