文件管理 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

沈阳团队博士后何静能做什么？要怎么做？效果如何？一能做什么？数据挖掘数据分析数据采集数据处理数据可视化 AIGC 数据应用通过编写爬虫代码、访问数据库、读取文件、调用API等方式，采集社交媒体数据、数据库内容、文本数据、接口数据等。通过数据清洗、数据集成、数据变换、特征工程等方式，实现数据纠错、数据整合、格式转换、特征提取等。对数据进行诊断、预测、关联、聚类分析，常用于问题通用性强：适用于多种自然语言处理任务，如对话生成和文本理解。爬虫数据采集 1、阅读网页源代码，提取特定网页内容； 2、撰写python脚本； 3、提取并合并网址； 4、提取网址内容； 5、写入文件。任务你需要完成以下两个任务： 1.阅读网页【网址】源代码【对应网页源代码】。提取所有包含“春运2025丨X月X日，全社会跨区域人员流动量完成X万人次”的网址进行去重、筛选，合并成网址列表相关数据（如日期、全社会跨区域人员流动量、铁路客运量、公路人员流动量、水路客运量、民航客运量等）”完成数据提取并写入文件“2025春运数据.txt” Open AI o3mini 响应速度快，能够高效提取所有需求链接，输出完整可运行python脚本，代码运行后生成文件，但数据采集结果为空。 DeepSeek R1 能够提取所有网址并进行筛选、去重，所撰写代码运行后完成数据爬虫任务，

0 码力 | 85 页 | 8.31 MB | 8 月前
3
人工智能安全治理框架 1.0

对措施。关注安全风险发展变化，快速动态精准调整治理措施，持续优化治理机制和方式，对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程，综合运用技术、管理相结合的安全治理措施，防范应对不同类型安全风险。围绕人工智能研发应用生态链，明确模型算法研发者、服务提供者、使用者等相关主体的安全责任，有机发挥政府监管、行业自律、社会监督等治理机制作用。共享最佳实践，提倡建立开放性平台，通过跨学科、跨领域、跨地区、跨国界的对话和合作，推动形成具有广泛共识的全球人工智能治理体系。 2. 人工智能安全治理框架构成基于风险管理理念，本框架针对不同类型的人工智能安全风险，从技术、管理两方面提出防范应对措施。同时，目前人工智能研发应用仍在快速发展，安全风险的表现形式、影响程度、认识感知亦随之变化，防范应对措施也将相应动态调整更新，需要各方共同对治理框架持续优化完善。对训练数据进行严格筛选，确保不包含核生化导武器等高危领域敏感数据。（d）训练数据中如包含敏感个人信息和重要数据，应加强数据安全管理，符合数据安全和个人信息保护相关标准规范。（e）使用真实、准确、客观、多样且来源合法的训练数据，及时过滤失效、错误、偏见数据。（f）向境外提供人工智能服务，应符合数据跨境管理规定。向境外提供人工智能模型算法，应符合出口管制要求。 4.1.3 系统安全风险应对（a）对

0 码力 | 20 页 | 3.79 MB | 1 月前
3
清华大学普通人如何抓住DeepSeek红利

M 6 Deepseek的能力图谱直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。决策支持文体转换个性化推荐翻译与转换多语言翻译异常检测多源信息融合知识与推理知识图谱构建流程优化数据可视化数据分析趋势分析，这个数据集包含了大量基于2020年之前数据生成的问答对。提取问题：从数据集中提取问题，并使用set去重。检查问题数量：确保提取的问题数量至少为10万个。保存问题：将问题保存到CSV文件生成的真实答案问题.csv中。要生成10万个存在真实答案的问题，并且基于2020年之前的数据，可以使用现有的公开问答数据集（如SQuAD 、 Natural Questions等）来生成问题。可以从多个数据集中组体系化方案不可行 Python验算无符合数字有符合数字如何使用DeepSeek处理生活中的事务 “生活太累？DeepSeek帮你‘减负’到家！场景1：职场妈妈的晨间战役（日常琐事管理）优先级排序（幼儿园事务＞会议准备＞生活采购）生成最优动线：地图标注幼儿园/干洗店/超市与公司的位置关系即时服务对接： ✓ 调用社区跑腿API下单手工材料配送 ✓ 接入干洗店智能柜系统预约取件码

0 码力 | 65 页 | 4.47 MB | 8 月前
3
普通人学AI指南

ollama，安装步骤非常简单。 3.1.2 步骤 2：安装 Llama 下载 Llama3，打开新的终端/命令行窗口，执行以下命令： ollama run llama3 程序会自动下载 Llama3 的模型文件，默认是 8B，也就 80 亿参数版本，个人电脑完全可以运行。等待安装完成，如图 12 所示。 14 Figure 12: Ollama 里下载 Llama3 界面以上就已经安装完毕，到现在大模型已经在本地部署完成。了解 docker 基本用法 Docker 是一个开源的容器化平台，旨在开发、部署和运行应用。它利用容器来隔离软件，使其在不同环境中都能一致运行。Docker 提供轻量级虚拟化，能快速部署并且易于管理应用。 Docker 的优势： 1. 快速部署：Docker 容器可以在几秒钟内启动，提高了开发和部署的效率。 2. 一致性：确保应用在开发、测试和生产环境中具有一致的运行环境。 3. 可移植性：容器可以在任何支持包含了运行所需的代码、运行时、系统工具、系统库和设置。 2. 镜像（Image）：用于创建容器的只读模板。一个镜像可以包含完整的操作系统环境。 3. Dockerfile：定义镜像内容的文本文件，包含了构建镜像的所有指令。 4. Docker Hub：公共的 Docker 镜像仓库，用于存储和分发 Docker 镜像。 5. 拉取镜像：docker pull

0 码力 | 42 页 | 8.39 MB | 8 月前
3
DeepSeek从入门到精通(20250204)

且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）代码注释、文档撰写结构化生成文章/故事/诗歌写作营销文案、广告语生成社交媒体内容（如推文、帖子）识和上下文。提示语的基本元素可以根据其功能和作用分为三个大类：信息类元素、结构类元素和控制类元素：结构类元素用于定义生成内容的组织形式和呈现方式，决定了AI输出的结构、格式和风格。控制类元素用于管理和引导AI的生成过程，确保输出符合预期并能够进行必要的调整，是实现高级提示语工程的重要工具。提示语的DNA：解构强大提示语的基本元素提示语元素组合矩阵提示语元素协同效应理论的核心观点包括： - 预留的应急资金比例 - 主要成本控制措施 8. 质量控制计划（900字内）：列出3—5个关键的质量控制点和相应的检查标准。包括内容质量、用户体验、技术实现等方面。 9. 风险管理矩阵（1200字内）：识别5—7个潜在风险点，评估其发生概率和影响程度。为每个高风险项目制定具体的预防和应对措施。 10. 利益相关者沟通计划（1800字内）：设计一个定期向各利益相关者（如高管、

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景，支持联网搜索与深度思考模式，同时支持文件上传，能够扫描读取各类文件及图片中的文字内容。文本生成表格、列表生成（如日程安排、菜谱）代码注释、文档撰写结构化生成文章/故事/诗歌写作营销文案、广告语生成社交媒体内容（如推文、帖子）识和上下文。提示语的基本元素可以根据其功能和作用分为三个大类：信息类元素、结构类元素和控制类元素：结构类元素用于定义生成内容的组织形式和呈现方式，决定了AI输出的结构、格式和风格。控制类元素用于管理和引导AI的生成过程，确保输出符合预期并能够进行必要的调整，是实现高级提示语工程的重要工具。提示语的DNA：解构强大提示语的基本元素提示语元素组合矩阵提示语元素协同效应理论的核心观点包括： - 预留的应急资金比例 - 主要成本控制措施 8. 质量控制计划（900字内）：列出3—5个关键的质量控制点和相应的检查标准。包括内容质量、用户体验、技术实现等方面。 9. 风险管理矩阵（1200字内）：识别5—7个潜在风险点，评估其发生概率和影响程度。为每个高风险项目制定具体的预防和应对措施。 10. 利益相关者沟通计划（1800字内）：设计一个定期向各利益相关者（如高管、

0 码力 | 103 页 | 5.40 MB | 8 月前
3
清华大学第二弹：DeepSeek赋能职场

题解决能力 Agent •代表用户执行任务，具备自主行动能力 Innovator • 参与发明和创造，增强人类的创造力和创新能力 Organization •承担整个组织的功能，独立管理并执行复杂的操作 • 致力于人机协同和人机共生领域的世界级团队，专注于打造能够驾驭AI、熟悉AI并实现人类与AI共生发展的学术与实践模式。团队愿景 • 李默非（清华大学人工智能学院拟录博士生）：人机共生之基座大模型研究研发金牌金山办公2024中文文本智能校对大赛第二名 2024 法研杯法律要素争议焦点识别第二名 AFAC2024金融智能创新大赛金融工具学习三等奖 Googl e kaggl e全球专利文件短语相似性匹配金牌 Googl e kaggl e全球自动问答比赛金牌 Googl e kaggl e全球医疗对话理解金牌 2021全球人工智能技术创新大赛-小布助手对话短文本语义匹配一等奖写一份关于XXX活动的小红书宣推文案写一份关于XX事件的舆论分析报告（XX活动/事件相关背景信息如下……） Goal（目标）期望达成什么目标效果：通过该文案吸引潜在客户，促成消费……通过该报告为相关企业管理者提供……策略支撑 Objective（操作要求）字数要求、段落结构、用词风格、内容要点、输出格式… CO-STAR提示语框架新加坡 GPT-4 提示工程竞赛冠军提示词框架 "R"，代表

0 码力 | 35 页 | 9.78 MB | 8 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

、安全/治理等 7 个部分组成，如图 2 所示。 5 图 2 人工智能标准体系框架图 6 四、重点方向（一）基础共性标准基础共性标准主要包括人工智能术语、参考架构、测试评估、管理、可持续等标准。 1. 术语标准。规范人工智能相关技术、应用的概念定义，为其它标准的制定和人工智能研究提供参考，包括人工智能相关术语定义、范畴、实例等标准。 2. 参考架构标准。规范人工智能相关技术、应用及系统的方面的测试及评估的指标要求，包括与人工智能相关的服务能力成熟度评估，人工智能通用性测试指南、评估原则和等级要求，企业智能化能力框架及测评要求等标准。 4. 管理标准。规范人工智能技术、产品、系统、服务等全生命周期涉及的人员、组织管理要求和评价，包括面向人工智能组织的管理要求，人工智能管理体系、分类方法、评级流程等标准。 5. 可持续标准。规范人工智能影响环境的技术框架、方法和指标，平衡产业发展与环境保护，包括促进生态可持续的人工模型表达和格式、模型效果评价等，包括自监督学习、无监督学习、半监督学习、深度学习、强化学习等标准。 2. 知识图谱标准。规范知识图谱的描述、构建、运维、共享、管理和应用，包括知识表示与建模、知识获取与存储、知识融合与可视化、知识计算与管理、知识图谱质量评价与互联互通、 9 知识图谱交付与应用、知识图谱系统架构与性能要求等标准。 3. 大模型标准。规范大模型训练、推理、部署等环节的技术

0 码力 | 13 页 | 701.84 KB | 1 年前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

多轮对话图像生成视频生成音频生成 A I 数字人生物制药新材料研究脑机接口基础科学能源自由宇宙探索生命科学科学能力 6 AI Fo r Science 知识管理（内部知识管理、外部情报分析、大数据分析、工作流知识）专家经验模型（专业模型训练）业务流程自动化（ A g e n t框架）组织协同（工作流）人机交互赋能个人和企业员工生产力提升不能处理复杂流程，无法下地干活儿通用大模型不了解企业内部业务情况、行业情况 58政企、创业者必读知识管理是大模型更懂企业的基础 59 解决企业应用，需要打造专业大模型要解决四个关键基础以业务大模型为基础，打造自主工作的数字员工和AI团队实现多个Agent、多个数字化系统、多个组织之间的协同知识管理融合工作流业务大模型打造构建智能体基于政府企业场景和专业多模态数据处理和理解非结构化文档处理和理解搜索，辅助内部办公和外部客户服务为业务大模型RAG做准备内部知识管理 • 把企业内部的碎片化知识，把专家头脑中的经验转化为显性知识管理起来，如员工邮件、文档文件、聊天记录、工作记录等工作流知识管理 1 外部情报分析 • 抓取外部情报，例如行业报告、市场情报等 2 多模态处理 • 用大模型多模态能力把非结构化

0 码力 | 76 页 | 5.02 MB | 5 月前
3
开源中国 2023 大模型(LLM)技术报告

提供高效的存储和检索能力。通过数据向量化，实现了在向量数据库中进行高效的相似性计算和查询。根据向量数据库的的实现方式,可以将向量数据库大致分为两类：原生的向量数据库专门为存储和检索向量而设计，所管理的数据是基于对象或数据点的向量表示进行组织和索引。包括等均属于原生向量数据库。除了选择专业的向量数据库，对传统数据库添加 “向量支持”也是主流方案。比如等传统数据库均已支持向量检索。基础设施：大模型框架及微调 (Fine Tuning) 大模型框架指专门设计用于构建、训练和部署大型机器学习模型和深度学习模型的软件框架。这些框架提供了必要的工具和库，使开发者能够更容易地处理大量的数据、管理巨大的网络参数量，并有效地利用硬件资源。微调（Fine Tuning）是在大模型框架基础上进行的一个关键步骤。在模型经过初步的大规模预训练后，微调是用较小、特定领域的数据集对模型进行后续训练，以使 / 32 大模型应用现状：首批备案上线的中国大模型 8 月 31 日，百度、字节、商汤、中科院旗下紫东太初、百川智能、智谱华章等 8 家企业 / 机构的大模型产品首批通过《生成式人工智能服务管理暂行办法》备案，可正式上线面向公众提供服务。具体包括：百度（文心一言）、抖音（云雀大模型）、智谱 AI（GLM 大模型）、中科院（紫东太初大模型）、百川智能（百川大模型）、商汤（日日新大模型）、MiniMax

0 码力 | 32 页 | 13.09 MB | 1 年前
3

共 13 条前往

页

分类

语言

格式