清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单沈阳团队博士后 何静 能做什么? 要怎么做? 效果如何? 一 能做什么? 数据挖掘 数据分析 数据采集 数据处理 数据可视化 AIGC 数据应用 通过编写爬虫代码、访问数据库、读取文件、调用API等方式,采 集社交媒体数据、数据库内容、文本数据、接口数据等。 通过数据清洗、数据集成、数据变换、特征工程等方式,实 现数据纠错、数据整合、格式转换、特征提取等。 对数据进行诊断、预测、关联、聚类分析,常用于问题 通用性强:适用于多种自 然语言处理任务,如对话 生成和文本理解。 爬虫数据采集 1、阅读网页源代码,提取特定网页内容; 2、撰写python脚本; 3、提取并合并网址; 4、提取网址内容; 5、写入文件。 任务 你需要完成以下两个任务: 1.阅读网页【网址】源代码【对应网页源代码】。提取所 有包含“春运2025丨X月X日,全社会跨区域人员流动量完 成X万人次”的网址进行去重、筛选,合并成网址列表 相关数据(如日期、全社会跨区域人员流动量、铁路客运 量、公路人员流动量、水路客运量、民航客运量等)”完 成数据提取并写入文件“2025春运数据.txt” Open AI o3mini 响应速度快,能够高效提 取所有需求链接,输出完 整可运行python脚本,代 码运行后生成文件,但数 据采集结果为空。 DeepSeek R1 能够提取所有网址并进行 筛选、去重,所撰写代码 运行后完成数据爬虫任务,0 码力 | 85 页 | 8.31 MB | 8 月前3
人工智能安全治理框架 1.0对 措施。关注安全风险发展变化,快速动态精准调整治理措施,持续优化治理机 制和方式,对确需政府监管事项及时予以响应。 1.3 技管结合、协同应对。面向人工智能研发应用全过程,综合运用技术、 管理相结合的安全治理措施,防范应对不同类型安全风险。围绕人工智能研发 应用生态链,明确模型算法研发者、服务提供者、使用者等相关主体的安全责 任,有机发挥政府监管、行业自律、社会监督等治理机制作用。 共享最佳实践,提倡建立开放性平台,通过跨学科、跨领域、跨地区、跨国界 的对话和合作,推动形成具有广泛共识的全球人工智能治理体系。 2. 人工智能安全治理框架构成 基于风险管理理念,本框架针对不同类型的人工智能安全风险,从技术、 管理两方面提出防范应对措施。同时,目前人工智能研发应用仍在快速发展, 安全风险的表现形式、影响程度、认识感知亦随之变化,防范应对措施也将相 应动态调整更新,需要各方共同对治理框架持续优化完善。 对训练数据进行严格筛选,确保不包含核生化导武器等高危领域敏 感数据。 (d) 训练数据中如包含敏感个人信息和重要数据,应加强数据安全管理, 符合数据安全和个人信息保护相关标准规范。 (e) 使用真实、准确、客观、多样且来源合法的训练数据,及时过滤失 效、错误、偏见数据。 (f) 向境外提供人工智能服务,应符合数据跨境管理规定。向境外提供 人工智能模型算法,应符合出口管制要求。 4.1.3 系统安全风险应对 (a)对0 码力 | 20 页 | 3.79 MB | 1 月前3
清华大学 普通人如何抓住DeepSeek红利M 6 Deepseek的能力图谱 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场 景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 决策支持 文体转换 个性化推荐 翻译与转换 多语言翻译 异常检测 多源信息融合 知识与推理 知识图谱构建 流程优化 数据可视化 数据分析 趋势分析 ,这个数据 集包含了大量基于2020年之前数据生成的问答对。 提取问题:从数据集中提取问题,并使用set去重。 检查问题数量:确保提取的问题数量至少为10万个。 保存问题:将问题保存到CSV文件生成的真实答案问题.csv中。 要生成10万个存在真实答案的问题,并且基于2020年之前的 数据,可以使用现有的公开问答数据集(如SQuAD 、 Natural Questions等)来生成问题。可以从多个数据集中组 体系化 方案不可行 Python验算 无符合数字 有符合数字 如何使用DeepSeek处理生活中的事务 “生活太累?DeepSeek帮你‘减负’到家! 场景1:职场妈妈的晨间战役(日常琐事管理) 优先级排序(幼儿园事务>会议准备>生活采购) 生成最优动线:地图标注幼儿园/干洗店/超市与公司的位置关系 即时服务对接: ✓ 调用社区跑腿API下单手工材料配送 ✓ 接入干洗店智能柜系统预约取件码0 码力 | 65 页 | 4.47 MB | 8 月前3
普通人学AI指南ollama,安装步骤非常简 单。 3.1.2 步骤 2:安装 Llama 下载 Llama3,打开新的终端/命令行窗口,执行以下命令: ollama run llama3 程序会自动下载 Llama3 的模型文件,默认是 8B,也就 80 亿参数版本,个 人电脑完全可以运行。等待安装完成,如图 12 所示。 14 Figure 12: Ollama 里下载 Llama3 界面 以上就已经安装完毕,到现在大模型已经在本地部署完成。 了解 docker 基本用法 Docker 是一个开源的容器化平台,旨在开发、部署和运行应用。它利用容器来 隔离软件,使其在不同环境中都能一致运行。Docker 提供轻量级虚拟化,能快 速部署并且易于管理应用。 Docker 的优势: 1. 快速部署:Docker 容器可以在几秒钟内启动,提高了开发和部署的效率。 2. 一致性:确保应用在开发、测试和生产环境中具有一致的运行环境。 3. 可移植性:容器可以在任何支持 包含了运行所需的代 码、运行时、系统工具、系统库和设置。 2. 镜像(Image):用于创建容器的只读模板。一个镜像可以包含完整的操作 系统环境。 3. Dockerfile:定义镜像内容的文本文件,包含了构建镜像的所有指令。 4. Docker Hub:公共的 Docker 镜像仓库,用于存储和分发 Docker 镜像。 5. 拉取镜像:docker pull0 码力 | 42 页 | 8.39 MB | 8 月前3
DeepSeek从入门到精通(20250204)且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 识和上下文。 提示语的基本元素可以根据其功能和作用分为三个大类:信息类元素、结构类元素和控制类元素: 结构类元素用于定义生成内容的组织形式和呈现方式, 决定了AI输出的结构、格式和风格。 控制类元素用于管理和引导AI的生成过程,确保输出 符合预期并能够进行必要的调整,是实现高级提示语 工程的重要工具。 提示语的DNA:解构强大提示语的基本元素 提示语元素组合矩阵 提示语元素协同效应理论的核心观点包括: - 预留的应急资金比例 - 主要成本控制措施 8. 质量控制计划(900字内):列出3—5个关键的质量控制点和相应的检查标准。 包括内容质量、用户体验、技术实现等方面。 9. 风险管理矩阵(1200字内): 识别5—7个潜在风险点,评估其发生概率和影响 程度。为每个高风险项目制定具体的预防和应对措施。 10. 利益相关者沟通计划(1800字内):设计一个定期向各利益相关者(如高管、0 码力 | 104 页 | 5.37 MB | 8 月前3
清华大学 DeepSeek 从入门到精通且可免费商用。 Deepseek可以做什么? 直接面向用户或者支持开发者,提供智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景, 支持联网搜索与深度思考模式,同时支持文件上传,能够扫描读取各类文件及图片中的文字内容。 文本生成 表格、列表生成(如日程安排、菜谱) 代码注释、文档撰写 结构化生成 文章/故事/诗歌写作 营销文案、广告语生成 社交媒体内容(如推文、帖子) 识和上下文。 提示语的基本元素可以根据其功能和作用分为三个大类:信息类元素、结构类元素和控制类元素: 结构类元素用于定义生成内容的组织形式和呈现方式, 决定了AI输出的结构、格式和风格。 控制类元素用于管理和引导AI的生成过程,确保输出 符合预期并能够进行必要的调整,是实现高级提示语 工程的重要工具。 提示语的DNA:解构强大提示语的基本元素 提示语元素组合矩阵 提示语元素协同效应理论的核心观点包括: - 预留的应急资金比例 - 主要成本控制措施 8. 质量控制计划(900字内):列出3—5个关键的质量控制点和相应的检查标准。 包括内容质量、用户体验、技术实现等方面。 9. 风险管理矩阵(1200字内): 识别5—7个潜在风险点,评估其发生概率和影响 程度。为每个高风险项目制定具体的预防和应对措施。 10. 利益相关者沟通计划(1800字内):设计一个定期向各利益相关者(如高管、0 码力 | 103 页 | 5.40 MB | 8 月前3
清华大学第二弹:DeepSeek赋能职场题解决能力 Agent •代表用户执行任 务,具备自主行 动能力 Innovator • 参与发明和创造, 增强人类的创造力 和创新能力 Organization •承担整个组织的 功能,独立管理 并执行复杂的操 作 • 致力于人机协同和人机共生领域的世界级团队,专注于打造能够驾驭AI、熟悉AI并实现人类与AI共生发展的学术与实践模式。 团队愿景 • 李默非(清华大学人工智能学院拟录博士生):人机共生之基座大模型研究研发 金牌 金山办公2024中文文本智能校对大赛 第二名 2024 法研杯 法律要素争议焦点识别 第二名 AFAC2024金融智能创新大赛 金融工具学习 三等奖 Googl e kaggl e全球专利文件短语相似性匹配 金牌 Googl e kaggl e全球自动问答比赛 金牌 Googl e kaggl e全球医疗对话理解 金牌 2021全球人工智能技术创新大赛-小布助手对话短文本语义匹配 一等奖 写一份关于XXX活动的小红书宣推文案 写一份关于XX事件的舆论分析报告 (XX活动/事件相关背景信息如下……) Goal(目标) 期望达成什么目标效果: 通过该文案吸引潜在客户,促成消 费……通过该报告为相关企业管理 者提供……策略支撑 Objective(操作要 求) 字数要求、段落结构、用词风格、 内容要点、输出格式… CO-STAR提示语框架 新加坡 GPT-4 提示工程竞赛冠军提示词框架 "R",代表0 码力 | 35 页 | 9.78 MB | 8 月前3
国家人工智能产业综合标准化体系建设指南(2024版)、安 全/治理等 7 个部分组成,如图 2 所示。 5 图 2 人工智能标准体系框架图 6 四、重点方向 (一)基础共性标准 基础共性标准主要包括人工智能术语、参考架构、测试评估、 管理、可持续等标准。 1. 术语标准。规范人工智能相关技术、应用的概念定义, 为其它标准的制定和人工智能研究提供参考,包括人工智能相关 术语定义、范畴、实例等标准。 2. 参考架构标准。规范人工智能相关技术、应用及系统的 方面的测试及评估的指标要求,包括与人工智能相关的服务能力 成熟度评估,人工智能通用性测试指南、评估原则和等级要求, 企业智能化能力框架及测评要求等标准。 4. 管理标准。规范人工智能技术、产品、系统、服务等全 生命周期涉及的人员、组织管理要求和评价,包括面向人工智能 组织的管理要求,人工智能管理体系、分类方法、评级流程等标 准。 5. 可持续标准。规范人工智能影响环境的技术框架、方法 和指标,平衡产业发展与环境保护,包括促进生态可持续的人工 模型表达和格式、模型效果评价等,包括自监督学习、无监督学 习、半监督学习、深度学习、强化学习等标准。 2. 知识图谱标准。规范知识图谱的描述、构建、运维、共 享、管理和应用,包括知识表示与建模、知识获取与存储、知识 融合与可视化、知识计算与管理、知识图谱质量评价与互联互通、 9 知识图谱交付与应用、知识图谱系统架构与性能要求等标准。 3. 大模型标准。规范大模型训练、推理、部署等环节的技 术0 码力 | 13 页 | 701.84 KB | 1 年前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502多轮对话 图像生成 视频生成 音频生成 A I 数字人 生物制药 新材料研究 脑机接口 基础科学 能源自由 宇宙探索 生命科学 科学 能力 6 AI Fo r Science 知识管理( 内部知识管理、 外部情报分析、 大数据分析、 工作流知识) 专家经验模型( 专业模型训练) 业务流程自动化( A g e n t框架) 组织协同( 工作流) 人机交互 赋能个人和 企业员工 生产力提升 不能处理复杂流程,无法下地干活儿 通用大模型不了解企业内部业务情况、行业情况 58政企、创业者必读 知识管理是大模型更 懂企业的基础 59 解决企业应用,需要打造专业大模型 要解决四个关键基础 以业务大模型为基础, 打造自主工作的数字 员工和AI团队 实现多个Agent、多个 数字化系统、多个组织 之间的协同 知识 管理 融合 工作流 业务大模型 打造 构建 智能体 基于政府企业场景和专业 多模态数据处理和理解 非结构化文档处理和理解 搜索,辅助内部办公和外部客户服务 为业务大模型RAG做准备 内部知识管理 • 把企业内部的碎片化知识, 把专 家头脑中的经验转化为显性知识 管理起来, 如员工邮件、 文档文 件、 聊天记录、 工作记录等 工作流知识管理 1 外部情报分析 • 抓取外部情报, 例如行业报告、 市 场情报等 2 多模态处理 • 用大模型多模态能力把非结构化0 码力 | 76 页 | 5.02 MB | 5 月前3
开源中国 2023 大模型(LLM)技术报告提供高效的存储和检索能力。通过数据向量化,实现了 在向量数据库中进行高效的相似性计算和查询。 根据向量数据库的的实现方式,可以将向量数据库大致分为两类: 原生的向量数据库专门为存储和检索向量而设计, 所管理的数据是基于对象或数据点的向量表示进行 组织和索引。 包括 等均属于原生向量数据库。 除了选择专业的向量数据库,对传统数据库添加 “向量支持”也是主流方案。比如 等传 统数据库均已支持向量检索。 基础设施:大模型框架及微调 (Fine Tuning) 大模型框架指专门设计用于构建、训练和部署大型机器 学习模型和深度学习模型的软件框架。这些框架提供了 必要的工具和库,使开发者能够更容易地处理大量的数 据、管理巨大的网络参数量,并有效地利用硬件资源。 微调(Fine Tuning)是在大模型框架基础上进行的一个 关键步骤。在模型经过初步的大规模预训练后,微调是 用较小、特定领域的数据集对模型进行后续训练,以使 / 32 大模型应用现状:首批备案上线的中国大模型 8 月 31 日,百度、字节、商汤、中科院旗下 紫东太初、百川智能、智谱华章等 8 家企业 / 机构的大模型产品首批通过《生成式人工智能 服务管理暂行办法》备案,可正式上线面向公 众提供服务。 具体包括:百度(文心一言)、抖音(云雀大 模型)、智谱 AI(GLM 大模型)、中科院 (紫东太初大模型)、百川智能(百川大模 型)、商汤(日日新大模型)、MiniMax0 码力 | 32 页 | 13.09 MB | 1 年前3
共 13 条
- 1
- 2













