开源平台 - IT文库_程序员IT互联网编程电子书和文档免费下载，助您码力十足！

首页文库资料文章资讯上传文档发布文章登录账户

开源中国 2023 大模型(LLM)技术报告

基础设施、应用现状，以及相关的工具和平台。 2 / 32 LLM Tech Map  向量数据库  数据库向量支持  大模型框架、微调 (Fine Tuning)  大模型训练平台与工具基础设施 LLM Agent  备案上线的中国大模型  知名大模型  知名大模型应用大模型算力工具和平台  LLMOps  大模型聚合平台  开发工具 AI 编程  向量数据库/数据库向量支持为大模型提供高效的存储和检索能力大模型框架及微调 (Fine Tuning) 大模型框架提供基本能力和普适性，而微调则是实现特定应用和优化性能的关键环节大模型训练平台&工具提供了在不同硬件和环境中训练大语言模型所需的基础设施和支持编程语言以 Python 为代表 5 / 32 LLM 基础设施：向量数据库/数据库向量支持向量数据库是专门用于存储和检索向量数据的数据库，它可以为 (图源：https://medium.com/mlearning-ai/what-is-a-fine-tuned-llm-67bf0b5df081) 10 / 32 LLM 基础设施：大模型训练平台与工具大模型训练平台和工具提供了强大且灵活的基础设施，使得开发和训练复杂的语言模型变得可行且高效。这些工具提供了先进的算法、预训练模型和优化技术，极大地简化了模型开发过程，加速了实验周期，并使得模型

0 码力 | 32 页 | 13.09 MB | 1 年前
3
清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单

与生成：基于 DeepSeek R1的中文数据处理能力，快速分析法律文本，提取关键信息，自动生成合同草案、法律意见书等，提高律师工作效率。 • 智能医疗数据分析与诊断：构建智能医疗平台，分析病历、检查报告和基因数据，帮助医生提供更准确的诊断与治疗方案。 • 金融风险预测与管理：开发金融风险分析工具，收集并分析市场数据，预测风险并为金融机构提供管理建议。 • 智能文学创作辅助：为作家提供创作灵感受众自动生成创意广告文案和宣传语，提高广告创作效率。 • 中小企业AI定制化服务：为中小企业提供定制化的AI解决方案，如智能客服、营销和办公工具，提升企业竞争力。 • 开源AI教育平台：借助DeepSeek R1 的低成本特性，创建开源AI教育平台，提供免费课程和实验资源，促进AI教育普及。 • 智能编程教育助手：为编程学生提供实时编程指导，自动生成代码示例，帮助解决编程难题。 • 自动化代码审查工具：自动审查代码，数据报告自动化生成：基于o3mini自动生成格式化的数据报告，包括图表、表格和文字说明，帮助管理者快速理解分析结果。 • 数据接口标准化：根据标准格式输出数据，利用o3mini方便不同系统和平台之间的数据共享，提升跨机构协作效率。 • 情感分析与数据解读：利用o3mini结合情感分析，对数据进行深入解读，帮助市场调研等领域理解消费者情感，优化产品和策略。 • 故事化数据呈现：借助o3mini将数据以

0 码力 | 85 页 | 8.31 MB | 8 月前
3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502

《DeepSeek给我们带来的创业机会》 360集团创始人周鸿祎 3 政企、创业者必读政企、创业者必读一张图读懂一堂DeepSeek课政企、创业者必读 AI给了一个比互联网更大的机会  互联网是连接平台，人工智能是生产力  互联网是赋能性技术，生产力属性较弱  人工智能既能单兵作战，也能外部赋能互联网创造了能写140个字的推特和分享照片的Instagram AI能帮助人解决登陆火星、能源自由的问题传统软件是辅助人的工具，Agent是能够自主工作的数字员工，是新的生产力政企、创业者必读 22 DeepSeek出现之前的十大预判之九开源效果追赶上闭源  技术开放，吸引广大开发人员和用户使用  很多公司参与开源，帮助改进产品，众人拾柴火焰高，反哺开源产品，形成正循环政企、创业者必读 DeepSeek出现之前的十大预判之十中美差距快速缩小  美国预训练堆算力的路线不可持续，有待发现新范式“换道超车” 认知决定行动，这场全民AI科普对推动中国AI发展功不可没政企、创业者必读开源改变行业格局，建立强大生态  开源战胜闭源，促使全球公司、开发者等转到开源  建立强大生态，成为全球人工智能根技术，无推广情况下各国政府、企业、云厂商纷纷接入，获得全球最大影响力  改变中美竞争格局：美国是闭源封闭垄断思路，中国领导开源文化，加速中国领先地位  中国人民使用的AI工具先进性已超过美国，普及率超过美国，

0 码力 | 76 页 | 5.02 MB | 6 月前
3
普通人学AI指南

，能够处理复杂的任务，如自然语言理解、图像识别、语音识别等。闭源大模型包括 OpenAI 的 GPT 系列和 Google 的 BERT。这些模型因其高效的学习能力和强大的通用性而受到关注。开源大模型以 Meta 的 Llama 系列，2024 年 4 月，Llama3 发布，包括 8B 和 70B 模型。图 2，时间线主要根据技术论文的发布日期（例如提交至 arXiv 的日期）来确定大型语言模型（大小超过工具，注意不是穷举，那些不经常用的工具，不浪费文字和耽误时间。梳理总结六大类 AI 工具，分别包括：问答，图像，视频，AI 编程，AI 提示词和 AI 大模型，一共梳理挑选共计 38 个 AI 工具，其中很多都是开源！ 2.1 问答 2.1.1 ChatGPT ChatGPT 是一个由 OpenAI 开发的大型语言模型，它基于 GPT（Generative Pre-trained Transformer） IOPaint 开源：一个用于图像处理的开源工具，可以对图像中的特定物体进行擦除。 2.2.2 无损放大 Upscayl 开源：一个开源软件，专门用于图像的无损放大，通过 AI 增强图像质量。 2.2.3 背景消除 remove.bg 开源：一个流行的开源工具，用于自动从图片中去除背景。 2.2.4 SD (Stable Diffusion) 开源：由 StabilityAI 开发的开源 AI 模型，用于生成高质量的图像。

0 码力 | 42 页 | 8.39 MB | 8 月前
3
TVM工具组

CAFFE 前端 2019·11·16绝赞招聘中 TVM 在平头哥 • 工具链产品平头哥芯片平台发布的配套软件中， TVM 是工具链产品的重要组成部分：负责将预训练好的 caffe 或者 tensorflow 的模型，转换到 LLVM IR，最后生成可以在无剑 SoC 平台上执行的二进制。绝赞招聘中为何添加 caffe 前端？客户需求评估阶段：客户用于评估芯片的网络，caffe 评估阶段：客户用于评估芯片的网络，caffe 模型占很大比重。竞品已支持 caffe 前端当前各大芯片厂商的部署工具大多数都支持，支持 caffe 前端有利于提高竞争力。开源社区存量的开源 caffe 网络模型众多，TVM 直接支持 caffe 让大家更方便尝试 caffe 资源。绝赞招聘中当前进度无 caffe 依赖 from_caffe 直接导入 caffe 模型文件，不需要预先安装 caffe roipooling / permute / priorbox绝赞招聘中未来命令行工具将 caffe 模型转换的功能，通过一组命令行工具提供，命令行工具支持 windows / linux 平台。支持更多 caffe op / net 随着客户需求和社区发展，提供更多的 caffe 分支变种的 op / net 支持。绝赞招聘中 THANKS

0 码力 | 6 页 | 326.80 KB | 6 月前
3
DeepSeek从入门到精通(20250204)

Deepseek能够做什么？ • 如何使用Deepseek？ DeepSeek是什么？ AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本创造融合点：设计概念间的创新性连接点 5. 构建融合提示：创建引导AI进行概念嫁接的提示语应用示例任务：尝试将“社交媒体”和“传统图书馆”这两个概念进行嫁接，以设计一个创新的知识共享平台。（1）输入概念： • 社交媒体：即时性、互动性、个性化、病毒传播 • 传统图书馆：知识储备、系统分类、安静学习、专业指导（2）共同特征： • 信息存储和检索 • 用户群体链接 • 性 5. 转移策略设计：制定知识从源域到目标域的转移策略 6. 构建转移提示：创建引导AI进行知识转移的提示语应用示例假设如果想要改善在线教育平台的学生参与度，可以尝试从游戏设计领域转移知识。（1）问题定义：提高在线教育平台的学生参与度和学习动力（2）源域：游戏设计关键知识：游戏化机制、玩家心理学、关卡设计、即时反馈系统（3）知识提取与抽象： • 进度可视化 •

0 码力 | 104 页 | 5.37 MB | 8 月前
3
清华大学 DeepSeek 从入门到精通

Deepseek能够做什么？ • 如何使用Deepseek？ DeepSeek是什么？ AI + 国产 + 免费 + 开源 + 强大 • DeepSeek是一家专注通用人工智能（AGI）的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。 Deepseek可以做什么？直接面向用户或者支持开发者，提供智能对话、文本创造融合点：设计概念间的创新性连接点 5. 构建融合提示：创建引导AI进行概念嫁接的提示语应用示例任务：尝试将“社交媒体”和“传统图书馆”这两个概念进行嫁接，以设计一个创新的知识共享平台。（1）输入概念： • 社交媒体：即时性、互动性、个性化、病毒传播 • 传统图书馆：知识储备、系统分类、安静学习、专业指导（2）共同特征： • 信息存储和检索 • 用户群体链接 • 性 5. 转移策略设计：制定知识从源域到目标域的转移策略 6. 构建转移提示：创建引导AI进行知识转移的提示语应用示例假设如果想要改善在线教育平台的学生参与度，可以尝试从游戏设计领域转移知识。（1）问题定义：提高在线教育平台的学生参与度和学习动力（2）源域：游戏设计关键知识：游戏化机制、玩家心理学、关卡设计、即时反馈系统（3）知识提取与抽象： • 进度可视化 •

0 码力 | 103 页 | 5.40 MB | 9 月前
3
国家人工智能产业综合标准化体系建设指南（2024版）

组织的管理要求，人工智能管理体系、分类方法、评级流程等标准。 5. 可持续标准。规范人工智能影响环境的技术框架、方法和指标，平衡产业发展与环境保护，包括促进生态可持续的人工智能软件开源基础框架，人工智能系统能效评价，人工智能与资 7 源利用、碳排放、废弃部件处置等标准。（二）基础支撑标准基础支撑标准主要包括基础数据服务、智能芯片、智能传感器、计算设备、算力中心、系统软件、开发框架、软硬件协同等算能力评估、技术要求、稳定性要求和业务服务接口等标准。 6. 系统软件标准。规范人工智能系统层的软硬件技术要求，包括软硬件编译器架构和优化方法、人工智能算子库、芯片软件运行时库及调试工具、人工智能软硬件平台计算性能等标准。 7. 开发框架标准。规范人工智能开发框架相关的技术要求，包括开发框架的功能要求，与应用系统之间的接口协议、神经网络模型表达和压缩等标准。 8. 软硬件协同标准。规范智能芯片、计算设备等硬件与系人基础能力评估、多媒体合成渲染、基础数据采集方法、标识和识别方法等标准。 5. 智能服务标准。规范基于大模型、自然语言处理、智能语音、计算机视觉等人工智能技术提供的服务，包括模型即服务平台技术要求和评测方法等标准，以及面向特定场景的人工智能应用服务，如智能软件开发、智能设计、智能防伪等标准。（五）赋能新型工业化标准赋能新型工业化标准主要包括研发设计、中试验证、生产制造

0 码力 | 13 页 | 701.84 KB | 1 年前
3
清华大学普通人如何抓住DeepSeek红利

善用DeepSeek的两大关键：提出问题鉴别答案 DeepSeek是什么? • DeepSeek是一家专注通用人工智能(AGI)的中国科技公司，主攻大模型研发与应用。 • DeepSeek-R1是其开源的推理模型，擅长处理复杂任务且可免费商用。性能对齐OpenAI-o1正式版。 • DeepSeek-R1在后训练阶段大规模使用了强化学习技术，在仅有极少标注数据的情况下，极大提升了模型推理能力 (Pass@1) (Pass@1) 国产十免费十开源十强大 Accuracy/Percent le (%) AI https://chat.deepseek.com Z u N e P 6 7 K w S v 优先级排序（幼儿园事务＞会议准备＞生活采购）生成最优动线：地图标注幼儿园/干洗店/超市与公司的位置关系即时服务对接： ✓ 调用社区跑腿API下单手工材料配送 ✓ 接入干洗店智能柜系统预约取件码 ✓ 生鲜平台比价后自动补货牛奶 ③ 会议准备：自动提取上周销售数据生成可视化图表框架调取历史报告模板进行语义重组 ④ 风险预警：灶台计时器同步手机震动提醒通勤路况实时监控（若堵车超15分钟触发备用方案）

0 码力 | 65 页 | 4.47 MB | 8 月前
3
DeepSeek图解10页PDF

本地大模型依然可以正常工作，不受外部因素影响。本教程搭建 DeepSeek 好处本地搭建 DeepSeek 三个比较实际的好处： • 本教程接入的是 DeepSeek 推理模型 R1，开源免费，性能强劲 • 本教程搭建方法零成本，不需花一分钱。 • 为了照顾到大部分读者，推荐的搭建方法已将电脑配置要求降到最低，普通电脑也能飞速运行。 1.2 DeepSeek 本地部署三个步骤 llama，下载这个软件，然后装上，可以拿着手机扫码下图1直达我的公众号：教程作者：郭震，工作 8 年目前美国 AI 博士在读，公众号：郭震 AI，欢迎关注获取更多原创教程。资料用心打磨且开源，是为了帮助更多人了解获取 AI 知识，严禁拿此资料引流、出书、等形式的商业活动图 1: 我的公众号：郭震 AI 安装后，打开命令窗口，输入 ollama，然后就能看到它的相关指令，一共 10 到我们自己的电脑，如下图3所示：图 3: DeepSeek-r1 下载到本地电脑命令教程作者：郭震，工作 8 年目前美国 AI 博士在读，公众号：郭震 AI，欢迎关注获取更多原创教程。资料用心打磨且开源，是为了帮助更多人了解获取 AI 知识，严禁拿此资料引流、出书、等形式的商业活动至此在我们本地电脑，DeepSeek 大模型就下载到我们本地电脑，接下来第三步就可以直接使用和它对话了。在 cmd(Windows

0 码力 | 11 页 | 2.64 MB | 8 月前
3

共 14 条前往

页

分类

语言

格式