2024 中国开源开发者报告型 LLM 开发技术栈作为切入点,将深入探讨以下中国 AI 大模型领域的代表性开源项目社区。 这些开源项目社区覆盖了深度学习框架、向量数据库、AI辅 助编程、LLM 应用开发框架、模型微调、推理优化、LLM Agent,以及检索增强生成(RAG)等多个关键技术栈。 为了更全面客观地展示中国大模型 LLM 开发技术栈的开源 社区生态,我们使用了 对开源社区的生态评 估体系,希望通过这些数据洞察中国开源开发者在 GenAI 扩展的联合优化,在搭载骁龙 8 Gen 4 处理器的手机上实现了每秒 65 个 tokens 的推理速度,接近人类语音的平均输出速率。尽管存在电池续航和内存占用过大等挑战, 端上模型代表了 AI 技术隐私保护和成本优化的未来方向。中国在这一领域的探索,为行业提供 了宝贵经验。 推理扩展法则的潜力释放 通过推理扩展法则,模型性能可通过延长“思考时间”而进一步优化。这一技术模拟了人类 源社区提供了 23 / 111 丰富的资源,在这一过程中,小模型不仅在推理能力上有了显著提升,也推动了行业整体技术水 平的进步。 结合当前人工智能产业界的“人工智能+”计划,小模型在特定任务优化上的优势愈发突出, 预计将在金融、医疗和工业自动化等热门领域发挥引领作用,以更高效、更精准的方式满足多样 化需求,帮助人工智能在实际应用场景中落地。 开源多元化与应用细分 中国开源模型的发展0 码力 | 111 页 | 11.44 MB | 8 月前3
2023年中国基础软件开源产业研究白皮书iresearch.com.cn 开源产业链关系 以开源社区及代码托管平台为中心,各方合力促进产业源与端共生共长 发起者可以将源代码放在代码托管平台上,结合开发者的代码贡献进一步提升源代码质量。在这个代码优化的过程中,也有其他力 量辅助:1)开源基金会可选择性接受项目的捐赠并运营项目;2)开源技术论坛通常会提供更广阔的开发者交流平台,提升开发者 能力水平;3)开源社区评估机构可对开源社区进行评分,辅助开 主研究及绘制。 法务服务 社区 治理 社区 运营 代码 审核 开源 开发 生态 合作 法务 合规 开源企业发起者内的多组织协作 开源开发 战略合作 社区运营 代码审核 软件优化 选择适合开源项目的开源协 议,依据企业对项目的开源 方案审定协议中个别条款 向上对接高校及研究机构, 加紧基础技术共建;向下对 应发行版ISV厂商,将软件向 更多行业及场景渗透 规划开源软件迭代方向,包 4.4% 其他 0.9% 开源社区中,使用者比例最高,使用开源软件、发掘开源代码是大多 数开发者加入开源项目的起点,随着与社区的绑定不断加深,使用者 逐渐向贡献者转化,围绕项目提出自身的建议或优化方向。 14 ©2023.11 iResearch Inc.0 码力 | 43 页 | 4.69 MB | 1 年前3
DeepSeek图解10页PDF在本地搭建大模型(如 DeepSeek)具有多个重要的优势,比如: 1. 保护隐私与数据安全。数据不外传:本地运行模型可以完全避免数据上 传至云端,确保敏感信息不被第三方访问。 2. 可定制化与优化。支持微调(Fine-tuning):可以根据特定业务需求对模 型进行微调,以适应特定任务,如行业术语、企业内部知识库等。 3. 离线运行,适用于无网络环境。可在离线环境下运行:适用于无互联网 馈神经网络(FFN):非线性变换模块,提升模型的表达能力。4. 位置编码 (Positional Encoding):在没有循环结构的情况下,帮助模型理解单词的顺 序信息。 Transformer 结构的优势 1. 高效的并行计算:摒弃循环结构,使计算速度大幅提升。 2. 更好的上下文理解:注意力机制可捕捉长文本中的远程依赖关系。 3. 良好的可扩展性:可适配更大规模模型训练,增强 AI 泛化能力。 教程作者:郭震,工作 据集,让模型在特定任务上优化表现。调整参数,使其更符合人类需求,如 问答、对话生成等任务。 2.3.3 强化学习(Reinforcement Learning, RL) 采用强化学习(RL)方法进行优化,主要通过人类反馈强化学习(RLHF, Reinforcement Learning from Human Feedback): 强化学习(RLHF)优化过程 • 步骤 1:人类标注者提供高质量回答。0 码力 | 11 页 | 2.64 MB | 8 月前3
开源中国 2023 大模型(LLM)技术报告03 02 04 向量数据库/数据库向量支持 为大模型提供高效的存储和检索能力 大模型框架及微调 (Fine Tuning) 大模型框架提供基本能力和普适性,而微调 则是实现特定应用和优化性能的关键环节 大模型训练平台&工具 提供了在不同硬件和环境中训练大语言模型 所需的基础设施和支持 编程语言 以 Python 为代表 5 / 32 LLM 基础设施:向量数据库/数据库向量支持 则是实现特定应用和优化性能的关键环节。两者相结合, 使得 LLM 在广泛的应用场景中都能发挥出色的性能。 8 / 32 LLM 基础设施:大模型框架及微调 (Fine Tuning) 大模型框架有哪些特点: :大模型开发框架通过提供高 层次的 API 简化了复杂模型的构建过程。这 些 API 抽象掉了许多底层细节,使开发者能 够专注于模型的设计和训练策略。 :这些框架经过优化,以充分利用 GPU、TPU 等高性能计算硬件,以加速模型 的训练和推理过程。 :为了处理大型数据集和大规模参 数网络,这些框架通常设计得易于水平扩展, 支持在多个处理器或多个服务器上并行处理。 :它们提供工具来有效地加 载、处理和迭代大型数据集,这对于训练大 型模型尤为重要。 国产深度学习框架 OneFlow 架构 (图源:https://www.oneflow.org/a/chanpin/oneflow/)0 码力 | 32 页 | 13.09 MB | 1 年前3
2023 中国开源开发者报告2023 年 9 月,蚂蚁集团正式开 源代码大模型 CodeFuse——基 于蚂蚁基础大模型研发。 这是蚂蚁自研的代码生成专属 大模型,帮助开发者自动生成代 码、自动增加注释、自动生成测 试用例、修复和优化代码等。 2023 年 8 月,阿联酋研究团队宣布开源阿拉伯语大模型 Jais。Jais 是一个 经过 130 亿个参数预训练的阿拉伯语和英语双语大型语言模型,在包含 720 亿个阿拉伯语词块和 2790 自动跳过开屏广告应用「李跳跳」无限期停更 微软于 2023 年 8 月发布了 Visual Studio for Mac 的退役公告。未来, 开发团队将专注于增强 Visual Studio 和 VS Code,优化它们以进行跨平 台开发。 Visual Studio for Mac 退役后,微软方面仍会为 Mac 开发者提供替代方 案,例如 C# Dev Kit for VS Code 和其他扩展。 开源富文本编辑器 600 条 x86 指令和 180 条 Linux 系统调用。 距离 Svelte 3 发布过去了四年多的时间, Svelte 4 稳定版本于 2023 年 6 月正式发 布。 新版本改进了性能、优化了开发者体验,并大 改了网站。Svelte 4 主要是一个维护版本,它 为下一代的 Svelte 发布奠定了基础。 Qwik 是一个全栈式 Web 框架,Qwik 基于 React、Angular0 码力 | 87 页 | 31.99 MB | 1 年前3
中国开源软件产业研究报告,艾瑞咨询研究院根据公开资料研究及绘制。 企业开源的战略意义(二) 开源在企业中的使用率提升,带来多维度战略价值 除前文所述的商业价值和成本优化之外,开源软件产业对企业的战略意义还体现在以下三方面:1)技术价值,对具备技 术优势的头部企业而言,开源可加强同业间的交流,实现产品优化,走向国际;对技术能力较弱的企业来说,开源可实现 社会协作,缩小与业界头部企业的技术差距,扩大市场份额。2)品牌价值,企业建立开源社区可实现对技术、人才的网 活跃的开源企业一般为“BATH”四大综合科技企 业以及其他互联网、云计算企业等 从可行性角度上讲,上述企业具备较强的技术、人才和资金 能力,能够自主进行或支持大规模开源运营 从优化产品方面,如前文所述,开源能够帮助企业利用开源 社区资源进行产品优化和升级,提升竞争力 从国内市场状况上看,科技企业、云服务企业正处于激烈的 市场竞争中,开源为企业带来市场影响力、人才吸引力方面 的提升,为企业带来各种隐性收益 私有云商业化路径,坚持IaaS开源产品化发展 云轴科技(ZStack)由阿里云、中国电信战略投资并战略合作,是国内领先的开源云服务提供商,拥有完全自主知识产权, 是和VMware、Openstack等并行的独立云计算路线,提供自研的ZStack Cloud云平台以及软硬一体的ZStack Cube超融合 等多款基础云产品,以及自主的开源IaaS社区——ZStack.io社区。支持“一云、多芯、多OS”的异构信创,切实解决了云0 码力 | 68 页 | 3.63 MB | 1 年前3
KiCad PCB 编辑器 6.0
仅保留回路中最近布线的部分。 优化焊盘连接 启用此设置时,交互式布线器尝试在退出焊盘和过孔时避免锐角 和其他不需要的布 线。 平滑拖动线段 拖动布线时,会尝试将布线段组合在一起, 以最大限度地减少方向更改。 允许违反 DRC 规则 在高亮碰撞模式下,允许放置违反 DRC 规则的布线和过孔。 在其他模式下不起作 用。 优化正在拖动的布线 启用后,拖动布线段将导致 KiCad 优化屏幕上可见的其余布线。 优化过程去除了不 优化过程去除了不 必要的拐角,避免了锐角,通常会尝试找到布线的最短路径。 禁用时,不会对正在 拖动的紧邻部分之外的布线执行任何优化。 在拖动布线时尝试优化布线。 使用鼠标路径设置布线形 态 尝试根据鼠标路径从布线起点位置拾取布线形态。 如果鼠标从开始位置开始主要沿 对角线移动,则形态将设置为对角线起点; 如果鼠标主要水平或垂直移动,则形态 将设置为垂直起点。 当鼠标离开布线起始位置很远时,形态估计就会被锁定, 有各种偏好设置,可以通过偏好设置对话框进行配置。与 KiCad 的所有部分一样,Pcbnew 的偏好设置存储 在用户配置目录中,并且在 KiCad 次要版本之间相互独立,从而允许多个版本与独立的偏好设置并行运行。 偏好设置对话框的第一部分 (通用、鼠标和触摸板以及快捷键) 在所有 KiCad 程序之间共享。KiCad 手册中“通用偏好 设置”部分详细介绍了这些部分。请注意,尽管快捷键部分在所有程序之间共享,但有许多特定于0 码力 | 101 页 | 4.78 MB | 1 年前3
Krita 5.2 官方文档中文版 2023-12-08A你可以及时跟踪 Krita 的最新开发进度。如果你定期从开发代 码仓库获取最新代码编译 Krita,你将可以试用许多正在开发 的新功能。 你可以在构建时为你的处理器进行优化。预构建的软件包往往 只能针对最低标准的 CPU 进行优化。 你可以立即获得全部已完成的程序缺陷修复。 你可以向我们的程序员提供反馈新功能中的问题,帮助我们进 行软件测试。这对 Krita 的开发来说至关重要,以至于我们会 在关于对话框里列出经常协助测试的人员名单。 文件夹因为某种原因被清除了,你将失去自动保存的文件。在默认 情况下 Windows 不会自动清除 %TEMP% 文件夹中的内容,但你可以 在它的设置中启用这项功能。Windows 自带的磁盘清理工具和大 多数第三方系统优化清理工具都会清除 %TEMP% 文件夹。因此如果 Krita 崩溃前你没有保存文件,而清理工具又被设置为自动清除 %TEMP% 文件夹,那么你将无法恢复未保存的工作成果。 如果 Krita 没有崩溃,而你在正常关闭 在现实条件下,不管色彩管理手段如何先进,执行过程如何完善,也绝无可能在屏幕显示和 打印输出之间保持 100% 一致的颜色。 导出图像时的相关技巧 在处理完一张图像并准备导出时,你可以修改它的色彩空间以优化输出效果: 如果你要为网络用途准备该图像: 如果你的工作空间色彩深度在 16 位或以上,你应该在导出时把图像转换为 8 位深度。这 样会大大缩小图像的体积。 Krita 目前尚不具备内建的抖动算法,这意味着从0 码力 | 1685 页 | 91.87 MB | 1 年前3
Krita 5.2 官方文档中文版 2023-12-08A你可以及时跟踪 Krita 的最新开发进度。如果你定期从开发代码仓库获取 最新代码编译 Krita,你将可以试用许多正在开发的新功能。 你可以在构建时为你的处理器进行优化。预构建的软件包往往只能针对最 低标准的 CPU 进行优化。 你可以立即获得全部已完成的程序缺陷修复。 你可以向我们的程序员提供反馈新功能中的问题,帮助我们进行软件测 试。这对 Krita 的开发来说至关重要,以至于我们会在关于对话框里列出 某种原因被清除了,你将失去自动保存的文件。在默认情况下 Windows 不会 自动清除 %TEMP% 文件夹中的内容,但你可以在它的设置中启用这项功能。 Windows 自带的磁盘清理工具和大多数第三方系统优化清理工具都会清除 %TEMP% 文件夹。因此如果 Krita 崩溃前你没有保存文件,而清理工具又被设置 为自动清除 %TEMP% 文件夹,那么你将无法恢复未保存的工作成果。 如果 Krita 没有崩溃,而你在正常关闭 在现实条件下,不管色彩管理手段如何先进,执行过程如何完善,也绝无可能在屏幕显示和 打印输出之间保持 100% 一致的颜色。 导出图像时的相关技巧 在处理完一张图像并准备导出时,你可以修改它的色彩空间以优化输出效果: 如果你要为网络用途准备该图像: 如果你的工作空间色彩深度在 16 位或以上,你应该在导出时把图像转换为 8 位深度。这样 会大大缩小图像的体积。 Krita 目前尚不具备内建的抖动算法,这意味着从0 码力 | 1562 页 | 79.19 MB | 1 年前3
Krita 5.1 官方文档中文版 2023-05-26A你可以及时跟踪 Krita 的最新开发进度。如果你定期从开发代码仓库获取 最新代码编译 Krita,你将可以试用许多正在开发的新功能。 你可以在构建时为你的处理器进行优化。预构建的软件包往往只能针对最 低标准的 CPU 进行优化。 你可以立即获得全部已完成的程序缺陷修复。 你可以向我们的程序员提供反馈新功能中的问题,帮助我们进行软件测 试。这对 Krita 的开发来说至关重要,以至于我们会在关于对话框里列出 某种原因被清除了,你将失去自动保存的文件。在默认情况下 Windows 不会 自动清除 %TEMP% 文件夹中的内容,但你可以在它的设置中启用这项功能。 Windows 自带的磁盘清理工具和大多数第三方系统优化清理工具都会清除 %TEMP% 文件夹。因此如果 Krita 崩溃前你没有保存文件,而清理工具又被设置 为自动清除 %TEMP% 文件夹,那么你将无法恢复未保存的工作成果。 如果 Krita 没有崩溃,而你在正常关闭 在现实条件下,不管色彩管理手段如何先进,执行过程如何完善,也绝无可能在屏幕显示和 打印输出之间保持 100% 一致的颜色。 导出图像时的相关技巧 在处理完一张图像并准备导出时,你可以修改它的色彩空间以优化输出效果: 如果你要为网络用途准备该图像: 如果你的工作空间色彩深度在 16 位或以上,你应该在导出时把图像转换为 8 位深度。这样 会大大缩小图像的体积。 Krita 目前尚不具备内建的抖动算法,这意味着从0 码力 | 1547 页 | 78.22 MB | 1 年前3
共 153 条
- 1
- 2
- 3
- 4
- 5
- 6
- 16













