2024 中国开源开发者报告开发技术栈作为切入点,将深入探讨以下中国 AI 大模型领域的代表性开源项目社区。 这些开源项目社区覆盖了深度学习框架、向量数据库、AI辅 助编程、LLM 应用开发框架、模型微调、推理优化、LLM Agent,以及检索增强生成(RAG)等多个关键技术栈。 为了更全面客观地展示中国大模型 LLM 开发技术栈的开源 社区生态,我们使用了 对开源社区的生态评 估体系,希望通过这些数据洞察中国开源开发者在 AI 技术 领域的活跃度、生产力和创新能力。 组织给予减轻或免承担法律责任;《生成式人工智能服务管理暂行办法》 则明确了人工智能技 术的使用和合规要求,促进了开源模型在合规框架下良性发展。 变革 端上模型的兴起与隐私保护 随着小型模型的性能逐步增强,更多高级 AI 正转向在个人设备上运行。这一趋势不仅显著 降低了云端推理成本,还提升了用户隐私控制。 中国 AI 社区在这一领域也做了重要贡献,推出了如 Qwen2-1.5B、MiniCPM 系列和 典型案例,强化了推理能力的同时,也大大缓解了幻觉问题。 2. 大模型做不到的,“现存工具”强势补位。 无法持续更新的知识库,可以通过 RAG(Retrieval Augmented Generation,检索增强 生成)来解决。 RAG 的出现,让各界越来越深刻地认识到,大模型没必要存储那么多知识,只需要如何使 用搜索引擎这个外部工具即可。大模型可以在搜索结果上做进一步的信息筛选和优化,而搜索引 擎弥补了大模型的知识缺陷,实现了0 码力 | 111 页 | 11.44 MB | 8 月前3
2023 中国开源开发者报告 许多 AI 采用者仍处于早期阶段:26% 的人使用 AI 不到一年,而 18% 的人已经在生产中进行了应用。 16% 从事 AI 工作的受访者表示正在使用开源模型。 意外结果、安全性、公平性、偏见和隐私是采用者测试 的最大风险。 工业和信息化部赛迪研究院数据显示,目前,我国已有超 过 19 个大语言模型研发厂商。其中,15 家厂商的模型 产品已经通过备案,预计今年我国大语言模型市场规模将 OpenAI 正式发布GPT-4 AIGC 回顾 2023 大语言模型 LLM 元年的重磅事件。 开源开发者事件回顾 Anthropic 推出Claude 2023 年 3 月,百度全新一代知识增强大语言模型、文心大模型家族的新成 员——文心一言 (ERNIE Bot) 正式发布。 百度文心一言正式亮相 2023 年 7 月,Meta 和 微软深度合作,正式推 出下一代开源大语言 模型 Llama “大圣净化”、“一指禅” 和 “叮小跳”。 自动跳过开屏广告应用「李跳跳」无限期停更 微软于 2023 年 8 月发布了 Visual Studio for Mac 的退役公告。未来, 开发团队将专注于增强 Visual Studio 和 VS Code,优化它们以进行跨平 台开发。 Visual Studio for Mac 退役后,微软方面仍会为 Mac 开发者提供替代方 案,例如 C# Dev0 码力 | 87 页 | 31.99 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021华为鲲鹏计算兼容性测试认证 大数据技术机构资质 信通院大数据技术标准推进委员会成员 大数据系统软件浙江省工程实验室 浙江省网易大数据重点企业研究院 浙江省云计算和大数据省级企业研究院 人工智能技术机构资质 浙江省增强现实与智能交互工程技术研究中心 省级组织资质 浙江省重点企业研究院 浙江省企业技术中心 云计算技术机构资质 工信部云计算服务能力标准首批试点单位 信通院云计算标准和开源推进委员会成员 信通院首批开源供应商 支持节点、可用区级故障,灵活调度策 略,有效保障数据安全性与可用性。 故障恢复 支持 Node 级和实例级故障自动恢复, 无需人工值守。 异构网络访问 支 持 异 构 协 议 转 换 为 HTTP 协 议 RESTFUL 接口,具备请求转换能力,有 效集成企业存量应用。 基于开源自主可控 基于社区开源版本,进行源码级内核优 化,性能增强,自主可控。 完备的监控 丰富的企业经验积累,支持完备的监控 画像分析 群组管理 API管理 支持数据产品研发 无代码平台,与 BI 、数据填报、复杂报 表、智能决策深度融合。 开放与集成能力 以标准类接口开放所有资源,支持集 成,兼容性强。 内置增强分析 内置高级分析模型,如预测、聚类,离 散;支持智能问答、智能分析等多种分 析场景。 产品特色 产品能力 业务流程覆盖数据收集、加工、分析、应用等全链路环节,内置可视化报告、自助式 ETL0 码力 | 43 页 | 884.64 KB | 1 年前3
2021 中国开源年度报告…………………………………………………………………………………………… 116 一、各国开源政策将对开源世界的未来产生重大影响 ………………………………………………… 116 二、开源法务合规趋势 :意识增强,道阻且长 ………………………………………………………… 116 三、开源治理成为显学 …………………………………………………………………………………… 116 四、国际基金会的左右博弈 :RMS …………………………………………………………………………………………… 118 一、各国开源政策将对开源世界的未来产生重大影响 ………………………………………………… 118 二、开源法务合规趋势 :意识增强,道阻且长 ………………………………………………………… 119 三、开源治理成为显学 …………………………………………………………………………………… 120 四、 国际基金会的左右博弈 :RMS 如果可以跨越这一阶段,会迎来快速增长时期。 图表 16 :开源社区成熟度曲线 资料来源:PingCAP,中国信通院 3.2.3 加速扩张阶段:加速软件采用及付费转换—销售管理 加速扩张阶段的主要任务是增强开发者和用户对软件的喜爱、采用和价值,发掘潜在客户并将免费用户 向付费用户转换。定位潜在用户应该优先考虑针对特定细分市场的活动,基于产品使用信息进行用户分析, 了解哪些角色和部门正在使用该产品以0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告expansion stage: accelerating software adoption and paid conversion - sales management 加速扩张阶段的主要任务是增强开发者和用户对软件的喜爱、采用和价值,发掘潜在客户并将 免费用户向付费用户转换。定位潜在用户应该优先考虑针对特定细分市场的活动,基于产品使 用信息进行用户分析,了解哪些角色和部门正在使用该产品以及他们的兴趣所在,同时预测免 Source: Synopsys, Cloud Qi Capital 全球知名开源日志组件 Apache Log4j 于 2021 年 12 月被曝存在严重高危险级别远程代 码执行漏洞,引发人们对开源安全性问题的探讨。12 月 9 日,Apache Log4j2 被曝出第一个 高危漏洞 Log4Shell,并在此之后持续爆雷,至 12 月 22 日已经发现了第三个高危漏洞 CVE- 2021-45105。而由于 市 场契合度引入了用户,价值市场契合度就是找到客户关心并愿意支付的费用,进而使企业可以 自然延伸来推动收入。开源软件公司已经找到了一些围绕功能的价值市场契合,包括 RAS(可 靠性、可用性、安全性)、工具附加组件、性能、审计、服务等。 Secondly, open source projects should have a value-market fit. Value-market fit0 码力 | 199 页 | 9.63 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书向上对接高校及研究机构, 加紧基础技术共建;向下对 应发行版ISV厂商,将软件向 更多行业及场景渗透 规划开源软件迭代方向,包 括但不限于软件特性增加、 现有功能增强、Bug修补, 并提出相应的合格指标 一方面积极对社区开发者的回 复给予反馈,另一方面发掘优 秀的灵感,增强创新能力 对开发者提交的代码进行评 审,确保代码的可读性和可 维护性,及时做出缺陷反馈 提出企业开源项目,确定是 否开源、开源时间、企业内 是否具有开源应用场景以及 OpenHarmony社区是技术发展逐步演变的典范。自开源以来, OpenHarmony操作系统逐渐由仅支持小型带屏设备逐步演进为可 支持复杂标准带屏设备。这意味着开源促进了OpenHarmony操作系统的技术升级,增强了对复杂、多样场景的支持。 OpenHarmony的演变成果得益于其良好的技术架构,良好的系统原生特性加之后期持续的社区运营努力,便有了今天的成果。从 码云数据、社区活跃度、生态等指标来看, Ope 同一数据库 可以轻松扩 展至其他互 联网平台 架构复杂: 多为单体应 用,架构上 耦合度较 高,代码难 度高 架构轻:前 端展示、中 层业务处理 逻辑、后端 数据库 “求稳定”:更注重 系统对业务的安全性 和稳定性的支持,因 而采用自建服务器或 私有云的运营方式 “求灵活”:更注重 系统对业务快速扩张 和灵活变动的支持, 因而更多采取订阅云 服务的轻资产模式 开源<闭源:更复 杂、更封闭、更求稳0 码力 | 43 页 | 4.69 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)公布从此次竞赛中得到的启发,帮助其他想要做 类似尝试的人们。希望越来越多的人能知晓该如 何使用大语言模型,了解这些模型的局限性。” 注释:“红队”测试,是指安全专家尝试在组织系 统中发现漏洞或缺陷,以提高整体安全性和弹性的 过程。 全球开源态势洞察|第十期 07 04 开源热点 芬兰南萨沃计划建立 开源能力中心 Decidim参与式民主的开源平台 正在被日本广泛使用 作为欧盟所资助的Open MemoryLab项目的一 情况下,优先选择采用开源软件。 最近,OpenTalk在德国公共管理开源代码仓库OpenCoDE.de中依据EUPL(欧洲 公共许可证)共享了其代码。在此之前,他们对解决方案进行了全面重新设计,以 满足所需的机密性和安全性要求。OpenTalk首席执行官详细地演示了更多专门为 公共管理部门使用该解决方案而开发的各种功能,包括法律合规性、可扩展性等。 案例分享:全国首例GPL抗辩获得支持案i 05 开源法律速递 在过去几年中,捷克公共行政部门使用开源软件解决方案的情况有所增加。通过最近对数字管理结构 的重组,政府提高了在数字政策不同措施之间的协调可能性。捷克的各级行政部门中,有各种各样的 开源软件倡议和战略参与者,其中一些最新项目旨在增强协作以提高效率。这会导致公共行政部门遵 循统一的方法使用开源软件,同时进一步推动该国的数字化发展。 本章节将介绍制定开源软件政策的主要政府机构,以及与各级政府合作以提高开源软件意识的主要战 略伙伴。0 码力 | 22 页 | 1.99 MB | 1 年前3
JumpServer ⼴受欢迎的开源堡垒机全⾯超越传统堡垒机的应⽤体验; X-Pack 增强包 + 原⼚企业级⽀持服务 JumpServer 企业版的功能架构 JumpServer 企业版的四种型号 名称 描述 ⽀持的部署⽅式 单位 购买⽅式 JumpServer 企业版 (基础) JumpServer 堡垒机企业版(基础)⽀持的最⼤资产数量为 50 台,包含 X-Pack 增强包和原⼚企业级⽀持服务(基础级)。 ⽀持单机部署⽅式 堡垒机企业版(标准)⽀持的最⼤资产数量为 500 台,包含 X-Pack 增强包和原⼚企业级⽀持服务(增强级)。 ⽀持单机或冷备两种 部署⽅式 按套 按年 JumpServer 企业版 (专业) JumpServer 堡垒机企业版(专业)⽀持的最⼤资产数量为 5000 台,包含 X-Pack 增强包和原⼚企业级⽀持服务(增强级)。 ⽀持单机或冷备两种 部署⽅式 按套 按年 JumpServer JumpServer 堡垒机企业版(旗舰)不限资产数量,包含 X-Pack 增强包和原⼚企业级⽀持服务(增强级)。 ⽀持单机、热备或⾼ 可⽤三种部署⽅式 按套 按年 提示:⾮旗舰版⽀持热备份(Keeplived、负载均衡模式等)、应⽤组件⾼可⽤、Kubernetes 集群部署等模式,需要额外的实施及维护费⽤。 X-Pack 增强包 组织管理 资产同步 账号备份 单点登录系统对接 账号改密0 码力 | 40 页 | 6.66 MB | 1 年前3
Gitea,新一代的代码托管平台本地代码管理 •C/S 架构体系,支持网络化协作; •依赖中央存储库; •典型产品:CVS、 SVN、VSS、 TFS、 ClearCase。 集中式代码管理 •去中心化,稳定性和可用性增强; •更高效的代码协同机制; •典型产品:GitHub、GitLab、 Gitea。 分布式代码管理 基于 Git 的分布式 代码托管 具备 DevSecOps 延伸能力 Gitea Gitea 社区版 Gitea 企业版 • 产品快速迭代,优先体验产品特性; • 开放 & 开源生态,上下游社区项目丰富; • 广泛的社区用户 & 开发者支持。 X-Pack 增强包 + 企业级支持服务 X-Pack 增强包(已上线功能) 集成对接企业微信、钉钉、 飞书等 Gitea Actions SSH 依赖项扫描 数据安全备份 分布式高可用部署架构 AutoScale Runner 个小时内响应客户工单;接到故障申报后,工程师通过电话支持、远程接 入等方式协助客户及时排除软件故障。 安装架构 单机架构。 培训方式 提供离线视频、远程会议的培训。 软件升级服务 提供软件 X-Pack 增强功能包,小版本无缝升级服务。 在线自助服务 提供客户支持门户,支持客户在线访问网站并下载相关资料, 及时掌握最新的软件特性、维护经验、使用技 巧等相关知识。 企业版试用申请 通过 1Panel 应用商店一键安装0 码力 | 30 页 | 14.34 MB | 1 年前3
Moonshot AI 介绍机器之⼼:很多⼤模型创业公司的初期⽬标都是超过GPT4,“达到或者超越”的标准会是什么? 杨植麟:我认为最重要的标准其实是模型的压缩⽐。 如果基于第⼀性原则来思考,智能的⾸要任务就是优化压缩,那么提升压缩⽐就意味着智能的增强。 在⼀个⾜够⼤的数据集上,模型的压缩⽐有多⼤就能衡量出模型的优劣。例如,OpenAI的GPT-4可能 在某些领域已经达到了30多的压缩⽐,⽽⼀些开源的模型的压缩⽐可能只有10出头,所以空间还是⾮ 能⼒也会显著下降,⼤量任务都⽆法胜任,就像未发育完全的蝌蚪。 其次,你可以让模型「问哪⼉看哪⼉」,就像只能在特定花蕊上采蜜的蜜蜂,⽆法关注到整体信息。 这通常是通过对上下⽂的降采样或者RAG(检索增强⽣成)⽅法来实现的,让模型只关注和问题直接 相关的部分,减少计算量。但如此⼀来,模型就⽆法回答那些需要基于全⽂理解来回答的问题(例如 从50个简历中对候选⼈的画像进⾏归纳和总结),能⼒⼤打折扣。 的最⾼⽔ 平由两个因素决定:单步骤的容量(即模型在每⼀步中可以处理的信息量,对应参数量)和执⾏的步 骤数(即模型能够处理的上下⽂⻓度)。 ⽬前,⼤部分⼤模型研究都集中在增加模型参数量的⼤⼩,即增强「单步骤容量」。但MoonshotAI 认为,在保持⼀定参数量的同时放⼤另⼀个维度,即「步骤数」或上下⽂⻓度也同样重要。就像我们 在实测中所看到的,上下⽂窗⼝就像⼤模型应⽤的新「内存」,窗⼝越⼤,⽤⼾能⽤它做的事情就越0 码力 | 74 页 | 1.64 MB | 1 年前3
共 11 条
- 1
- 2













