2024 中国开源开发者报告
O(n²)的理论计算复杂度,这里的 n 指的是大模型输入 序列的 token 数量,但其前任语言模型担当 RNN 只有 O(n)的理论计算复杂度。 最近,以 Mamba、RWKV 为代表的类 RNN 结构死灰复燃,公开挑战 transformer 地位。 更有最新研究【13】从理论上表明,RNN 对比 Transformer 的表达力,只差一个 in-context-retrieval。 在这个 智能体(AI agent)的引进:智能体可以收集和学习与任务相关的知识,可以直接调用静 态代码分析工具、直接调用搜索引擎和 API 为编程任务服务,并通过构建代码仓库知识图来帮 助大模型全面理解软件仓库的结构和依赖关系,从而更好地定位问题根源并生成有效的代码补丁。 智能体还可以动态获取代码片段和问题相关的信息,并分析和总结收集到的信息,以便规划 出更好的解决方案。例如从 RAG+GPT 4(1106)的 request),自动识 别代码质量问题并提出改进建议。 有些企业结合智能体和相关工具的支持,让基于 LLM 的研发平台生成代码流程图和类图,辅 助自然语言解释,使得开发者更直观地理解代码结构和执行流程,增强智能编程的可视性和 交互性。 有些开发团队借助智能体和 RAG 技术检索历史上已知的代码缺陷模式和已知问题,从而比较 准确地识别潜在的缺陷和安全漏洞,甚至能够分析代码的功能意图,全面提升代码评审的能0 码力 | 111 页 | 11.44 MB | 8 月前3全球开源发展态势洞察(2023年第八期)
了其轻量级开源Kubernete发行版的最新版本 k0s。新版本与全新的Kubernetes 1.27版本 兼容,并进行了各种其他改进和错误修复,版 本特性更新如下: • 兼容Kubernetes1.27; • 支持容器插件,如WebAssembly(WASM) 和gVisor容器沙箱; • k0s将用自建的镜像来运行所有的系统组件; • 支持控制Helm chart的安装顺序。 全球开源态势洞察|第十期 03 式 的边缘计算项目,目标是扩展Kubernetes以无 缝支持边缘计算场景。它提供了完整的Kuber- netes API兼容性;支持所有 Kubernetes工作负 载、服务、运营商、CNI插件和CSI插件;提供良 好的节点自治能力,即使边缘节点与云端断网, 在边缘节点中运行的应用程序也不会受影响。 OpenYurt可以轻松部署在任何Kubernetes集群 服务中,让强大的云原生能力扩展到边缘。 Contour是基于Kubernetes的Ingress控制 器,通过将Envoy代理部署为反向代理和负载 均衡器来实现其功能。Contour提供开箱即用 的动态配置更新机制,同时保持了轻量级的配 置文件结构。此外,Contour引入全新入口 API HTTPProxy,该API通过自定义资源定义 (CRD)来实现。其主要目标是扩展Ingress API的功能,以提供更丰富的用户体验并解决 原始设计中的局限性。0 码力 | 22 页 | 1.99 MB | 1 年前32023 中国开源开发者报告
编程语言 57 | 知名大模型 58 | 备案上线的中国大模型 21 | 硬核发版 26 | 热门话题 33 | 重磅官宣 39 | R.I.P. 62 | 插件、IDE、终端 63 | 代码生成工具 64 | LLM Agent 67 | LLMOps 68 | 大模型聚合平台 69 | 开发工具 70 | 算力 出品:OSCHINA 存储库中提交了修复程序,而按照发行版邮件列表的政策规定,公开 的安全问题则属于” 禁运 “的话题。 curl 作者宣布不再向各发行版发送安全漏洞预警 在经历了多次治理风波后,为了解决导致领导层危机的潜在结构性问题, 结束组织内部混乱局面。2023 年 2 月,Rust 项目发布了一项有关新的 治理计划的 RFC;旨在建立了一个领导委员会 (Leadership Council) 以替 代原本的核心团队 年代的束缚,并不断发展以应对人工智 能。 自由软件和开源许可证在 20 世纪 70 年代和 80 年代的主要作用对象 逐步演变成 “代码”。但今天,它必须再次转型以处理人工智能模型。 Rust 管理结构大改:解散核心团队、成立 “领导委员会” 2023 年初,GitHub CEO Thomas Dohmke 在欧盟开源政策峰会上对欧盟 即将出台的 AI 法案 (Artificial Intelligence0 码力 | 87 页 | 31.99 MB | 1 年前32020 中国开源年度报告
StackOverflow,开源中 国与博客园也受到很多参与者的喜爱。 7、总结 & 致谢 本次问卷在传播和收集过程中多有坎坷,最终呈现的不过是开源世界的⼩⼩⼀隅,但意义重 ⼤。⻅微知著,不难察觉到中国的开源结构已经在发⽣变化,开源的星星之⽕正在燎原,势不 可当。希望这份报告能够抛砖引⽟,吸引更多的社区和开发者加⼊。 该报告的问卷问题, 报告⽂档均发布在代码托管平台,开源社官⽅⽹站和合作伙伴⽹站平 台,基于 ⼀直坚信好的软件是由强⼤的社区重建出来的。 挣得权威:⼈⼈都有机会参与,他们的影响⼒是基于公开获得的功绩——即他们为社区做 出的贡献。功绩属于个⼈,不会过期,不受就业状况或雇主的影响,同时不可转让。 ASF 的扁平化结构:在 Apache 社区⾥⼤家相互尊重,⻆⾊平等,每个⼈的投票具有同等 的分量,贡献者也是在志愿者的基础上与其他⼈享受⼀样的权利(即使某个组织为他们在 Apache 代码上的⼯作提供报酬)。 GPU(Nvidia)进⾏索引加速与查询加速,能⼤幅提⾼单机性能。 odpi/egeria nnstreamer/nnstreamer,NNStreamer 是⼀组 Gstreamer 插件,为采⽤神经⽹络模 型的 Gstreamer 开发⼈员和管理神经⽹络管道及其过滤器的神经⽹络开发⼈员提供了⽅ 便和⾼效的⽀持。 可以发现,三个项⽬的开发者⼯作时间分布情况是存在差异的。milvus-io/milvus0 码力 | 46 页 | 4.09 MB | 1 年前3使用Sphinx编写Web文档 - 陈照强
sphinx-doc.org/en/master/examples.html Sphinx文档的优点 丰富的输出格式 完备的交叉引用 明晰的分层结构 美观的自动索引 … …. 精确的语法高亮 开放的扩展插件 多种丰富美观的主题 简单、方便 … …. Sphinx 为python社区的快速发展立下了汗马功劳 2 谁发明了Sphinx 谁发明了Sphinx0 码力 | 17 页 | 1.69 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
PRODUCT 基于可视化编程语言 基于通用语言封装的可视化开发语言,具 备完善的静态类型系统和组件扩展机 制,适合 80% 企业级应用开发,灵活性 高,可靠性强。 数据模型驱动 可视化构建实体、数据结构、枚举等低 代码数据模型,自动生成数据库表和页 面交互。 支持企业集成 能够通过 API 集成企业内部的服务,实 现应用组装。 业务与流程融合 流程引擎基于 BPMN2.0 规范,可视化 流程开发,可支持如请假、入职、离职等 据产品,全面降低数据使用门 槛。 开放 专注大数据技术领域,核心 技术自主可控,支持多云和跨 云部署。 高效 联动数据链路多环节,从系统 层面加快业务高效运营和有 效决策。 灵活 组件式插件化产品架构,基于 用户的发展阶段,提供量身定 制的大数据产品和解决方案。 16 网易数帆旗下大数据技术与服务品牌 网易有数以“数据价值”为导向,聚焦于企业 “看数”、“管数”、“用数”等业务场景,提供全链路大数据技术及产品服 用户数据,全面掌控渠道和用户, 提升营销和运营效率,重塑企业零售时代竞争力。 零售大数据解决方案 29 CASE 提升畅爆款销售,降低滞销品库存 对商品进行全生命周期管理,从全盘考虑商品品类结构合理性,快速洞 察重点商品,并基于行业经验对不同销售表现不同生命周期的商品给 出精细化的行动策略。 增强终端快速行动力,提升门店经营水平 提高运营人员数据分析能力,赋能终端导购行动能力提升,使直面消费0 码力 | 43 页 | 884.64 KB | 1 年前3Moonshot AI 介绍
近全监督学习的⾼效对⻬⽅法。 ii. 视觉⽅⾯。团队成员发明了MoCo,引爆了基于对⽐学习的视觉预训练范式,也是过去三年 CVPR引⽤量最⾼的⼯作;发明了ShuffleNet,最⾼效的视觉⽹络结构之⼀;主导开发了 detectron2,⼀个被⼴泛使⽤的视觉开源项⽬并被集成到Meta全线VR/AR产品中。 iii. 强化学习⽅⾯。团队成员作为⼀作提出了基于关系学习的少样本⽅法,得到斯坦福⼤学、 做不了的任务,那现在可以做了。 还有另外⼀个很重要的变量,就是Transformer架构的发明。如果回到六年前,这个世界上可能还没有 Transformer架构,以前的学者研究过传统RNN⽹络结构的极限,有个论⽂标题就叫《ExpLoringthe LimitsofLanguageModeling》,但是你会发现最终的结果就是⼀⽆所获。因为当模型变⼤之后,你 并不能得到⼀个更好 、悟道⼤ 模型,这个过程也⼀直在酝酿⼀个真正的时机。 同时在这个过程中,我也看到很多⼤模型⾯对的挑战。这种挑战⼀⽅⾯是来⾃于技术,另外⼀⽅⾯可 能是来⾃于组织。我们发现,如果你还是⽤传统的组织结构,对训练⼤模型来说,可能很难成功。我 们今天看到OpenAI的成功,本质上,也是因为它的组织做了极⼤的创新。 所以我觉得之前的经历,可以理解成我⼀直在寻找⼀个机会⸺怎么样能够去从零去建造⼀个新的组0 码力 | 74 页 | 1.64 MB | 1 年前32021 中国开源年度报告
GitHub),Satya 的战略眼光及非凡领导力令人侧目。 5 总结 & 致谢 本次问卷在传播和收集过程中多有坎坷,最终呈现的不过是开源世界的小小一隅,但意义重大。见微知著, 不难察觉到中国的开源结构已经在发生变化,开源的星星之火正在燎原,势不可当。希望这份报告能够 抛砖引玉,吸引更多的社区和开发者加入。 该报告的问卷问题, 报告文档均发布在代码托管平台,开源社官方网站和合作伙伴网站平台,基于 管理的控制权完全交予企业。 102 图表 39 :GitLab 的 Open Core 商业模式 资料来源:公司公告,云启资本 5.3 Jina AI Jina 首创的“神经搜索”,可以让企业利用可操作的非结构化数据构建搜索解决方案,做出更有效的业 务决策。Jina AI 的核心项目在 Github 上被称为 Jina ,允许用户在短短几分钟内创建一个由深度学习 驱动的云原生搜索解决方案。Jina 将 AppFlowy,没有供应商锁定的问题。其次,向用户提供了定制与扩展功能。企业或者团 队用户可以使用开放的核心代码库以定制的方式设计和修改 AppFlowy ;无编码经验的个人用户可以使 用社区驱动的工具箱,包括模板、插件、主题等。再次,由于 AppFlowy 是基于 Flutter 和 Rust 构建的, 因此可以很好的支持多在个平台和设备上的使用。 图表 47 :AppFlowy Roadmap 资料来源:AppFlowy0 码力 | 132 页 | 14.24 MB | 1 年前32021 中国开源年度报告
5、总结 & 致谢 / 5 Summary & Acknowledgement 本次问卷在传播和收集过程中多有坎坷,最终呈现的不过是开源世界的小小一隅,但意义重 大。见微知著,不难察觉到中国的开源结构已经在发生变化,开源的星星之火正在燎原,势不 可当。希望这份报告能够抛砖引玉,吸引更多的社区和开发者加入。 This questionnaire had many bumps in the dissemination 资料来源:公司公告,云启资本 Source: Company announcement, Yunqi Partners 5.3 Jina AI Jina 首创的“神经搜索”,可以让企业利用可操作的非结构化数据构建搜索解决方案,做出更 有效的业务决策。Jina AI 的核心项目在 Github 上被称为 Jina ,允许用户在短短几分钟内创 建一个由深度学习驱动的云原生搜索解决方案。Jina 将构建一个生产就绪的神经搜索系统的工 AppFlowy,没有供应商锁定的问题。其次,向用户提供 了定制与扩展功能。企业或者团队用户可以使用开放的核心代码库以定制的方式设计和修改 AppFlowy;无编码经验的个人用户可以使用社区驱动的工具箱,包括模板、插件、主题等。再 次,由于 AppFlowy 是基于 Flutter 和 Rust 构建的,因此可以很好的支持多在个平台和设备 上的使用。 AppFlowy is intended to be an0 码力 | 199 页 | 9.63 MB | 1 年前3Gitea,新一代的代码托管平台
创建和管理仓库、浏览提交历史和代码文件、审查和合并代码提交、管理协作者、 管理分支等。支持标签、Cherry-pick、WebHook、集成协作工具等。 在线编辑 在线浏览和编辑源代码、配置文件、文档等,无需安装任何软件或插件。内 置文本搜索、代码高亮、自动补全、代码折叠等。 Gitea 核心能力:分支管理 分支保护 设置对分支的访问权限,并限制对该分支的操作。 分支管理 查看所有的分支,比较不同分支的差异,并支持创建、删除或合并分支。 可以托管任何类型的文档,包括开发文档、技术文档、 操作手册、用户指南等。 Gitea 延伸能力:CI/CD Gitea Actions 支持 CI/CD 功能,兼容 GitHub Actions, 可重用 Actions 插件和已有 Workflows 脚本 Workflows 脚本 Actions 运行 Gitea 延伸能力:包/发布管理 涵盖目前流行的包/发布管理器,包含 Maven、Go、RPM、NPM、PyPI 在使上与 GitHub 保证一致的使用 体验。 风格兼容 • API 高度兼容:大部分 GitHub 第 三方应用可复用; • Actions 高度兼容:大部分 GitHub Actions 插件可复用; • 工作流程/操作语法兼容:与 GitHub Actions 工作流程、操作语 法高度兼容。 生态兼容 • 类 Github 的使用体验,使用习惯无缝衔接; • 完全兼容 Git0 码力 | 30 页 | 14.34 MB | 1 年前3
共 13 条
- 1
- 2