2024 中国开源开发者报告型 LLM 开发技术栈作为切入点,将深入探讨以下中国 AI 大模型领域的代表性开源项目社区。 这些开源项目社区覆盖了深度学习框架、向量数据库、AI辅 助编程、LLM 应用开发框架、模型微调、推理优化、LLM Agent,以及检索增强生成(RAG)等多个关键技术栈。 为了更全面客观地展示中国大模型 LLM 开发技术栈的开源 社区生态,我们使用了 对开源社区的生态评 估体系,希望通过这些数据洞察中国开源开发者在 GenAI 扩展的联合优化,在搭载骁龙 8 Gen 4 处理器的手机上实现了每秒 65 个 tokens 的推理速度,接近人类语音的平均输出速率。尽管存在电池续航和内存占用过大等挑战, 端上模型代表了 AI 技术隐私保护和成本优化的未来方向。中国在这一领域的探索,为行业提供 了宝贵经验。 推理扩展法则的潜力释放 通过推理扩展法则,模型性能可通过延长“思考时间”而进一步优化。这一技术模拟了人类 源社区提供了 23 / 111 丰富的资源,在这一过程中,小模型不仅在推理能力上有了显著提升,也推动了行业整体技术水 平的进步。 结合当前人工智能产业界的“人工智能+”计划,小模型在特定任务优化上的优势愈发突出, 预计将在金融、医疗和工业自动化等热门领域发挥引领作用,以更高效、更精准的方式满足多样 化需求,帮助人工智能在实际应用场景中落地。 开源多元化与应用细分 中国开源模型的发展0 码力 | 111 页 | 11.44 MB | 8 月前3
2023 中国开源开发者报告2023 年 9 月,蚂蚁集团正式开 源代码大模型 CodeFuse——基 于蚂蚁基础大模型研发。 这是蚂蚁自研的代码生成专属 大模型,帮助开发者自动生成代 码、自动增加注释、自动生成测 试用例、修复和优化代码等。 2023 年 8 月,阿联酋研究团队宣布开源阿拉伯语大模型 Jais。Jais 是一个 经过 130 亿个参数预训练的阿拉伯语和英语双语大型语言模型,在包含 720 亿个阿拉伯语词块和 2790 (Hybrid CDN)是爱奇艺技术团队研发的大 规模混合架构在线视频数据分发技术。 有网友指出,这是爱奇艺客户端将电视机当成了自己的 PCDN 服务器,因此 会在后台持续执行上传任务。这种白嫖电费、流量、存储空间的操作,爱奇 艺要给用户打钱才对。 2023 年 9 月,上海警方接到某科技公司员 工张女士报案称,其公司发现计算机系统 被他人篡改数据,导致公司账户钱款损失。 民警对公司后台电子数据出现的异常账户 自动跳过开屏广告应用「李跳跳」无限期停更 微软于 2023 年 8 月发布了 Visual Studio for Mac 的退役公告。未来, 开发团队将专注于增强 Visual Studio 和 VS Code,优化它们以进行跨平 台开发。 Visual Studio for Mac 退役后,微软方面仍会为 Mac 开发者提供替代方 案,例如 C# Dev Kit for VS Code 和其他扩展。 开源富文本编辑器0 码力 | 87 页 | 31.99 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书iresearch.com.cn 开源产业链关系 以开源社区及代码托管平台为中心,各方合力促进产业源与端共生共长 发起者可以将源代码放在代码托管平台上,结合开发者的代码贡献进一步提升源代码质量。在这个代码优化的过程中,也有其他力 量辅助:1)开源基金会可选择性接受项目的捐赠并运营项目;2)开源技术论坛通常会提供更广阔的开发者交流平台,提升开发者 能力水平;3)开源社区评估机构可对开源社区进行评分,辅助开 主研究及绘制。 法务服务 社区 治理 社区 运营 代码 审核 开源 开发 生态 合作 法务 合规 开源企业发起者内的多组织协作 开源开发 战略合作 社区运营 代码审核 软件优化 选择适合开源项目的开源协 议,依据企业对项目的开源 方案审定协议中个别条款 向上对接高校及研究机构, 加紧基础技术共建;向下对 应发行版ISV厂商,将软件向 更多行业及场景渗透 规划开源软件迭代方向,包 4.4% 其他 0.9% 开源社区中,使用者比例最高,使用开源软件、发掘开源代码是大多 数开发者加入开源项目的起点,随着与社区的绑定不断加深,使用者 逐渐向贡献者转化,围绕项目提出自身的建议或优化方向。 14 ©2023.11 iResearch Inc.0 码力 | 43 页 | 4.69 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021发布轻舟云原生软件生产力平台、有数全链路数据生产力平台。 网易云品牌升级为网易数帆,发力数字化转型基础软件。 深度参与社区 Spark 3.x 版本开发;开源企业级数据湖探索平台 Kyuubi ;发布首个开源项目分布式存储系统 Curve。 2019 发布全链路数据中台解决方案。 2018 发布轻舟微服务、“瀚海”私有云及国内首款云计算全栈一体机。 2017 加入云原生计算基金会(CNCF)。 2016 网易云战略发布,推出面向互联网的场景化云服务。 2012 网易杭州研究院启动私有云研发,支撑网易集团互联网产品全面上云。 2006 网易成立杭州研究院,构建互联网技术体系。 1997 网易早期云存储产品诞生,支撑网易邮箱运行。 数帆阶段 网易云阶段 前身阶段 数帆历程 04 COMPANY 背靠24 年互联网技术积累 成熟可靠 年 24 140 余项技术专利 140 12 服务,打破企业软件应用中数 据孤岛等现状。 敏捷 通过小步快跑的方式敏捷迭 代,不断适应市场与业务需求 的变化,摆脱缓慢的大版本更 新与业务需求脱节的窘境。 高效 通过自动化与生产协作方式 的优化,多环节提升软件生产 的效率。 开放 基于开放的技术体系,打造开 放的软件架构。 轻舟云原生软件生产力平台 2.0 能力全景图 轻舟优势 搭建云原生技术底座,助力企业与时俱进实现云上软件创新,支撑业务高速发展。0 码力 | 43 页 | 884.64 KB | 1 年前3
中国开源软件产业研究报告,艾瑞咨询研究院根据公开资料研究及绘制。 企业开源的战略意义(二) 开源在企业中的使用率提升,带来多维度战略价值 除前文所述的商业价值和成本优化之外,开源软件产业对企业的战略意义还体现在以下三方面:1)技术价值,对具备技 术优势的头部企业而言,开源可加强同业间的交流,实现产品优化,走向国际;对技术能力较弱的企业来说,开源可实现 社会协作,缩小与业界头部企业的技术差距,扩大市场份额。2)品牌价值,企业建立开源社区可实现对技术、人才的网 算与开源之争 来源:艾瑞咨询研究院根据公开资料研究及绘制。 开源软件厂商与云服务厂商的竞争与分歧 • 云服务厂商在开源软件基础上提供服务的动力:开源软件在开源社区的不 断更新下,在云计算、数据存储等云服务厂商致力于提供的服务方面上形 成了一定的技术主流,云服务厂商可在开源技术的支持下进一步丰富云服 务的理念、促进技术发展及扩展服务领域 • 云服务厂商与开源厂商的冲突:云厂商在无限制地将部分开源软件的功能 活跃的开源企业一般为“BATH”四大综合科技企 业以及其他互联网、云计算企业等 从可行性角度上讲,上述企业具备较强的技术、人才和资金 能力,能够自主进行或支持大规模开源运营 从优化产品方面,如前文所述,开源能够帮助企业利用开源 社区资源进行产品优化和升级,提升竞争力 从国内市场状况上看,科技企业、云服务企业正处于激烈的 市场竞争中,开源为企业带来市场影响力、人才吸引力方面 的提升,为企业带来各种隐性收益0 码力 | 68 页 | 3.63 MB | 1 年前3
2020 中国开源年度报告
Foundation)」官⽅正式对外发声,⼤家对此抱有多重期望:推⼴开源的理念,开源⽂化 教育和社区建设,建⽴开源⽣态体系,对开源项⽬进⾏早期的孵化和扶持,帮助中国开源 社区进⾏资源的整合和优化,并接轨国际开源社区。 3、开发者群体特征 3.1 参与者普遍年轻且学历较⾼,男性占⽐⼋成 参与者的年龄集中在 20-39岁,受教育程度普遍在本科及以上,其中男性占⽐约为 84%,⼥ 性为 16%,与去年持平。 中国成⽴开源基⾦会的作⽤ 参与者们⼀致认为中国成⽴开源基⾦会是⾮常有意义的,可以推⼴开源的理念,开源⽂化教 育,社区建设,建⽴开源⽣态体系,利于开源项⽬早起的孵化和扶持,帮助中国开源社区进⾏ 资源的整合和优化,也有助于接轨国际开源社区。 【专家点评】 蒋涛:在全球科技竞争和中国开源核心技术发展态势下,从开源生态制高点着眼,建设和发展 中国开源基金会意义重大。通过中国开源基金会的发展壮大,不断鼓励国内巨头科技企业和社 提升,更好地满⾜⼴⼤ AI 开 发者的使⽤需求,也让⼴⼤开发者形成了更强的社区认同感。 深度学习框架在 AI 技术栈中处于承上启下的位置,向下对接芯⽚,向上承接应⽤,与芯⽚⼴ 泛适配、深度融合优化⾄关重要。因此⻜桨跟硬件⼚商建⽴了紧密合作关系,很多芯⽚⼚商直 接在⻜桨社区贡献代码,为⻜桨⽣态发展做了⼤量贡献。⻜桨也持续与各⼤开源组织、AI 社 区深度合作,并得到启智(OpenI)社区的⽀持成为其中重要⼀员。通过0 码力 | 46 页 | 4.09 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)各语言源码构建包版本升级; • 支持一键删除应用及应用下相关资源; • 使用集群命令行创建的pod有合理的回收机 制; • 域名配置https证书时,增加搜索功能或优 先匹配与域名相同的证书; • 支持配置日志存储路径。 近日,Prometheus v2.44.0发布,版本特性更 新如下: • 将每次发送的默认样本数提高到2000; • 支持处理原生直方图数据; • 在命令行中添加用于检查Prometheus服务 cloud以开源软件的形式进行研发,于2015年 早期对外发布早期版本。2016年5月,继 Kubernetes之后成为第二个正式加入CNCF基金 会的项目,同年6月正式发布1.0版本。2017年 底发布了基于全新存储层的2.0版本,能更好地 与容器平台、云平台配合。 全球开源态势洞察|第十期 05 Contour v1.25.0发布 Contour是基于Kubernetes的Ingress控制 器,通过将Envoy代理部署为反向代理和负载 TiKV:TiKV是一个分布式事务型的键值数据库,提供了满足ACID约束的分布式事务接口,并且通 过Raft协议保证了多副本数据一致性以及高可用。TiKV作为TiDB的存储层,为用户写入TiDB的数据 提供了持久化以及读写服务,同时还存储了TiDB的统计信息数据。TiKV于2018年8月被云原生计算 基金会接受为沙盒项目。2019年5月,CNCF宣布正式将TiKV从沙箱项目晋级至孵化项目。2020年0 码力 | 22 页 | 1.99 MB | 1 年前3
2021 中国开源年度报告涨,学校里老师 们也鼓励和重视开源;另一方面,也说明现有的 IT 从业人员在开源领域投入的比例偏小。开源领域资深专家 的比例偏低,技术人员梯度不够合理,也是国内各大开源社区在吸引贡献者方面,可以优化的地方。 段夕华:近些年来,学生在开源人群中占比持续增多到今天接近一半,可能也是因为用人单位越来越认可学生 在开源中所展现出的编程技能、沟通能力及合作精神,因此这其中应该也不乏各种刷榜行为,需要开源项目所 的优势。客观来看,这对开源的发 展有利有弊。利的一面在于,技术产品的提供方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面 在于让部分厂商为了取得差异化的竞争优势,把本应开源出来的特性或者优化,来闭源处理,从而不利于开放 式创新,也降低了可维护性。更为健康的针对开源产品的采购模式,应该平衡产品指标,技术竞争力以及产品 本身的可维护性。 段夕华:不知道 21 年底所爆发的 log4j 三名。 此外,从排名中我们可以看出,除了优质项目的作者外,知识博主也受到了诸多关注。很多知识博主选 择将代码仓库作为公开的学习资料储存库使用,让读者和观众们自由获取,代码仓库的用途不再仅限于 存储代码,这种新型的知识分享形式也越来越受到开发者们的欢迎。 注:用户介绍以其被推荐仓库的技术栈为依据。 2.6 年度最受开发者关注的组织 排名 组织名称 组织主页 1 OpenHarmony https://gitee0 码力 | 132 页 | 14.24 MB | 1 年前3
JumpServer ⼴受欢迎的开源堡垒机JumpServer 的架构及核⼼组件 Load Balancer Lina Luna(Web Terminal) Chen CORE MySQL / Redis 等 本地存储 云存储 负载 接⼊ 核⼼ 数据 存储 KoKo Lion Razor Magnus Kael Tinker Panda KoKo Linux、命令⾏数据库等连接管理; Lion 浏览器图形化连接管理 Windows JumpServer 堡垒机的特⾊功能 体验极佳的 Web Terminal ⼴泛的 多云管理⽀持 超⼤规模 分布式资产⽀持 全⾯的数据库 运维安全审计⽀持 ⽀持审计录像 的云端存储 内置多组织体系 强⼤的 远程应⽤发布能⼒ 灵活的 软件 / 硬件 部署⽅案选择 1 3 6 8 2 4 5 7 体验极佳的 Web Terminal Linux Web Terminal JS - 1 统⼀存储 缓存 A.jms.com 离散⼊⼝分布式部署⽅案 区域 A 区域 B 超⼤规模分布式资产⽀持 - ⽀持多分⽀、多区域的集群分布式互联部署 - B.jms.com 负载均衡 JS - 2 JS - N JS - A 负载均衡 JS - B JS - N 访问不同的节点, 访问不同地域资产 数据库 JS - 1 统⼀存储 缓存 A.jms0 码力 | 40 页 | 6.66 MB | 1 年前3
2021 中国开源年度报告情高涨,学校里老师们也鼓励和重视开源;另一方面,也说明现有的 IT 从业人员在开源 领域投入的比例偏小。开源领域资深专家的比例偏低,技术人员梯度不够合理,也是国内 各大开源社区在吸引贡献者方面,可以优化的地方。 Du Junping: More than 40% of the developers participating in open source projects are students 指标上的优势。客观来看,这对开源的发展有利有弊。利的一面在于,技术产品的提供 方,在相关的开源领域的贡献可以被视为技术竞争力;弊的一面在于让部分厂商为了取得 差异化的竞争优势,把本应开源出来的特性或者优化,来闭源处理,从而不利于开放式创 新,也降低了可维护性。更为健康的针对开源产品的采购模式,应该平衡产品指标,技术 竞争力以及产品本身的可维护性。 Du Junping: Due to the year. 此外,从排名中我们可以看出,除了优质项目的作者外,知识博主也受到了诸多关注。很多知 识博主选择将代码仓库作为公开的学习资料储存库使用,让读者和观众们自由获取,代码仓库 的用途不再仅限于存储代码,这种新型的知识分享形式也越来越受到开发者们的欢迎。 In addition, we can see from the rankings that knowledge bloggers are0 码力 | 199 页 | 9.63 MB | 1 年前3
共 12 条
- 1
- 2













