2020 中国开源年度报告
特邀点评专家: 吴晟,Apache 软件基⾦会 Member,Apache Local Community 联合创始⼈ ⻩东旭,PingCAP 联合创始⼈兼 CTO ⻢艳军,百度深度学习技术平台部⾼级总监 蒋涛,CSDN 创始⼈ & 董事⻓,极客帮创投创始合伙⼈ ⾼阳,SegmentFault 思否创始⼈ & CEO 红薯,开源中国创始⼈ & CTO 庄表伟,开源社理事⻓ 状,从⽽为开源的后来⼈提供权威的参考。 调查对象:覆盖开发者、社区成员、贡献者、学⽣、政府企业管理⼈员 调查内容:主要涵盖个⼈信息、⼯作状况、开源社区以及开发者技术 调查⽅法:以在线问卷⽅式搜集样本和数据,交叉对⽐法分析数据 推⼴⽅法:线上社交媒体、博客、开源社、开源中国⽹站 问题数量:59 问题类型:单选、多选、开放性 样本量:236 2、重要发现 这个⼤背景下,各⾏各业都不可避免受到了冲击和影响;82% 的 ⼈认为疫情对于参加开源社区的活动产⽣了影响,但也具有推动作⽤,11% 的⼈认为毫 ⽆影响,7% 的⼈认为疫情的负⾯影响⼤于正⾯影响; 在在线⽂档协作⼯具的使⽤上,⽯墨⽂档以⿊⻢的形式由第三名⼀跃成为第⼀名,压倒了 wiki 和 Google Doc,国内正在涌现出⼀批优秀的协作⼯具,并越来越为⼤家认可; 2020 年 9 ⽉ 90 码力 | 46 页 | 4.09 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021据、零售大数据、制造业智慧供应链等行业解决方案。 发布轻舟低代码平台 2.0 。 大数据开源项目 Kyuubi 全票进入 Apache 软件基金会孵化器。 有数 BI 个人版永久免费;发布机器学习平台、消费者运营平台、标签画像、流量分析等产品。 2020 2021 发布轻舟云原生软件生产力平台、有数全链路数据生产力平台。 网易云品牌升级为网易数帆,发力数字化转型基础软件。 深度参与社区 实时数据传输 运维中心 离线开发平台 实时计算平台 集群运维 任务运维 文件管理 任务开发 租户管理 自助分析 权限管理 可视化调度 数据开发及管理平台 标签画像 消费者运营平台 机器学习平台 BI 有数优势 有数全链路数据生产力平台2.0能力全景图 易用 覆盖企业数据全链路的大数 据产品,全面降低数据使用门 槛。 开放 专注大数据技术领域,核心 技术自主可控,支持多云和跨 大屏 自助取数 移动应用 数据填报 全渠道 数据融合 会员 标签管理 用户分群 营销 活动管理 投放数据 追踪 活动数据 分析 特征治理 模型管理 交互式建模 可视化建模 在线推理 图分析 标签管理 画像分析 群组管理 API管理 支持数据产品研发 无代码平台,与 BI 、数据填报、复杂报 表、智能决策深度融合。 开放与集成能力 以标准类接口开放所有资源,支持集0 码力 | 43 页 | 884.64 KB | 1 年前3
国家人工智能产业综合标准化体系建设指南(2024版)产模式和经济发展形态,将对加快建设制造强国、网络强国 和数字中国发挥重要的支撑作用。人工智能产业链包括基础 层、框架层、模型层、应用层等 4 个部分。其中,基础层主 要包括算力、算法和数据,框架层主要是指用于模型开发的 深度学习框架和工具,模型层主要是指大模型等技术和产 品,应用层主要是指人工智能技术在行业场景的应用。近年 来,我国人工智能产业在技术创新、产品创造和行业应用等 方面实现快速发展,形成庞大市场规模。伴随以大模型为代 (三)关键技术标准 关键技术标准主要包括机器学习、知识图谱、大模型、自然 语言处理、智能语音、计算机视觉、生物特征识别、人机混合增 强智能、智能体、群体智能、跨媒体智能、具身智能等标准。 1. 机器学习标准。规范机器学习的训练数据、数据预处理、 模型表达和格式、模型效果评价等,包括自监督学习、无监督学 习、半监督学习、深度学习、强化学习等标准。 2. 知识图谱标准。规范知识图谱的描述、构建、运维、共 方法、服务能力 成熟度评估、生成内容评价等标准。 4. 自然语言处理标准。规范自然语言处理中语言信息提取、 文本处理、语义处理等方面的技术要求和评测方法,包括语法分 析、语义理解、语义表达、机器翻译、自动摘要、自动问答、语 言大模型等标准。 5. 智能语音标准。规范前端处理、语音处理、语音接口、 数据资源等技术要求和评测方法,包括深度合成的鉴伪方法、全 双工交互、语音大模型等标准。0 码力 | 13 页 | 701.84 KB | 1 年前3
2023 中国开源开发者报告发展的新阶段。LLM Agent 是一种基于 LLM 的智能代 理,它能够自主学习和执行任务,具有一定的“认知能力 和决策能力”。LLM Agent 的出现,标志着 LLM 从传 统的模型训练和应用模式,转向以 Agent 为中心的智能 化模式。LLM Agent 打破了传统 LLM 的被动性,使 LLM 能够主动学习和执行任务,从而提高了 LLM 的应用 范围和价值;它为 LLM 的智能化发展提供了新的方向, 快速迭代发展,诸如 Dify.AI 的 LLMOps、Milvus 的向量 数据库、CodeGeeX 与 Comate 的 AI 编程、对 LLM Prompt 的研究、OneFlow 的深度学习框架。 值得一提的还有华为的盘古大模型,其中盘古气象大模型是 首个精度超过传统数值预报方法的 AI 模型,速度相比传统 数值预报提速 10000 倍以上,能够提供全球气象秒级预 报。盘古大模 西。它需 要你不断完善自己的输入,甚至有时候可能要求在你自身都不 知道“可以想要一个什么东西”的情况下去输入。 这样的话其实就是你在输入与输出:整个事情我都想通了,方 案我其实也就都出来了,机器给到我的都只是一个个独立性 的、小而窄的、解决掉一点一点问题的东西。 举个例子,我说我肚子疼,它会直接告诉我肚子疼可能是因为 什么,怎样做可以缓解或者解决,但它不会一点一点进行“望 闻问切”0 码力 | 87 页 | 31.99 MB | 1 年前3
2021 中国开源年度报告…………………………………………………………………………… 34 4.8 一个项目的哪些特征对于您留下成为项目贡献者的重要度评级 ……………………………… 35 4.9 开源项目是否集成 RPA(机器人流程自动化) ………………………………………………… 36 4.10 开源活动 ………………………………………………………………………………………… 37 4.11 聊天运维工具 ……………… 实现状, 从而为开源的后来人提供权威的参考。 调查对象 :覆盖开发者、社区成员、贡献者、学生、政府企业管理人员 调查内容 :主要涵盖个人信息、工作状况、开源社区以及开发者技术 调查方法 :以在线问卷方式搜集样本和数据,交叉对比法分析数据 推广方法 :线上社交媒体、博客、开源社、开源中国网站 问题数量 :44 问题类型 :单选、多选、开放性 样本量 :537 2 重要发现 通过分析 杨丽蕴:我国开源人才后备力量足、基数大。 我国高校越来越重视开源人才的培养 , 越来越多的学生参与到开 源开发中,开源人才培养周期前置,越来越多的学校开设开源课程,希望后续可以实现在学习计算机、编译原 理、软件工程等理论知识的同时,让学生学习掌握开源开发模式、理解认同开源文化。 参与者职位分布 产品经理,9,2% CTO/CEO 公司负责人,26,5% CTO/CEO 公司负责人 产品经理 教师 开发者0 码力 | 132 页 | 14.24 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书含编译器、基础编程语言、IED等 社区协作:鼓励各方在开放平台上协作 贡献,推动开源内容的发展 创新改进:通过资源共享与协作共生, 提升开源内容质量,并产生新的内容 自由共享:开源内容可以免费被任何人 查看、学习、使用 透明与可审查:开源的源代码可以被任 何人审查验证、保持质量 开源精神 通过传递一种对于知 识分享、知识透明和 平等合作的价值观, 凝聚群众力量,促进 开源内容传播应用与 迭代升级,达到社会 实现互惠互利、共建共享 获得职业发展机会 提高自我认同 提升自身知识技术水平 占比(%) 56.6% 53.9% 参与开源贡献的原因 开源代码仓、开源社区公开课程、讲座、技术指南已 成为开发者在工作学习外的重要行业知识来源 知识技术 水平提升 实现自我 价值认同 开发者多以兴趣为导向选择开源项目,在帮助项目逐 渐完善的过程中,完成自身的价值认同 获得职业 发展机会 对开源社区的贡献能够很好的反应开发者的技术素 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 两类开源开发者行为差异 参与开源目的 代码贡献特征 付费意愿 平台权益 个人开发者 企业开发者 出于兴趣或求知欲进入 开源社区,希望学习社 区内优秀代码,并与 “大神”交流 以商业视角出发,希望 通过对开源项目的二次 开发形成开源软件的行 业发行版,实现商业收 益 代码贡献多针对于某一 单一模块的能力优化或 Bug修补,商业化潜力0 码力 | 43 页 | 4.69 MB | 1 年前3
【周鸿祎清华演讲】DeepSeek给我们带来的创业机会-360周鸿祎-202502解决复杂问题 7政企、创业者必读 8 AI不仅是技术革新,更是思维方式和社会结构的变革 国家 产业 个人 企业政企、创业者必读 人工智能发展历程(一) 从早期基于规则的专家系统,走向基于学习训练的感知型AI 从基于小参数模型的感知型AI,走向基于大参数模型的认知型AI 从擅长理解的认知型AI,发展到擅长文字生成的生成式AI 从语言生成式AI,发展到可理解和生成声音、图片、视频的多模态AI 认为大模型的能力无法进一步得到质的提升 开辟强化学习新范式 从预训练Scaling Law转变为强化学习Scaling Law 大数据+大参数+大算力的 预训练Scaling Law的边际效应递减 • 人类构造的训练数据已达上限 • 万亿参数规模之后,继续增大参数规 模难以带来质的提升 • 训练算力成本和工程化难度大幅上升 强化学习Scaling Law • 利用合成数据解决数据用尽问题 利用合成数据解决数据用尽问题 • 利用self-play强化学习,在不增大参 数规模前提下,大幅提升复杂推理能力 • 通过后训练算力和推理算力,在不增加 预训练算力前提下,大幅提升模型性能 DeepSeek颠覆式创新——技术创新 26政企、创业者必读 预训练模型如GPT——疯狂读书,积 累知识,Scaling law撞墙 预训练模型思考深度不够 算力见顶,变成少数巨头游戏 预训练大模型 推理大模型0 码力 | 76 页 | 5.02 MB | 6 月前3
2021 中国开源年度报告covers personal information, work status, open source community, and developer technology 调查方法 :以在线问卷方式搜集样本和数据,交叉对比法分析数据 Survey method: Online questionnaire to collect samples and data, cross-comparison 杨丽蕴:我国开源人才后备力量足、基数大。 我国高校越来越重视开源人才的培养,越来 越多的学生参与到开源开发中,开源人才培养周期前置,越来越多的学校开设开源课程, 希望后续可以实现在学习计算机、编译原理、软件工程等理论知识的同时,让学生学习掌 握开源开发模式、理解认同开源文化。 Yang Liyun: China's open source talent reserve is sufficient; the [Expert Comment] 段夕华: 科技型初创公司用开源来实现技术能力展现,吸引潜在合作伙伴,这个趋势不 容忽视。这其中国内最为抢眼的就是 PingCAP/TiDB,其开源策略、战术均值得大家学习 借鉴。 Duan Xihua: Technology startups use open source to show their technical capabilities and0 码力 | 199 页 | 9.63 MB | 1 年前3
2024 中国开源开发者报告TypeScript连续两年成为了 Gitee年度增长最快编程语言 (2023年增长率为49.04%), 同样持续强势的还有Rust以及 C语言家族。 此外,Dart及Arduino首次上榜, 符合2024年跨平台开发及机器 人开发的潮流。 12 / 111 本年度最常用开源许可证 MIT 33.91% Apache-2.0 27.28% MulanPSL-2.0 11.70% GPL-3.0 8.55% Insight 2024 中国开源开发者报告重点聚焦大模型,本章节以大模 型 LLM 开发技术栈作为切入点,将深入探讨以下中国 AI 大模型领域的代表性开源项目社区。 这些开源项目社区覆盖了深度学习框架、向量数据库、AI辅 助编程、LLM 应用开发框架、模型微调、推理优化、LLM Agent,以及检索增强生成(RAG)等多个关键技术栈。 为了更全面客观地展示中国大模型 LLM 开发技术栈的开源 通个人用户。OpenAI 在 ChatGPT 上一个重要且成功的操作就是把大模型从学术界、工业界直接推向了普通个体,让 C 端用户切 实感受到了大模型的可能性与魅力。这一点被国内的大模型厂商广泛学习。在 B 站刷视频,国 内知名的那几个大模型厂商的广告,你一个也不会落下。 受到大家的认可与喜爱固然重要,但对于 C 端用户,有两个需要时刻牢记的问题:一是 C 端用户是没有忠诚度的,谁免费就0 码力 | 111 页 | 11.44 MB | 9 月前3
Pro Git 中文版 第2版 2.1.66GitHub 在 Git 社区的重要性是不能回避的。 我已经决定将本书中关于 GitHub 的部分转变 为深度介绍 GitHub 是什么以及如何高效地使用它,而不再是作为一个 Git 托管的例子。 如果你正学习如何使用 Git,那么了解如何使用 GitHub 将会帮助你加入到一个巨大的社区中。不论你决定为自己的代码使用哪一个 Git 托管服务,这都很有价值。 自从上次出版以来另一个重大变革是 Git 网络传输 如果本书在此刻自燃,你应该已经能够使用已经学到 的漂亮有用的 Git 知识获取到另外一份拷贝。 第三章 关注于 Git 的分支模型。分支模型通常被认为是 Git 的杀手级特性。 这里,你将学习到究竟是什么让 Git 与众不同。学习完本章,你可能需要一段时间来思考, 在 Git 分支成为你的生活的一部分之前,你到底是如何生 活的。 第四章 关注于服务器端的 Git。本章面向那些希望在你自己的组织或个人服务器搭建用于合作的 实现它们。 学习完本章,你应该能够在多个远程仓 库之间游刃有余,通过电子邮件使用 Git, 熟练地处理多个远程分支和合作者贡献的补丁。 第六章 介绍 GitHub 托管服务以及深层次的工具。我们将涵盖注册与账户管理, 创建和使用 Git 仓库,贡献项目 的普通工作流以及接受他人的贡献,GitHub 的可编程接口和那些能够让你的生活变得更简单的小技巧。 第七章 关于 Git 的高级命令。你将学习到一些0 码力 | 501 页 | 19.30 MB | 1 年前3
共 178 条
- 1
- 2
- 3
- 4
- 5
- 6
- 18













