2023 中国开源开发者报告Bard,作为其首次亮相的对话 LLM 产品,无疑具有其里程碑意义,尽管它的首秀并不尽 如人意,车翻了又翻。 三、 Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM 在语言理解和多模态处理能力方面的探索,甚至 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 出现,犹如一颗投入平静湖面的石子,激荡起层层水波, 可以根据开发者的代码提示自动补 全代码,大大提高了开发效率。这也引发了代码原创性的讨 论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 个 LLM 模型串联工作,发挥各自的优势,并且可以将 LLM 模型与外部数据源进行连接,产生更强大的语言理解 和生成效果。这开启了 LLM 集成应用的新方向,并诞生了 一个新的细分领域“LLMOps”。 有人称之为“造商业概念”,这里按下不表。 十、 镜头给到国内。相比国际上当前逢 AI 必 GenAI,国内更 多地还是在 LLM 这一层面,Robin Li 的“卷大模型没意 义,卷应用机会更大”,其实很深刻地指出了内中区别。 本报告以开发者视角为主,从 LLM 切入,但实际上或多 或少与 GenAI 脱不开关系。 2023 年国内 LLM 发展活跃,从最初的百度文心一言“硬 刚”Ch0 码力 | 87 页 | 31.99 MB | 1 年前3
中国开源软件产业研究报告托管平台、软件论坛、行业联盟)、二次开发者和使用者等。源作者在开源社区中发起开源项目,这意味着将软件源代码 无偿在社区发布,此后二次开发者和使用者作为贡献方进行迭代,并在开源许可证的约束下使用迭代版本,社区中的其他 机构提供法律、行业发展等服务和指导,不同角色间互相配合,有效协作,达成技术交流或商业目的。开源运营和治理环 节,无论是由企业主导还是由基金会主导,在整个开源项目过程中都处于关键位置,包含软件开发和发行、市场推广、版 软件开源为企业带来直接收益、渠道收益、行业生态收益 从商业成功的角度上看,企业发布开源软件能够为自身带来直接商业化收益、渠道收益和市场影响力提升带来的产业协同 收益。其中,直接商业化收益包含企业提供开源软件的收费版本、专业服务和引流广告收入;渠道化收入主要包含开源软 件具备一定的“流量”后为企业的其他产品产生的广告效应;产业协同主要是开源软件形成足量的规模和市场影响力后, 带动产业形成创新的产品和服务形式,进一 促进的良性循环。如果 没有成功的开源运营,软件开源就无法产生显著的商业化效果。 企业实施软件开源战略的商业模型 企业之内 企业之外 软件开源 用户增长 加速创新 产品升级 提供付费订阅版本 提供专业配套服务 引流产生广告收入 直接 商业化 渠道化 为互补产品宣传、导流 提升企业市场声量 产业级影响 促进协同产品出现和创新 构建开源产业基金会 e.g. Linux发行版0 码力 | 68 页 | 3.63 MB | 1 年前3
2024 中国开源开发者报告https://huggingface.co/spaces/ zh-ai-community/zh-model-rel ease-heatmap 21 / 111 其中,Qwen 系列凭借灵活的多尺寸选项,强大的多语言支持以及友好的模型授权功能, 赢得了社区开发者的高度评价。DeepSeek 通过引入多头潜在注意力(Multi-head Latent Attention, MLA)技术,在 Chat 和阿里自家的百炼平台中,极大促进了全球开发者的交流和协 作,形成了国际化开源生态。 北京智源研究院和上海人工智能实验室等研究机构,通过与企业和高校合作及开源平台的建 设,建立了更完善的协作机制,从而在开源模型 (如 InternLM) 和数据集 (如 Infinity-MM) 领 域贡献了大量有影响力的基础工作和资源。 2024 年,中国开源社区涌现出众多高质量的自发研究成果。其中,MAP 则作为中国模型在国际开源社区的 2024 年首秀,一经发 布便获得了广泛关注,为中国模型在全球开源生态中赢得了更多认可。 平衡发展与合规创新 中国在推动人工智能技术发展的同时,也在监管层面努力建立了完善、透明的治理机制。这 种监管创新为开源模型的发展提供了稳定的政策环境,同时确保技术应用符合社会价值导向。比 如 《人工智能示范法 2.0(专家建议稿)》对于免费且已开源方式提供人工智能研发的个人和 组织给予减0 码力 | 111 页 | 11.44 MB | 8 月前3
Moonshot AI 介绍正“懂”⼤模型的创业者,所以本⽂中有许多反共识的观点:杨植麟觉得微调最终会不存在, tokenizer最后也不⼀定是必须的;硅⾕⼤模型训练者们担⼼数据瓶颈和能源限制,他反⽽觉得所有问 题都是互相关联的,多模态可以缓解数据短缺,合成数据则可以通过改变计算范式解决能源问题。 本⽂还试图回答另⼀个外界普遍关⼼的问题:⼀家新创⽴的AGI公司如何超越OpenAI?杨植麟的答案 是techvisio 以很好地还原⼀些具体细节, 还可以内容做推理。⽤⼾⾃⼰还会发现很多场景,⽐如扔给它50个简历,让它根据你的要求做分析和 筛选。 要做差异化,我认为就是去看这⾥⾯的techspace有多⼤,techspace越⼤,技术、产品、商业层⾯ 能实现的差异化就越⼤。如果技术已经收敛了,那⼤家只能去追赶,就是同质化内卷。 然后我其实⽐较乐观,因为现在仍有巨⼤的techspace。AGI技术可以分为三层: 做tradeoff。但是最终直接训练⼀个万亿的densemodel肯定效果会⽐⼀个只有千亿参数的模型要 好。 海外独⻆兽:Anthropic⼀直在提模型的可解释性,这⼀点其实有蛮多争论。你是如何思考可解释性 的?因为刚刚你也提到了模型是⼀个⿊盒,并且其实⼈类到现在还没有弄清楚⾃⼰的⼤脑是怎么⼯作 的。 杨植麟:可解释性核⼼是个信任的问题。建⽴⼀个信任的⼼智是很重要的,对应的应⽤场景甚⾄可能0 码力 | 74 页 | 1.64 MB | 1 年前3
2021 中国开源年度报告14 前端开发框架 …………………………………………………………………………………… 24 3.15 数据库……………………………………………………………………………………………… 25 3.16 版本控制工具 …………………………………………………………………………………… 26 3.17 AI 开发框架 ……………………………………………………………………………………… 26 3.18 云原生组件 方向。 专家点评 堵俊平:开源的参与者中非技术人员比例提高说明开源在向各行各业渗透,同时开源自身也需要法务,公共政 策等领域的支撑才能更好的发展。 20 3.7 开发语言 开发语言呈现多超多强的状态,Python 后来居上,超过 Java 成为榜首, JavaScript/TypeScript 位居第三。 专家点评 堵俊平:Python 和 Java 并驾齐驱,某种程度反映了当下 以绝对优势遥遥领先,SQL Server 与 Oracle 跟随其后。 专家点评 段夕华:Mysql 和 Postgres 的对比关系也有国内外差异,估计还是惯性使然 26 3.16 版本控制工具 毫无疑问的是,Git 一枝独秀,具有绝对性优势。SVN、TFS、CVS 目 前仍有不少参与者在使用。 3.17 AI 开发框架 AI 开发框架使用情况中,意料之中地,Tensorflow0 码力 | 132 页 | 14.24 MB | 1 年前3
2021 中国开源年度报告model, understanding, and open source culture. 江波:我觉得这个数字分布只能体现出我们问卷覆盖的人群中,学生占比相对比较大(毕 竟样本数量只有 500 多),不能提现行业现状。所以我个人对于各位专家对于开源教育的 乐观分析有所保留,我认为目前学生群体参与开源的现状应该有在逐年上升,但远未到占 比 47% 的程度。 Jiang Bo: I think and other areas to achieve better development. 3.7 开发语言 / 3.7 Development Languages 开发语言呈现多超多强的状态,Python 后来居上,超过 Java 成为榜首, JavaScript/TypeScript 位居第三。 The development language shows the state domestic open source projects have a particular preference for Vue initiated by the Chinese. 3.15 版本控制工具 / 3.15 Version Control Tools 毫无疑问的是,Git 一枝独秀,具有绝对性优势。SVN、TFS、CVS 目前仍有不少参与者在使 用。 There is no0 码力 | 199 页 | 9.63 MB | 1 年前3
2020 中国开源年度报告
部分⼈的⽐例提升。 5.8 开源软件安全 有近七成的参与者表示不会有不安全感,但同时也仍有 25% 的参与者表示会有此类担忧,开 源软件的安全问题仍然值得我们关注。 【专家点评】 红薯:开源软件由于其机制的关系,通过开源社区不断地发现问题并维护,其安全问题可能并 不是开发者们的主要关注点。其实除了技术⽅⾯的安全问题,开源合规性等许可证⽅⾯的安全 问题同样需要开发者们重视,许可证冲突问题所带来的法律⻛险影响⾮常⼤且很难被发现,尤 开源生态制高点着眼,建设和发展 中国开源基金会意义重大。通过中国开源基金会的发展壮大,不断鼓励国内巨头科技企业和社 会力量合力共建开源创新生态环境;同时,通过学习借鉴更完善的基金会运行模式、组织机制 和法律制度,建设可持续发展的中国开源创新力量。此外,在当前全球开源商业模式越来越成 熟的市场环境下,建设开源基金会,还可以引导国内外基金和投资机构孵化支持开源,培育中 国开源『独角兽』,最终 源⽣态的整体繁荣有重要意义。我们期待看到开放原⼦可以成为开源的连接器,连接国际开源 社区、链接国内外优质资源,帮助开源项⽬成⻓与成功。 6、开发者技术现状 6.1 开发语⾔ 开发语⾔呈现多超多强的状态,前三甲分别为 Java、JavaScript 和 Python,排名与去年基 本保持⼀致。 【专家点评】 王伟:编程语⾔是⼤家喜闻乐⻅的话题,排名⽅⾯没有太⼤的变化。值得⼀提的是 SQL0 码力 | 46 页 | 4.09 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)管理。OSM于2020年8月推出,同年加入云原 生计算基金会(CNCF)。不久后,该项目成为 云原生计算基金会(CNCF)沙箱级别的项目。 2022年初,OSM正式发布v1.0.0版本。 近日,OSM维护团队宣布OSM不再发布新的 版本,团队将转向与Istio社区共同合作,来推 进Istio的发展。此外,OSM向云原生计算基 金会(CNCF)申请进行项目归档,目前还未 真正执行。 KSOC推出业内首个实时 Mirantis发布轻量级 Kubernetes发行版k0s v1.27 Docker和Kubernetes开发公司Mirantis发布 了其轻量级开源Kubernete发行版的最新版本 k0s。新版本与全新的Kubernetes 1.27版本 兼容,并进行了各种其他改进和错误修复,版 本特性更新如下: • 兼容Kubernetes1.27; • 支持容器插件,如WebAssembly(WASM) 和gVisor容器沙箱; 使用Gateway API作为其唯一的配置语言来管理 Envoy代理,支持GatewayClass、Gateway、 HTTPRoute和TLSRoute资源。 近日,Envoy Gateway v0.4发布,版本特性更新 如下: • 升级网关API依赖,升级至Gateway API v0.6.2; • 支持通过Helm完成Envoy Gateway安装; • 添加构建初始框架用于扩展Envoy Gateway;0 码力 | 22 页 | 1.99 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021、流量分析等产品。 2020 2021 发布轻舟云原生软件生产力平台、有数全链路数据生产力平台。 网易云品牌升级为网易数帆,发力数字化转型基础软件。 深度参与社区 Spark 3.x 版本开发;开源企业级数据湖探索平台 Kyuubi ;发布首个开源项目分布式存储系统 Curve。 2019 发布全链路数据中台解决方案。 2018 发布轻舟微服务、“瀚海”私有云及国内首款云计算全栈一体机。 流水线 容器部署 主机部署 策略部署 开放 治理 监控 事务 管理 DevOps 多云部署 服务治理 能力扩展 中间件高可用 全链路监控 容器平台NCS 轻舟混合云 多云管理 多集群管理 镜像仓库 容器管理 轻舟低代码 应用管理 可视化开发 WebIDE 一键发布 资产中心 轻舟中间件 中间件PaaS RDS MySQL Redis Kafka RocketMQ 服务化 将企业能力转化为数字化的 服务,打破企业软件应用中数 据孤岛等现状。 敏捷 通过小步快跑的方式敏捷迭 代,不断适应市场与业务需求 的变化,摆脱缓慢的大版本更 新与业务需求脱节的窘境。 高效 通过自动化与生产协作方式 的优化,多环节提升软件生产 的效率。 开放 基于开放的技术体系,打造开 放的软件架构。 轻舟云原生软件生产力平台 2.0 能力全景图 轻舟优势 搭建云原生技术底0 码力 | 43 页 | 884.64 KB | 1 年前3
2023年中国基础软件开源产业研究白皮书围绕许可证可能出现的其他风险 专利风险 数据风险 出口风险 其他风险 开发者商用开源代码时容易出现的违规风险:不同开源许可证对 于二次发行有不同程度的开源要求,要求越严格,开发者越难保护商 业版本发行的机密性,不知情企业闭源发行时越容易有侵权风险 类别一 允许二次闭源发行, 需要保留原始版权 和许可声明 常见许可证: • MIT • Apache2.0 • BDS2.0-clause 软件通过代码类 库引用(软件代 码与引用的源代 码 呈 “ 松 耦 合 性” )的方式 下可以闭源发行 类别三 不允许二次闭源发 行 常见许可证: • GPL ( 其 2.0 版 本不允许闭源发 行,3.0版本在 此之上设置了更 严格的开源要求) • AGPL ( 由 GPLv3修改而来, 开源要求进一步 涉及到了前端、 后端等衍生作品 生态) • 木兰公共许可证 开源许可证类别 6 ©2023 出定制化的行业发行版本。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 两类开源开发者行为差异 参与开源目的 代码贡献特征 付费意愿 平台权益 个人开发者 企业开发者 出于兴趣或求知欲进入 开源社区,希望学习社 区内优秀代码,并与 “大神”交流 以商业视角出发,希望 通过对开源项目的二次 开发形成开源软件的行 业发行版,实现商业收 益 代码贡献多针对于某一 单一模块的能力优化或0 码力 | 43 页 | 4.69 MB | 1 年前3
共 12 条
- 1
- 2













