2021 中国开源开发者报告0 码力 | 35 页 | 36.74 MB | 1 年前3
2023 中国开源开发者报告1 1 /*使用电脑阅读,获得最佳体验 1 1 序 毫无疑问,开源开发者圈子来看,2023 年是大模型 LLM 年、生成式 AI GenAI 年。 一、 这自然要从 OpenAI 说起,前一年年底,ChatGPT 的横 空出世,标志着对话式 LLM 开始进入公众视野,为人们 提供了全新的人机交互方式。而 2023 年 3 月,同系 GPT-4.0 的发布则将 LLM 的规模和能力提升到一个新 模型升级、Adobe 产品整合 LLM 能力、 语音模型 whisper-3 更新、AI 虚拟主播创造等,都是在 这条路上的进一步发展。 五、 AI 编程方面,Copilot 可以根据开发者的代码提示自动补 全代码,大大提高了开发效率。这也引发了代码原创性的讨 论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 个 LLM 十、 镜头给到国内。相比国际上当前逢 AI 必 GenAI,国内更 多地还是在 LLM 这一层面,Robin Li 的“卷大模型没意 义,卷应用机会更大”,其实很深刻地指出了内中区别。 本报告以开发者视角为主,从 LLM 切入,但实际上或多 或少与 GenAI 脱不开关系。 2023 年国内 LLM 发展活跃,从最初的百度文心一言“硬 刚”ChatGPT,到后来各式各样的大模型与产品出现,覆0 码力 | 87 页 | 31.99 MB | 1 年前3
2024 中国开源开发者报告编程工具的进化 62 | AI 开发者中间件工具生态 2024 年总结 66 | AI Agent 逐渐成为 AI 应用的核心架构 68 | 谈开源大模型的技术主权问题 72 | 2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 | Gitee 数据篇 Part 3:国内 GenAI 生态高亮瞬间 104 | 中国 GenAI 消费应用人气榜 Top10 15 | OSS Compass Insight 106 | AI 创新应用开发大赛获奖作品 局长,OSCHINA 副主编 肖滢,OSCHINA 副主编 李泽辰,Gitee 设计:张琪 开发者是开源生态的重要支柱。 本章结合 、 的数据分 析,勾勒 2024 年中国开源开发者的整体画像趋势轮廓,主要 反映中国开源开发者使用开源大模型概况、开源项目/组织健康 度,以及中国开源社区的生态评估等情况。 Gitee 数据篇 本报告数据来源:2024年1月至2024年12月 Gitee及Gitee AI平台相关公开数据 4 / 111 开发者是社区的力量源泉0 码力 | 111 页 | 11.44 MB | 9 月前3
2020 中国开源年度报告
⼀⽅⾯,是开源这么多年⼀直持续的上升势头。⽽另⼀⽅⾯,则是我们的⼀个猜测:疫情以 来,越来越多的⼈开始远程办公,事实上促进了更多的⼈有机会“斜杠化”,也就是在⼀台电脑 ⾯前⽅便地切换多种身份,以异步的⽅式处理多种事务,从⽽增加了开发者参与开源的时间和 机会。 当然,同样由于远程办公,虚拟世界在⼈类⽣活中的占⽐,变得更⼤了。这样是否更好,还会 引发哪些问题?作为站在隧道⼝的⼈类,其实是猜不透的。 2. 中国开源崛起以及开源世界分裂的趋势 年中国开源社区参会调查报告》,随后的⼏年中,持续发 布了开发者调查报告,旨在从多种维度呈现国内的开源发展情况。今年我们再次启程,结合数 据分析⼿段和调查报告等多种形式,绘制⼀份 2020 年中国开源世界的地图。 这份问卷是每年中国开源年报的重要⼀环,不基于调研的分析报告不过是纸上谈兵。在往年的 基础上,我们参考了其他现存的主流开发者问卷内容,并加⼊了⼀些新的视⻆。基于 2020年 COVID-19 通过近 60 项左右问题的统计调查与分析,我们希望能够还原出当前中国开源社区的真实现 状,从⽽为开源的后来⼈提供权威的参考。 调查对象:覆盖开发者、社区成员、贡献者、学⽣、政府企业管理⼈员 调查内容:主要涵盖个⼈信息、⼯作状况、开源社区以及开发者技术 调查⽅法:以在线问卷⽅式搜集样本和数据,交叉对⽐法分析数据 推⼴⽅法:线上社交媒体、博客、开源社、开源中国⽹站 问题数量:590 码力 | 46 页 | 4.09 MB | 1 年前3
Gitea v1.21.1 中文文档Owners Webhooks 受保护的标签 仓库镜像 密钥管理 Multi-factor Authentication (MFA) 开发 玩转 Gitea API 使用指南 OAuth2 提供者 迁移界面 集成 贡献 后端开发指南 前端开发指南 重构指南 本地化 帮助 常见问题 需要帮助 - 4 - 本文档使用 书栈网 · BookStack.CN 构建 致谢 资助,请点击 Gitea. 致谢 - 5 - 本文档使用 书栈网 · BookStack.CN 构建 Gitea 是一个轻量级的 DevOps 平台软件。从开发计划到产品成型的整个软件生命周期,他都能够高效而轻松的帮 助团队和开发者。包括 Git 托管、代码审查、团队协作、软件包注册和 CI/CD。它与 GitHub、Bitbucket 和 GitLab 等比较类似。 Gitea 最初是从 此在性能方面表现出色,适用于资源有限的服务器环境。由于其轻量级设计,Gitea 在资源消耗方面相对较 低,可以在资源有限的环境下运行良好。 易于部署和维护: 轻松地部署在各种服务器上,不需要复杂的配置和依赖。这使得个人开发者或小团队可以方 便地设置和管理自己的 Git 服务。 安全性: Gitea 注重安全性,提供了用户权限管理、访问控制列表等功能,可以确保代码和数据的安全性。 代码评审:代码评审同时支持 Pull0 码力 | 303 页 | 3.88 MB | 1 年前3
普通人学AI指南18 3.3 总结 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 2 4 零代码搭建本地 AI 前端 19 4.1 LobeChat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20 4.2 步骤一安装 docker 8B 和 70B 模型。 图 2,时间线主要根据技术论文的发布日期(例如提交至 arXiv 的日期)来 确定大型语言模型(大小超过 10B)的发展历程。如果没有相应的论文,我们 将模型的日期设定为其公开发布或宣布的最早时间。我们用黄色标记那些公开 可用的模型检查点。由于空间限制,我们只包括那些公开报道评估结果的大型 语言模型。 Figure 2: 各个大型语言模型发布时间线 5 1.4 基础概念 工具,分别包括:问答,图像,视频,AI 编程,AI 提 示词和 AI 大模型,一共梳理挑选共计 38 个 AI 工具,其中很多都是开源! 2.1 问答 2.1.1 ChatGPT ChatGPT 是一个由 OpenAI 开发的大型语言模型,它基于 GPT(Generative Pre-trained Transformer)架构。这种模型通过分析大量的文本数据来学习语 言结构和信息,使其能够生成连贯的文本、回答问题、撰写文章、进行对话等。0 码力 | 42 页 | 8.39 MB | 8 月前3
Moonshot AI 介绍⾼效对⻬⽅法。 ii. 视觉⽅⾯。团队成员发明了MoCo,引爆了基于对⽐学习的视觉预训练范式,也是过去三年 CVPR引⽤量最⾼的⼯作;发明了ShuffleNet,最⾼效的视觉⽹络结构之⼀;主导开发了 detectron2,⼀个被⼴泛使⽤的视觉开源项⽬并被集成到Meta全线VR/AR产品中。 iii. 强化学习⽅⾯。团队成员作为⼀作提出了基于关系学习的少样本⽅法,得到斯坦福⼤学、 Go Google、MIT、Amazon等团队的使⽤和扩展,并获得过OpenAIRL联创及负责⼈John Schulman亲⾃邀请加盟。 iv. 基础设施⽅⾯。团队核⼼成员曾带领数⼗⼈从零开发世界领先的深度学习框架,也具备数千 卡集群全⾃动化硬件运维告警、数百亿特征检索、⼤规模(数⼗PB数据、百万台机器)分 布式系统数量级性能优化的经验。 c. ⽬前团队⼈数超过80⼈,每个⽉都有在全球某个领域有显著影响⼒的⼈加⼊。 ⽕,甚⾄即使今天,losslesslong-context仍然不是⼀个共识。但如果今天才看到这个事情,已经没 有⾜够多的时间去迭代,最后会变成跟随者。 第⼆点是能够很深刻的理解AI-Native产品的开发⽅式,然后基于新的⽣产⽅式适配⼀套组织。以前做 产品是通过了解⽤⼾的需求设计功能,新时代需要在制造的过程中完成设计。ChatGPT就是通过制造 完成设计,并没有先设计出来⼀堆场景再找对应的算法0 码力 | 74 页 | 1.64 MB | 1 年前3
2021 中国开源年度报告………………………………………………………………………… 19 3.7 开发语言 …………………………………………………………………………………………… 20 3.8 Java 开发框架 ……………………………………………………………………………………… 21 3.9 PHP 开发框架 ……………………………………………………………………………………… 21 3.10 Ruby 开发框架 …………………………………………………………………………………… ………………… 22 3.11 Go 开发框架 ……………………………………………………………………………………… 22 3.12 Node.js 开发框架 ………………………………………………………………………………… 23 3.13 Python 开发框架 ………………………………………………………………………………… 23 3.14 前端开发框架 …………………………………………………………………………………… 数据库……………………………………………………………………………………………… 25 3.16 版本控制工具 …………………………………………………………………………………… 26 3.17 AI 开发框架 ……………………………………………………………………………………… 26 3.18 云原生组件 / 工具 ………………………………………………………………………………… 27 4 开源社区参与现状0 码力 | 132 页 | 14.24 MB | 1 年前3
202402 DataEase 嵌入式版介绍嵌⼊式 BI 可以给 ISV 带来哪些价值? 在企业数字化转型的背景下,嵌⼊式 BI 为 ISV 提供了新的竞争优势和成⻓空间。 提升产品差异化 提⾼⽤户吸引⼒ 提升销售展示效果 提⾼软件开发效率 提⾼交付效率 增加收⼊ 2 1 嵌⼊式 BI 可以给 ISV 带来哪些价值? 3 嵌⼊式 BI 的应⽤场景 4 DataEase 嵌⼊式 BI 的优势 DataEase 嵌⼊式版嵌⼊流程 整体嵌⼊ DIV URL Iframe 前端技术层 DataEase 开源数据可视化分析平台 RESTful API JavaScript API 仪表板管理 数据⼤屏管理 数据集管理 数据源管理 ⽤户管理 组织管理 ⻆⾊管理 权限管理 前端事件交互 平台 API 层 注:JavaScript API 当前尚不⽀持,后续根据需求情况再进⾏开发。 图表嵌⼊ 将单个图表 / 表格嵌⼊到系统中,辅助⽤户进⾏决策。 Secret DataEase 嵌⼊式版嵌⼊流程 提供⽤户名、 APP ID 、APP Secret ⽣成 Token 前端引⼊ DataEase 提供 的前端 JavaScript 获取仪表板 /数 据⼤屏 / 图表 ID 编写前端代 码,完成嵌⼊ DataEase 嵌⼊流程 I 获取嵌⼊式应⽤的 APP ID、APP Secret 注:跨域是指两个域名不同0 码力 | 30 页 | 11.06 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书基础软件开源界限划分 操作系统、数据库、中间件、AI框架底层代码按规范进行共享与协作 本篇报告研究的基础软件开源范围,是指研究“开源”中“基础软件”板块的情况。开源过程中,参与者可以共享、协作完成开发, 正好与基础软件庞大的开发量需求相契合。这种契合性促进了基础软件良性、可持续性发展,并因为基础软件对上层软件生态有支 撑作用,基础软件的开源价值远超过单一产品的范畴,其意义惠及软件产业全领域。 注释:由于暂无 基础软件 具备能衍生出并支撑 多个技术簇的一类根 技术软件,拥有技术 门槛高、衍生场景复 杂等特点 中间件:不同系统和应用程序之间交互 与协作的桥梁 AI框架:具备构建和部署人工智能模型 的基础的全套开发工具 操作系统:是软硬件资源的资源管理者, 为用户与应用程序提供交互接口 数据库:通过对数据的访问与管理,支 持各种应用程序和业务的需求 编程语言:人与计算机交互的“语言”, 含编译器、基础编程语言、IED等 使用开源许可证需注意的风险点 审判机关 开发者 开源许可证 “两者的契约” 开源者 将许可证视为“合同”,基于《著作权法》、 《专利法》等法律法规对相关纠纷进行判决 围绕许可证可能出现的其他风险 专利风险 数据风险 出口风险 其他风险 开发者商用开源代码时容易出现的违规风险:不同开源许可证对 于二次发行有不同程度的开源要求,要求越严格,开发者越难保护商 业版本发行的机密性,不知情企业闭源发行时越容易有侵权风险0 码力 | 43 页 | 4.69 MB | 1 年前3
共 169 条
- 1
- 2
- 3
- 4
- 5
- 6
- 17













