2024 中国开源开发者报告机协同”。在如何构造大批量、高质量的合 成数据,让智能体能够在持续地与用户的交互中自我优化而不是劣化,将会成为众多无机器学习 技术背景的开发者的头号难题。 因此,面向数据进行定制化合成、评估、测试、标注、人机协同的“纯数据”产业,有可能 会走上越来越重要的位置,不仅仅是服务于基座模型厂商。 4. 多模态对齐很可能给基座模型带来质的提升 最新研究发现,在没有预先约束和约定下,不同 模态 调试任务、自主查找和修复代码库中的错误,构建和部署应用程序。在 SWE-bench 编码基准测 试中,Devin 能够解决 GitHub 中 13.86%的真实问题,有了很大提升。 说起 SWE-bench 编码基准测试(https://www.swebench.com/),2024 年进步很快,以 OpenAI 建立的 verified 子集(500 个问题)为例,4 月开始时,成功率只有 2.8%,到现在已 有些开发团队借助智能体和 RAG 技术检索历史上已知的代码缺陷模式和已知问题,从而比较 准确地识别潜在的缺陷和安全漏洞,甚至能够分析代码的功能意图,全面提升代码评审的能 力。 有些团队,根据 UI 设计图,让 LLM 自动生成相应的前端代码,大大减少了手动编码的时间, 加快了从设计到实现的流程。 43 / 111 从应用效果看,前面调研的数据可供参考。在国内 AI 编程开展比较好的大厂,超过0 码力 | 111 页 | 11.44 MB | 8 月前3
2023 中国开源开发者报告刊发表,获得国际学术界的认可。 年底,零一万物推出的 Yi 模型,200K 上下文窗口,可处 理约 40 万字的文本,成为当时全球大模型中最长的上下文 窗口。其中 Yi-34B 在 Hugging Face 英文测试榜单中位 列第一,在 C-Eval 中文能力排行榜中超越所有开源模型。 十一、 这一小节,通过一些数据来简要概述 2023 年的 LLM、 GenAI。根据金融数据和软件公司 PitchBook 采用者仍处于早期阶段:26% 的人使用 AI 不到一年,而 18% 的人已经在生产中进行了应用。 16% 从事 AI 工作的受访者表示正在使用开源模型。 意外结果、安全性、公平性、偏见和隐私是采用者测试 的最大风险。 工业和信息化部赛迪研究院数据显示,目前,我国已有超 过 19 个大语言模型研发厂商。其中,15 家厂商的模型 产品已经通过备案,预计今年我国大语言模型市场规模将 达到 132 开源开发者事件回顾 Auto-GPT 横空出世,席卷 AI 圈 “零一万物”发布 Yi 系列开源大模型 Vercel 发布"v0":根据文本生成 UI 代码 v0 是一款根据文本生成 UI 界面代码的 AI 产品,只要输入文字提示,即可生成 需要的 UI 组件界面。 智谱 AI 开源 ChatGLM-6B 大模型 GPT-4 发布不久后,一款让这个最强大语言模型能够自主完成任务的开源项 目——Auto-GPT0 码力 | 87 页 | 31.99 MB | 1 年前3
Moonshot AI 介绍产品是通过了解⽤⼾的需求设计功能,新时代需要在制造的过程中完成设计。ChatGPT就是通过制造 完成设计,并没有先设计出来⼀堆场景再找对应的算法。Kimi的⽤⼾⾃⼰去上传简历然后做筛选,也 是我们上线之前完全没有测试过的⽤例。 资源获取肯定也很重要。其中主要烧钱的是算⼒。早期靠融资,到后⾯就需要更多的产品商业化。商 业化也不能照搬上⼀个时代成熟的东西创新,所以好的CEO和团队应该有⼀定经验,但同时也有很强 这是⼀个⾮常经典的关于⻓⽂本能⼒的测试:⼤海捞针。 什么意思呢?我会给模型⾮常多的⽂档,我会在随机在⽂档⾥⾯去插⼊⼀句话。⽐如说北京最好的事 情是什么,北京最吸引⼈的点是什么?你在⽂档⾥⾯去插⼊这句话,然后他你这样你就可以得到⼀个 实验,就是说你在不同的⻓度,在你不同的插⼊位置的情况,他的回答的准确率到底是什么样。 左边是GPT4的结果,这是在Twitter上⾮常⽕的⼀个测试。简单的说,就是你这个图⾥⾯红点越少越 同时涌现的。 那我们在AI时代应该怎么去做PMF呢?第⼀,很重要的还是要去利⽤模型的泛化能⼒。回到我们上⾯ 说⽤Kimi智能助⼿筛简历的例⼦,其实在我们的产品上线之前,我们内部是从来没有做过测试,也没 有做过任何专⻔的优化,它其实是模型涌现出来的⼀个能⼒。 当你的底层InstructionFollowing、多步推理、处理上下⽂,上下⽂⼀致性等底层能⼒得到提升的时 候,它其实会带来0 码力 | 74 页 | 1.64 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)Envoy Gateway v0.4发布 Envoy Gateway是用于管理Envoy Proxy的开源 项目,可单独使用或作为Kubernetes中应用的 网关。它通过了Gateway API核心一致性测试, 使用Gateway API作为其唯一的配置语言来管理 Envoy代理,支持GatewayClass、Gateway、 HTTPRoute和TLSRoute资源。 近日,Envoy Gateway 计算基金会(CNCF)。 近日,Flagger v1.31.0发布,版本特性更新 如下: • 支持服务网格Linkerd 2.12及更高版本; • 修复Flux文档中有关安装loadtester的错误; • 删除OSM测试。 D2iQ Kubernetes Platform v2.5 发布 D2iQ Kubernetes Platform(DKP)是适应生 产环境的企业级自主可控Kubernetes平台。 DKP 度将 发布第三阶段的更新,该更新将默认启用修复 程序,届时将导致旧的Windows启动媒介将会 无法使用。 AI Village创始人Sven Cattell表示,“只有让更 多的人了解如何开展红队测试和评估人工智能模 型,才能解决这些模型中的各种问题。”通过对 人工智能模型组开展最大规模的红队演习,AI Village和DEF CON希望能培养出处理人工智能 系统漏洞的研究者社区。事实证明,大语言模型0 码力 | 22 页 | 1.99 MB | 1 年前3
Gitea,新一代的代码托管平台2023.12 飞致云 & 上海吉谛 软件开发 软件测试 运维审计 BI分析 广受欢迎的堡垒机 Star 22,400+ 一站式持续测试平台 Star 10,300+ 人人可用的数据可视化分析工具 Star 13,400+ 2023年11月,飞致云与上海吉谛达成战略合作,获得 Gitea 企业版中国大陆地区独家代理权, 向中国数字化团队交付被广泛验证、可信赖的通用工具软件。 新一代的代码托管平台 04 创建合并请求 提交 pull request 到分支 05 . 审查与合并 Team Lead 对提交的 PR 进行代 码审查,通过后进行合并 06 发布 在分支上进行持续集成、测试验 证并最终通过 release 分支发布 为团队和开发人员提供从规划到生产的高效且易用的使用体验 Gitea 核心能力:代码仓库 仓库管理 创建和管理仓库、浏览提交历史和代码文件、审查和合并代码提交、管理协作者、 通过灵活的配置满足不同应用场景的需求 安全稳定 被⼴泛验证,39k+ GitHub Star、40万+ 安装量、 1000+ 贡献者,覆盖 1000万+ 开发者 Gitea 优势总结 极佳体验 • 在 UI 上与 GitHub 采用类似的风 格设计; • 在使上与 GitHub 保证一致的使用 体验。 风格兼容 • API 高度兼容:大部分 GitHub 第 三方应用可复用; • Actions0 码力 | 30 页 | 14.34 MB | 1 年前3
2020 中国开源年度报告
前 端、AI 以及⼤数据分析⽅向,占⽐分别为10%、9%、9%,⾮技术⼈员以及其他⾏业的 从业者占⽐均为 7%,说明开源已经越来越受到社会各界的关注; 参与开源的形式由 2019 年以代码和测试为主转变为以代码和⽂档为主,社区和项⽬正在 意识到⽂档的重要性,更多开源贡献者投⼊到了⽂档撰写中; 开源活动的参与频率相较往年有所上升,这与国内愈发繁荣的开源氛围和逐渐丰富的开源 活动也有关系。81% 以巨⼤优势,成为参与者最喜爱的开源产品,MySQL 紧随其后,Apache 和容器界的⿊ ⻢ Docker 分别位列第三、第四。 5.3 具体参与的社区⼯作 绝⼤多数参与者在社区都参与代码或⽂档撰写的⼯作,测试、本地化以及活动组织也是很多⼈ 在社区会参与的⼯作。 5.4 最看好的开源产品 开源产品的前景展望中,互联⽹产品以 34% 的⽐例成为参与者最看好的开源产品发展⽅向。 ⼈⼯智能和开发⼯具异军突起,成为现在开源产品中的⻛⼝和热点。 ApolloAuto/apollo 也榜上有名。 中国的 Top50 项⽬列表中,包括阿⾥的 Ant-Design 组件库,京东基于 React 前端框架的 开发框架 taro,由饿了么(已被阿⾥收购)前端团队开源的 Vue UI 组件库 Element 等等, 这说明在国内,前端群体在开源社区更为活跃;另外前端代码⼀般也不太涉密,因此公司在⼼ 态上更开放⼀些。不过这其中也有⼀点需要引起注意,上榜的前端项⽬组件库居多,但是缺少0 码力 | 46 页 | 4.09 MB | 1 年前3
2021 中国开源年度报告前端开发框架的使用中,Top5 分别是 Vue.js,JQuery,React,Element UI 和 Bootstrap。 The Top5 front-end development frameworks in use are Vue.js, JQuery, React, Element UI and Bootstrap. 【专家点评】/ [Expert Comment] projects. 4.3 参与开源社区的工作 / 4.3 Participation in the open source community 绝大多数受访者在社区都参与代码或文档撰写的工作,测试、本地化、活动组织以及媒体宣传 也是很多人在社区会参与的工作。 The vast majority of respondents are involved in writing code or 餐 与两个收费套餐,分别针对社区开源用户、中小企业与大型企业。免费套餐主推面向大众用户 的 Create 和 Verify 模块,两个收费套餐分别增加了版本控制、运营分析、项目管理与进阶安 全测试、产品组合管理、合规规划等内容。订阅模式分为建立在公有云上的 SaaS 服务与企业 本地管理,在企业本地管理的情况下,企业可以根据情况 将 GitLab DevOps 平台建立在私有 云或者混合云上0 码力 | 199 页 | 9.63 MB | 1 年前3
2021 中国开源年度报告开发框架使用情况中,Django 和 Flask 遥遥领先。 24 3.14 前端开发框架 前端开发框架的使用中,Top5 分别是 Vue.js,JQuery,React, Element UI 和 Bootstrap。 专家点评 段夕华:这个数据有点意思,React 居然屈居 Vue 之后,好像跟国外的统计数据不太一致。不知道是样本容 量问题,还是因为国内开源项目对华人发起的 Vue 堵俊平:用户是大部分人接触开源的首要角色,也是最重要的角色。对开源项目而言,有独创性的特色功能是 引发大众关注和使用的关键。 30 4.3 参与开源社区的工作 绝大多数受访者在社区都参与代码或文档撰写的工作,测试、本地化、 活动组织以及媒体宣传也是很多人在社区会参与的工作。 专家点评 堵俊平:“Community over Code”, 开源社区的工作不只是代码,代码以外的工作占的比例更高。另外, 费套餐与两个 收费套餐,分别针对社区开源用户、中小企业与大型企业。免费套餐主推面向大众用户的 Create 和 Verify 模块,两个收费套餐分别增加了版本控制、运营分析、项目管理与进阶安全测试、产品组合管理、 合规规划等内容。订阅模式分为建立在公有云上的 SaaS 服务与企业本地管理,在企业本地管理的情况 下,企业可以根据情况 将 GitLab DevOps 平台建立在私有云或者混合云上0 码力 | 132 页 | 14.24 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021国家级博士后科研工作站 云计算技术认证资质 信通院可信云服务网格先进级(最高级别)评估 信通院数字化可信服务能力认证(轻舟低代码平台) 可信云微服务评估先进级认证 Kubernetes 一致性认证 华为鲲鹏计算兼容性测试认证 大数据技术机构资质 信通院大数据技术标准推进委员会成员 大数据系统软件浙江省工程实验室 浙江省网易大数据重点企业研究院 浙江省云计算和大数据省级企业研究院 人工智能技术机构资质 浙江省增强现实与智能交互工程技术研究中心 CSA STAR Certification 2013 服务管理认证 CMMI (三级) 认证 大数据技术认证资质 信通院第十二批“大数据产品能力评测”(有数BI) 工信部一所信创适配测试认证 华为鲲鹏技术兼容性测试认证 QUALIFICATION 数帆资质(部分) 06 及以前 《Gartner 2020 中国 ICT 技术成熟度曲线》数据中台领域标杆厂商 信通院“大数据'星河'案例-行业大数据应用优秀案例” 代码级的依赖,需要全量测试 测试回归周期长 代码修改对整个应用有影响,需要全量测试 无法有效对需求快速变化 单一技术架构 技术演进需要全部重写,成本高 开发效率 编译时间 测试周期 应对需求变化 技术演进 对比项 微服务应用 基于服务接口的依赖 各服务间独立开发,开发效率高 微服务独立编译 编译时间短 基于服务接口的依赖 仅需要测试相关服务,测试回归周期短 仅相关服务需要开发0 码力 | 43 页 | 884.64 KB | 1 年前3
2023年中国基础软件开源产业研究白皮书码,并查看其他开源发 起者的公共代码 愿意为基于开源项目的 服务或商业版付费,期 望查看更完整、硬核的 代码。同样地,将自身 代码设置为收费,获得 收益 仅使用代码托管平台中 的基本权益,如代码审 查、测试、版本管理、 关联仓库等 享受平台增值服务,包 括关键指标统计、操作 日志管理、关键行为监 控,方便社区内开发者 的协同开发 15 ©2023.11 iResearch Inc. 操 作 系 统 开 源 社 区 常 见 小 组 分 布 操 作 系 统 适 配 生 态 概 览 技术类 语言 基础功能 中间件 图形/桌面 架构/内核 云原生基础设施 安全 测试 行业解决方案 治理类 职能组织 社区基础设施 版本发行 社区生态管理 服务器 云计算 边缘计算 智能终端 桌面 … 操作系统应用场景 处理器 … 服务器 端设备 内存 服务治理类 提供了服务注册与发现、负载均衡、熔断降级等功 能,用于构建和管理微服务架构 Pebble 其他类 分布式事务类 解决分布式系统中 事务一致性问题 中间件开源图谱 应用测试类——主要负责测试应用性能、发现问 题或提前演练以预防故障、优化程序:如QTFA、 Arthas、ChaosBlade; 安全类——涵盖防恶意请求、加密、认证授权、 审计等功能:如Tongsuo、Kona;0 码力 | 43 页 | 4.69 MB | 1 年前3
共 24 条
- 1
- 2
- 3













