2023 中国开源开发者报告Claude,包含 520 亿个参数。 与 ChatGPT 类似,Claude 能够执行各种基于文字对话的任务,如文档搜索、 摘要、写作、编码,以及响应用户的提问。 四个月后,Anthropic 推出 Claude 2。Claude 2 改进了性能,响应时间更长, 可通过 API 访问。此外还上线了面向公众的 beta 网站 claude.ai。 2023 年 3 月 14 日,OpenAI 正式推出 务型产业场景,解决真实产业问题。 2023 年 6 月,百度智能云推出了基于大模型的 “Comate”代码助手。 借助文心大模型的理解、推理能力,“Comate” 可实现代码的快速补齐、自然语言推荐代码、 自动查找代码错误,全面提升开发者研发效率。 谷歌官宣 ChatGPT 竞品:Bard 2023 年 4 月,陈天奇团队(MLC)发布了一个可将大型语言模型和基于 LLM 的聊天机器人引入 Web 浏览器的项目:Web 在完成该项目的 3.0.0 版本发布后 表示,由于资金短缺,其未来的功能开发或将受到限制,可能永远不会有 libjpeg-turbo 3.1 版本。 他将继续修复 libjpeg-turbo 中的错误,并在 3.0.x 发行版系列中发布错 误修复版本;但不会再有 libjpeg-turbo 3.1 发行版系列,除非该项目可 以获得更多的通用资金。 自 2024 年 8 月 31 日起, Visual0 码力 | 87 页 | 31.99 MB | 1 年前3
Moonshot AI 介绍实验,就是说你在不同的⻓度,在你不同的插⼊位置的情况,他的回答的准确率到底是什么样。 左边是GPT4的结果,这是在Twitter上⾮常⽕的⼀个测试。简单的说,就是你这个图⾥⾯红点越少越 好。红点多就表⽰你在这种情况下回答可能是错误的,可以看到,上下⽂⻓度变⻓之后,它其实对⽂ 档前半部分的理解,它是会出现⾮常多误差的。 我们把⼀样的实验放在Kimi智能助⼿⾥⾯。可以看到,除了左下⻆有⼀个红点之外,其他所有地⽅都 是绿的 理解模型还是⽣成模型,但现在不需要了。 36氪:不过,现在有很多团队的技术路线,可能会先做⽂字理解,在理解这⼀端做得更多些,⽣成可 能会靠后⼀点。 杨植麟:这些思考⽅向不够本质。现在任何说“只能做理解⽽⾮⽣成”都是错误的⽅向。正确的⽅向 应该是:理解和⽣成就是⼀个问题。如果能做很好的理解,那能做很好的⽣成,这两个应该是完全等 价的。 36氪:相当于这两者⽆法分开来。 杨植麟:对的。现在就只有⼀个问题。⽐ outsidethedocument”。 根据经验,在基于⽂档的问答场景下,新的Prompt表意更加明确。 在第⼆次实验中,Kimi智能助⼿虽然没有得到“全绿”那么惊艳的结果,但修改Prompt之后错误情 况的波动也在我们的预期之内 我们同样测试了在新的Prompt下,GPT-4Turbo表现: 以及Claude2.1的表现: 跟原始实验结果相⽐,GPT-4Turbo0 码力 | 74 页 | 1.64 MB | 1 年前3
2024 中国开源开发者报告开发者大会上放言“开源模型会越来越落后”。前 文我有提到,此时此刻的技术先进性并不重要。甚至在计算机发展史上,很多领域中笑到最后的 产品,并不是技术上最先进的。抛开成本和易用性,空谈技术先进性是最常见的错误。 那么具体到大模型领域,闭源与开源,两种方法孰优孰劣?我的回答是采取什么方法因人而 异,但开源会更有优势。 大模型赛道的核心制约条件是成本太高——训练成本高,运行成本高。如何尽可能降低成本, 、Gemini 虽然各有所长,但实际体验越来越让大家分不出差异,基座模型作为智能体核心,决定了智能体 效果下限,人人训练基座的可能性越来越低,“基座服务化”很可能是最合理的商业模式。 甚至,在错误不敏感的应用领域,出现一个开源、无商业限制的基座的可能性也很高。小应 用开发商很可能很容易获得一个低成本 serving 的“量化小基座”。 “7B”是一个 magic number!无论是 RAG 数据很可能需要显式地蕴 含任务思考和规划的拆解信息。然而,针对合成数据的问题,学术界早有预警,模型可能会在合 成数据上的持续训练中崩坏【14】。 33 / 111 这是因为合成数据往往携带“错误”和“幻觉”,在一些冷门的知识上尤甚。因此,合成数 据的实用秘诀是“去粗取精”,需要一定程度的“人机协同”。在如何构造大批量、高质量的合 成数据,让智能体能够在持续地与用户的交互中自我优化而不是劣化,将会成为众多无机器学习0 码力 | 111 页 | 11.44 MB | 8 月前3
2021 中国开源年度报告项目本质,从而吸引开发者参与。 并且要积极进行社交网络的运营,例如维护公众号等社交媒体,发表高质量的技术文章,以解决问题的 心态帮助开发者等等。对 GitHub 社区应该进行及时的响应与维护,对开发者需求及时响应,定期维护 2021 中国开源年度报告 95 代码,及时更新说明文档。除此之外还应拓宽渠道推广,不断加强 SEO,增加项目线上曝光度和易得度。 线下的运营方式包括 :通过定期举行社区 软件发布源漏洞 攻击者可利用该漏洞进行供应链 攻击 XSS 蠕虫并实现远程代码执 行(RCE) 7 2021 年 7 月 攻击者获得 Kaseya 公司 后端设施访问权限,在运 行于客户现场的安全事件 响应工具 VSA 服务器上部 署 REvil 勒索软件 软件产品自身漏洞 通过 VSA 服务器将勒索软件安装 到联网工作站,从而感染其它第 三方企业网络。攻击发生前,互 联网上处于联网状态的 VSA 服务 集群,接管平台上的其他客 户的容器,在其中执行代码并访 问部署在平台上的数据 10 2021 年 12 月 Apache 开源项目 Log4j2 的远程代码执行漏洞细节 被公开 开源软件漏洞 可能的受影响应用包括但不限于: Spring-Boot-strater-log4j2、 Apache Struts2、Apache Solr、Apache Flink、Apache D r u i d 、 E0 码力 | 132 页 | 14.24 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)全态势管理平台。Kubernetes安全态势管理平 台可以通过实时上下文以及当前和历史信息准 确定位攻击活动,同时还可以根据集群的当前 状态提供可操作的补救措施。具体功能包括: • 实时态势管理,发现基于事件的错误配置; • 汇总并找到Kubernetes RBAC中的过度权限; • 防止部署不合规的工作负载,减少潜在爆炸 半径; • 扫描漏洞并为运行的容器生成SBOM。 OpenSIL的目标不是取代UEFI,而是集成在 Docker和Kubernetes开发公司Mirantis发布 了其轻量级开源Kubernete发行版的最新版本 k0s。新版本与全新的Kubernetes 1.27版本 兼容,并进行了各种其他改进和错误修复,版 本特性更新如下: • 兼容Kubernetes1.27; • 支持容器插件,如WebAssembly(WASM) 和gVisor容器沙箱; • k0s将用自建的镜像来运行所有的系统组件; 计算基金会(CNCF)。 近日,Flagger v1.31.0发布,版本特性更新 如下: • 支持服务网格Linkerd 2.12及更高版本; • 修复Flux文档中有关安装loadtester的错误; • 删除OSM测试。 D2iQ Kubernetes Platform v2.5 发布 D2iQ Kubernetes Platform(DKP)是适应生 产环境的企业级自主可控Kubernetes平台。0 码力 | 22 页 | 1.99 MB | 1 年前3
2021 中国开源年度报告目本质,从而 吸引开发者参与。并且要积极进行社交网络的运营,例如维护公众号等社交媒体,发表高质量 的技术文章,以解决问题的心态帮助开发者等等。对 GitHub 社区应该进行及时的响应与维护, 对开发者需求及时响应,定期维护代码,及时更新说明文档。除此之外还应拓宽渠道推广,不 断加强 SEO,增加项目线上曝光度和易得度。线下的运营方式包括:通过定期举行社区 meetup 等线下交流活动, 攻击者可利用该漏洞进行供 应链攻击 XSS 蠕虫并实现远 程代码执行(RCE) 7 2021 年 7 月 攻击者获得 Kaseya 公 司后端设施访问权限, 在运行于客户现场的安 全事件响应工具 VSA 服务器上部署 REvil 勒 索软件 软件产品自身漏 洞 通过 VSA 服务器将勒索软件 安装到联网工作站,从而感 染其它第三方企业网络。攻 击发生前,互联网上处于联 的其他客户的容器,在其中 执行代码并访问部署在平台 上的数据 10 2021 年 12 月 Apache 开源项目 Log4j2 的远程代码执 行漏洞细节被公开 开源软件漏洞 可能的受影响应用包括但不 限于:Spring-Boot- strater-log4j2、Apache Struts2、Apache Solr、 Apache Flink、Apache Druid、Elasticsearch、0 码力 | 199 页 | 9.63 MB | 1 年前3
中国开源软件产业研究报告考虑软件的商业化能力, 需要关注开源软件所选用 的许可证协议,避免出现 如GPL系列许可证带来的 开源传染性问题 开源许可证 软件是否具备完整的开源 方案日志、服务商能否为 客户提供技术支持,能否 及时响应客户需求,是否 提供权益保障服务…… 运维能力 开源软件所使用的技术是 否与未来科技发展方向相 适应 技术先进性 开源的源代码增长速度及 数量极其惊人,企业拥有 多种选择,对不同版本进 行甄别,选择契合市场的 www.iresearch.com.cn 来源:艾瑞咨询研究院自主研究及绘制。 产业环境:政策引导 开源在十四五发展规划中被首次提及,各省响应出台政策 发布时间 发布单位 政策名称 关键内容 2021.10 国务院 《“十四五”国家知识产权保护和运用规 划》 健全大数据、人工智能、基因技术等新领域新业态知识产权保护制度。研 究构建 促进。 Apache软件基金会:项目成熟度模型 CNCF毕业标准1.2版本 共5条,主要强 调项目的开源 属性,代码的 可靠性 以及可 获得性 共5条,强调软 件项目的安全 性、兼容性 以 及对错误的响 应和修复机制 共5条,强调项 目的发布过程 可靠并便于获 取 共5条,强调项 目遵循Apache 开源许可证 , 并具备可靠的 版权约定 代码 独立 共识 许可证 发布 质量 社区0 码力 | 68 页 | 3.63 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021提升了不同产品线的信息交互效率。轻舟云原生平台使我们统一 了企业信息化标准,降低了运维难度,并提升了平台的稳定性和可 扩展性,改善了用户体验。后续将继续基于轻舟进行共享能力中 心的沉淀,加速前端业务需求的响应速度,构建企业信息化服务 资产体系。 信息科技部 屠经理 大华股份 网易数帆与海亮的合作是基于海亮自身的业务需求出发的,在与 网易的合作中,有数团队根据我们的实际情况,协助制定了数据 分析平台、 用于客服对话机器人、搜索、舆情分析 等场景。 23 SOLUTIONS 解决方案篇 SOLUTIONS 核心能力共享 构建服务共享中心,解决企业信息系统孤岛问题。 产品快速创新 快速响应需求变化,提升企业业务创新速度。 系统长期稳定 系统微服务化解耦,实现系统长治久安。 业务持续在线 提升产业信息化程度,实现核心业务实时、在线、统一。 方案价值 基于云原生技术栈 网易多年实践落地 深度挖掘数据资产价值,赋能金融机构经营管理、客户旅程、产品运营、 风险管理等全价值链业务场景,助力金融机构数智化高效决策。 完善治理 助力创新 构建统一数据平台,实现数据资源汇总整合,数据资产协同使用,极速 响应业务发展需求,助力金融业持续创新。 完善企业级数据资产管理与治理体系,强化数据质量管理、数据安全 管理,满足监管合规要求。 方案架构 敏捷易用 安全稳定 深度洞察 开放兼容 数据应用 数据/AI中台0 码力 | 43 页 | 884.64 KB | 1 年前3
2023年中国基础软件开源产业研究白皮书更容易吸引硬核开发者的加入,长期来看将在社区能力值、成 长性及活跃度方面得到体现。 来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 数据库开发者开源贡献特征 数据库指标提升 响应时间 并发能力 吞吐量 … 性能 数据备份 数据恢复 故障切换 … 可靠性 编程语言 系统接口 … 兼容性 存储 引擎 数据库内核 修改计算引擎支 持语法扩充 修改存储协议支 是体现社区为开发者提供服务与支撑的衡量指数。与开发者通过代码在前端 协同开发相对,此指标可看做是对开源后勤保障系统的整体性评估 更新 Issue 数量 关闭 PR 数量 Issue 首次 响应时间 Bug类Issue 处理时间 Issue 评论频 率 … 组织活跃度 用于评估社区中组织(商业公司、高校等)的活跃程度,体现开源社区与外界的连接与互动。指标越高,社区围 绕自身构0 码力 | 43 页 | 4.69 MB | 1 年前3
Gitea,新一代的代码托管平台SSH 依赖项扫描 数据安全备份 分布式高可用部署架构 AutoScale Runner 统计度量 国产信创适配 企业级支持服务内容(基础级) 支持服务 5×8 工单及电话支持服务,4 个小时内响应客户工单;接到故障申报后,工程师通过电话支持、远程接 入等方式协助客户及时排除软件故障。 安装架构 单机架构。 培训方式 提供离线视频、远程会议的培训。 软件升级服务 提供软件 X-Pack 增强功能包,小版本无缝升级服务。0 码力 | 30 页 | 14.34 MB | 1 年前3
共 12 条
- 1
- 2













