2024 中国开源开发者报告98%以上。比直接把大文本扔进同一个 LLM 测试的问答准确率 几乎高出 14 个百分点。 有同学会说,LLM 幻觉的深层原因是 temperature 或者说概率引起的。就我纯个人观点来 看,现当下的 LLM 参数足够大、知识量足够多,temperature 引起的偏差对于最终结果的正确 性影响已经微乎其微了。 (三)市场表现 你应该看出来了,在 RAG 和微调之间,我明显站队了,而且从一年前就开始站队了,我们 日,开放源代码促进会(Open Source Initiative,OSI)发布了关于“开 源 AI 定义(OSAID)”1.0 版本,其规定了 AI 大模型若要被视为开源必须具备三个三个:训练 数据透明性、完整代码、模型参数。虽然对比目前市面上的“开源模型”,少有能力较高的模型 能完全符合,但这种声明本身就是一种开源开放态度的彰显。 我相信,在更加透明的数据集和算法的支持下,模型将在可控性上获得更好的发展机遇,相 应用 的不同环节。 第三个阶段,一些产品团队正探索开发完全由大模型驱动的代理应用。这类代理应用具备从 历史记忆中反思、自主规划和使用工具执行特定动作的能力。大语言模型负责选择要调用的工具 及其参数,而具体的执行动作则在沙箱环境中进行,以确保安全。 E2B、Modal 等服务提供商正是为了满足这一需求而诞生。代理通过 OpenAI 定义的 JSON 模式调用工具,这使得代理和工具能够在不同的框架中兼容,促进了代理工具生态系统0 码力 | 111 页 | 11.44 MB | 9 月前3
2023 中国开源开发者报告的 GPT-4 更先进。 Meta 开源Llama 2 2023 年 3 月 15 日,由 OpenAI 前成员创立的 Anthropic 发布对话 AI 产品 Claude,包含 520 亿个参数。 与 ChatGPT 类似,Claude 能够执行各种基于文字对话的任务,如文档搜索、 摘要、写作、编码,以及响应用户的提问。 四个月后,Anthropic 推出 Claude 2。Claude 这是蚂蚁自研的代码生成专属 大模型,帮助开发者自动生成代 码、自动增加注释、自动生成测 试用例、修复和优化代码等。 2023 年 8 月,阿联酋研究团队宣布开源阿拉伯语大模型 Jais。Jais 是一个 经过 130 亿个参数预训练的阿拉伯语和英语双语大型语言模型,在包含 720 亿个阿拉伯语词块和 2790 亿个英语 / 代码词块的数据集上进行训练。 谷歌发布 AI 代码编辑器:Project IDX 2023 年 某天再度出现了严重的宕机故障——无法打开任何图片和链接。 具体表现为,当用户在推特上加载图片和点击链接时会返回错误信息,称 “您当前的 API 不包括对此端点的访问权限”。 消息人士表示,此次事故由一名工程师修改配置导致,据称马斯克知道此 事后直接暴怒。 ChatGPT 服务中断 2 小时 北京时间 11 月 8 日晚 22 点左右,OpenAI 旗下 ChatGPT 以及相关 API 出现 中断故障,导致面向用户和开发者的服务近0 码力 | 87 页 | 31.99 MB | 1 年前3
Moonshot AI 介绍才会提升模型的能⼒。 杨植麟:你可以认为带MoE和不带MoE是两条scalinglaw。本质上scalinglaw刻画的是loss跟参 数量之间的关系。MoE改变了这个函数,让你能够⽤更⼤的参数,但同时FLOPs不变。合成数据改变 的是另⼀个关系,FLOPs不变的情况下让数据规模增⻓。 沿着scalinglaw⼀直⾛是个有确定性的事情,⼤家通过试图改变scalinglaw⾥的具体关系来获得更 ⼀个统⼀的表⽰空间以及可规模化的数据⽣产。 海外独⻆兽:如果算⼒⾜够,会有⼈想做⼀个万亿参数的densemodel吗? 杨植麟:取决于推理成本的下降速度,但我觉得肯定会有。现在⼤家是因为推理成本太⾼,所以都在 做tradeoff。但是最终直接训练⼀个万亿的densemodel肯定效果会⽐⼀个只有千亿参数的模型要 好。 海外独⻆兽:Anthropic⼀直在提模型的可解释性,这⼀点其实有蛮多争论。你是如何思考可解释性 产品Kimi智能助⼿,具备世界级的⻓⽂本处理能⼒,该 产品⽀持约20万字中⽂的上下⽂⻓度,使得整体表现⾮常惊艳。杨植麟认为,如今基于Transformer架 构的⼤模型,是“新时代的计算机”,参数数量决定计算复杂度,上下⽂⻓度决定内存⼤⼩⸺因此, 上下⽂⻓度是毫⽆疑问的关键所在。 上下⽂⻓度也正是近期AI圈中的⽐拼热点,各家都在这⼀指标上你追我赶。但这背后的核⼼问题在 于:什么才是真正有效的规模化?0 码力 | 74 页 | 1.64 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书来源:根据专家访谈、公开资料,由艾瑞咨询研究院自主研究及绘制。 云原生应用编排及管理 编排与调度 远程调用 服务代理 API网关 服务网格 分布式架构 消息处理 Serverless 自动化配置 数据库 镜像制作 … 边缘计算 人工智能 大数据 区块链 … 云原生底层技术 容器技术 存储技术 网络技术 云原生顶层应用 云 原 生 应 用 安 全 云 原 生 应 用 监 测 分 析 云原生生态与云原生中间件 云原生中间件特色:底层资源容器化,同时通过组件化、 事件驱动等设计原则让中间件更具备低耦合、标准化等特 性,拥有屏蔽底层技术细节、减免架构复杂度带来的管理 难度,对底层流量等资源配置更加灵活等优势,让开发者 集中注意力至业务逻辑,花费更少时间在非业务核心功能 管理上,构建出更敏捷稳定的应用程序。 云原生中间件开源现状:企业对于云原生整体生态开源贡 献较为活跃,但是在云原生中间件板块,国内并未形成体 法(2019.10.26) 中华人民共和国数据 安全法(2021.06.10) 中华人民共和国电子 签名法(2019.04.23) • 这里的安全中间件是 指支持国家标准密码 算法及其他国际算法, 通过参数转换、对象 管理、接口调度等模 块,完成身份认证、 安全邮件、安全传输 等安全业务场景的中 间件 • 安全中间件开源厂商 较少,主要使用国外 OpenSSL , 或 基 于 OpenSSL的二次开源0 码力 | 43 页 | 4.69 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)全态势管理平台。Kubernetes安全态势管理平 台可以通过实时上下文以及当前和历史信息准 确定位攻击活动,同时还可以根据集群的当前 状态提供可操作的补救措施。具体功能包括: • 实时态势管理,发现基于事件的错误配置; • 汇总并找到Kubernetes RBAC中的过度权限; • 防止部署不合规的工作负载,减少潜在爆炸 半径; • 扫描漏洞并为运行的容器生成SBOM。 OpenSIL的目标不是取代UEFI,而是集成在 Gateway是用于管理Envoy Proxy的开源 项目,可单独使用或作为Kubernetes中应用的 网关。它通过了Gateway API核心一致性测试, 使用Gateway API作为其唯一的配置语言来管理 Envoy代理,支持GatewayClass、Gateway、 HTTPRoute和TLSRoute资源。 近日,Envoy Gateway v0.4发布,版本特性更新 如下: • 升级网关API依赖,升级至Gateway 支持通过Helm完成Envoy Gateway安装; • 添加构建初始框架用于扩展Envoy Gateway; • 添加对基于IP子网的速率限制的支持; • 支持自定义Envoy代理引导配置、Envoy代理 镜像和服务配置注释、资源和安全上下文设 置等; • 添加EDS支持(Endpoint Discovery Service)。 近日,OpenYurt v1.3.0发布,版本特性更新如下: • 重构Openyurt控制平面组件;0 码力 | 22 页 | 1.99 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021定义镜像、支持模型及服务标准化。 便捷易用 模型开发、训练、调度可视化管控,内置 100+算子,支持模型一键式部署,降低 AI建模门槛。 AutoML 支持端到端 AutoML,自动化完成特征 治理、参数寻优、模型筛选流程,智能化 加速数据价值产出。 全流程管控 一站式覆盖数据导入、特征治理、模型 开发、模型训练、推理服务建模全流程, 提升 AI 建模效率。 轻量化、低成本 支持云原生架构,支持私有化部署,多形 ... ... 物理机 多集群管理 容器管理 弹性伸缩 服务网格 微服务框架 移动作业APP 移动柜面APP 大零售平台 企业级应用网关 移动银行APP 金融开放平台 ... 动态配置 全链路追踪 服务治理 分布式事务 性能分析 灰度发布 滚动更新 日志管理 分布式储存 虚拟机 公有云 私有云 混合云 容器云 金融服务 治理框架 业务后台 业务后台 分布式缓存 数据质量 数据资产 数据治理中心 API申请 API生成 API发布 API管理 数据服务中心 用户中心 权限管理 系统管理 集团组织 用户管理 数据权限 身份认证 全剧配置 应用配置 外部服务管理 系统日志 SOLUTIONS 帮助零售行业迅速提升人效、品效、坪效,驱动业务快速增长,高效整合线上线下用户数据,全面掌控渠道和用户, 提升营销和运营效率,重塑企业零售时代竞争力。0 码力 | 43 页 | 884.64 KB | 1 年前3
Gitea,新一代的代码托管平台仓库管理 创建和管理仓库、浏览提交历史和代码文件、审查和合并代码提交、管理协作者、 管理分支等。支持标签、Cherry-pick、WebHook、集成协作工具等。 在线编辑 在线浏览和编辑源代码、配置文件、文档等,无需安装任何软件或插件。内 置文本搜索、代码高亮、自动补全、代码折叠等。 Gitea 核心能力:分支管理 分支保护 设置对分支的访问权限,并限制对该分支的操作。 分支管理 多种操作系统和数据库部署方式 简单的使用方式,多种的集成方式 卓越性能 采用 Go 语言编写,资源占用仅 为 GitLab 的 1/4,运行速度约为 GitLab 的 3 倍 高可配置 100+ 配置项,40+ 模块配置, 通过灵活的配置满足不同应用场景的需求 安全稳定 被⼴泛验证,39k+ GitHub Star、40万+ 安装量、 1000+ 贡献者,覆盖 1000万+ 开发者 Gitea 优势总结 相同机器配置:2C4G • 无负载时内存占用:GitLab 约 3GB,Gitea 约 200MB; • 启动时间(从启动到可以接收请求):GitLab 约 2 分 钟,Gitea 约 5 秒; • 平均页面打开时间:GitLab 约 3 秒,Gitea 约 0.5 秒。 Gitea VS. GitLab 卓越性能 100+ 配置项,40+ 模块配置, 通过灵活的配置满足不同场景的需求0 码力 | 30 页 | 14.34 MB | 1 年前3
使用Sphinx编写Web文档 - 陈照强_trackPageview(); } catch(err) {} {% endblock %} 为Sphinx文档添加Google Analysis 方法二 修改conf.py配置文件 def setup(app): """Insert Google Analytics tracker Based on this Stackoverflow suggestion: stackoverflow0 码力 | 17 页 | 1.69 MB | 1 年前3
JumpServer ⼴受欢迎的开源堡垒机集中⼊⼝分布式部署⽅案 区域 A 区域 B B.jms.com 负载均衡 JS - 2 JS - N JS - A 负载均衡 JS - B JS - N 访问统⼀的⼊⼝, 访问不同地域资产 数据库 依据配置端点规则进⾏访问转发 适⽤于资产访问⼈员分散型管理组织架构 适⽤于资产访问⼈员集中型管理组织架构 特⾊功能三 JS 组件 数据库 KoKo 组件0 码力 | 40 页 | 6.66 MB | 1 年前3
2020 中国开源年度报告
React 封装的⼀套组件库 ant-design/ant-design,基于 Ant Design 框架搭建的中后台管理控制台的脚⼿架 ant-design/ant-design-pro 和致⼒于配置和管理微 服务的特性集 alibaba/nacos 外,饿了么(已被阿⾥收购)的开源项⽬ ElmFE/element 作为 前端组件,表现也⼗分突出。 PingCAP 在开源领域的表现也是⾮常地亮眼。Top500 码力 | 46 页 | 4.09 MB | 1 年前3
共 12 条
- 1
- 2













