2024 中国开源开发者报告2024:大模型背景下知识图谱的理性回归 77 | 人工智能与处理器芯片架构 89 | 大模型生成代码的安全与质量 93 | 2024 年 AI 大模型如何影响基础软件行业中 的「开发工具与环境」 98 | 推理中心化:构建未来 AI 基础设施的关键 Part 1:中国开源开发者生态数据 04 | Gitee 数据篇 Part 3:国内 GenAI 生态高亮瞬间 104 | 中国 https://huggingface.co/spaces/ zh-ai-community/zh-model-rel ease-heatmap 21 / 111 其中,Qwen 系列凭借灵活的多尺寸选项,强大的多语言支持以及友好的模型授权功能, 赢得了社区开发者的高度评价。DeepSeek 通过引入多头潜在注意力(Multi-head Latent Attention, MLA)技术,在 布便获得了广泛关注,为中国模型在全球开源生态中赢得了更多认可。 平衡发展与合规创新 中国在推动人工智能技术发展的同时,也在监管层面努力建立了完善、透明的治理机制。这 种监管创新为开源模型的发展提供了稳定的政策环境,同时确保技术应用符合社会价值导向。比 如 《人工智能示范法 2.0(专家建议稿)》对于免费且已开源方式提供人工智能研发的个人和 组织给予减轻或免承担法律责任;《生成式人工智能服务管理暂行办法》0 码力 | 111 页 | 11.44 MB | 8 月前3
2023 中国开源开发者报告Bard,作为其首次亮相的对话 LLM 产品,无疑具有其里程碑意义,尽管它的首秀并不尽 如人意,车翻了又翻。 三、 Claude 2、PaLM 2、Llama 等模型与产品也展现了 LLM 在语言理解和多模态处理能力方面的探索,甚至 Claude 2 还一度被誉为实力可以硬刚 ChatGPT。而 Meta 开源的 Llama 2 更成为了 LLM 领域开源势力的典型代表,它的 出现,犹如一颗投入平静湖面的石子,激荡起层层水波, 可以根据开发者的代码提示自动补 全代码,大大提高了开发效率。这也引发了代码原创性的讨 论,但它已经实实在在将 LLM 拉进了编程应用领域。 六、 LangChain 的出现,实现了 LLM 之间的链式交互,使多 个 LLM 模型串联工作,发挥各自的优势,并且可以将 LLM 模型与外部数据源进行连接,产生更强大的语言理解 和生成效果。这开启了 LLM 集成应用的新方向,并诞生了 一个新的细分领域“LLMOps”。 有人称之为“造商业概念”,这里按下不表。 十、 镜头给到国内。相比国际上当前逢 AI 必 GenAI,国内更 多地还是在 LLM 这一层面,Robin Li 的“卷大模型没意 义,卷应用机会更大”,其实很深刻地指出了内中区别。 本报告以开发者视角为主,从 LLM 切入,但实际上或多 或少与 GenAI 脱不开关系。 2023 年国内 LLM 发展活跃,从最初的百度文心一言“硬 刚”Ch0 码力 | 87 页 | 31.99 MB | 1 年前3
中国开源软件产业研究报告者起诉被告企业未遵守开源 协议。国内开源司法实践以保护软件研发的创造性劳动为核心,对上述两类案件通常支持原 告方立场。涉及开源的法律法规建设正在进一步完善,有望为我国的开源软件产业创设更有 序的发展环境。 SMS 中国的开源软件产业发展:得益于政策支持、软件产业高速发展、软件行业人才不断累计, 中国的开源产业已经初具规模,市场上涌现了一批自主开源的企业,并形成了开源社区、开 源产业联盟、开源基金 的“开源软件”理念在此时应 运而生 • 1998年,开源组织OSI正式提出 “开源”理念及其十大规范特性, 开源软件产业进入成长期 • 20世纪末互联网经济的加速发展为 开源软件提供了良好的发展环境 7 ©2022.2 iResearch Inc 对于软件产业而言,“大教堂”模 式仍然是众多企业在激烈的市场竞 争环境中进行项目开发的常见模式, 不可否认的是,这种模式能够更快 地满足客户需求,为客户提供高效 便捷的IT服务。 “集市” “大教堂” 依靠精英,自上而下 依靠大众,自下而上 “集市”开发模式强调为众多的开 发者创设一个鼓励创新、交流的公 平和公开环境,在开发者能够自由 交换关于软件进步路径的看法,并 在沟通过程中自然选择出最合适的0 码力 | 68 页 | 3.63 MB | 1 年前3
网易数帆 领先的数字化转型技术与服务提供商 2021流水线 容器部署 主机部署 策略部署 开放 治理 监控 事务 管理 DevOps 多云部署 服务治理 能力扩展 中间件高可用 全链路监控 容器平台NCS 轻舟混合云 多云管理 多集群管理 镜像仓库 容器管理 轻舟低代码 应用管理 可视化开发 WebIDE 一键发布 资产中心 轻舟中间件 中间件PaaS RDS MySQL Redis Kafka RocketMQ 服务,打破企业软件应用中数 据孤岛等现状。 敏捷 通过小步快跑的方式敏捷迭 代,不断适应市场与业务需求 的变化,摆脱缓慢的大版本更 新与业务需求脱节的窘境。 高效 通过自动化与生产协作方式 的优化,多环节提升软件生产 的效率。 开放 基于开放的技术体系,打造开 放的软件架构。 轻舟云原生软件生产力平台 2.0 能力全景图 轻舟优势 搭建云原生技术底座,助力企业与时俱进实现云上软件创新,支撑业务高速发展。 的流量管控能力。 架构平滑演进 支持单体架构向微服务架构、微服务架 构向服务网格架构平滑演进。 开放兼容 全面覆盖主流微服务开发技术选型,增 强、扩展开源服务网格。 异构应用统一治理 多框架、多协议、多语言服务的统一治 理,避免技术栈重复建设。 异构集成 支持异构协议转换为 HTTP 协议 RESTFUL 接口,具备请求转换能力,有 效集成企业存量应用。 产品能力 云原生微服务统0 码力 | 43 页 | 884.64 KB | 1 年前3
Moonshot AI 介绍正“懂”⼤模型的创业者,所以本⽂中有许多反共识的观点:杨植麟觉得微调最终会不存在, tokenizer最后也不⼀定是必须的;硅⾕⼤模型训练者们担⼼数据瓶颈和能源限制,他反⽽觉得所有问 题都是互相关联的,多模态可以缓解数据短缺,合成数据则可以通过改变计算范式解决能源问题。 本⽂还试图回答另⼀个外界普遍关⼼的问题:⼀家新创⽴的AGI公司如何超越OpenAI?杨植麟的答案 是techvisio 以很好地还原⼀些具体细节, 还可以内容做推理。⽤⼾⾃⼰还会发现很多场景,⽐如扔给它50个简历,让它根据你的要求做分析和 筛选。 要做差异化,我认为就是去看这⾥⾯的techspace有多⼤,techspace越⼤,技术、产品、商业层⾯ 能实现的差异化就越⼤。如果技术已经收敛了,那⼤家只能去追赶,就是同质化内卷。 然后我其实⽐较乐观,因为现在仍有巨⼤的techspace。AGI技术可以分为三层: 做tradeoff。但是最终直接训练⼀个万亿的densemodel肯定效果会⽐⼀个只有千亿参数的模型要 好。 海外独⻆兽:Anthropic⼀直在提模型的可解释性,这⼀点其实有蛮多争论。你是如何思考可解释性 的?因为刚刚你也提到了模型是⼀个⿊盒,并且其实⼈类到现在还没有弄清楚⾃⼰的⼤脑是怎么⼯作 的。 杨植麟:可解释性核⼼是个信任的问题。建⽴⼀个信任的⼼智是很重要的,对应的应⽤场景甚⾄可能0 码力 | 74 页 | 1.64 MB | 1 年前3
2023年中国基础软件开源产业研究白皮书咨询研究院自主研 究及绘制。 中外软件开源对比(2) 国内九成以上开发者使用开源软件,其中近半数人员参与开源,新增贡 献者占比世界靠前 中国开源产业起步晚,发展尚不成熟的现象可以从信息技术发展环境、权威性组织的建立这两个角度看出。权威性组织的建立方面, 全球开源软件标准的权威发布机构OSI于1998年成立,但国内第一个权威性开源软件推进联盟成立于2004年;再如阿帕奇软件基金 会于1999年 企业开发者 出于兴趣或求知欲进入 开源社区,希望学习社 区内优秀代码,并与 “大神”交流 以商业视角出发,希望 通过对开源项目的二次 开发形成开源软件的行 业发行版,实现商业收 益 代码贡献多针对于某一 单一模块的能力优化或 Bug修补,商业化潜力 小 基于企业的行业侧经验 积淀,贡献根据特定场 景、行业深度订制的代 码或功能优化,有较强 的商业化潜力 通常使用免费版本,仅 在公共代码仓中分享代 通过技术准入 15个孵化期 开源项目 17个捐赠期 开源项目 40+个储备开 源项目 工业开源体系 区块链 云原生与超算 RISC-V芯片 终端操作系统 设计自动化 人工智能 开发环境及语言 中间件、数据库 工具软件 服务器操作系统 安全体系 16 中国开源基础软件 产业细分领域洞察 03 17 ©2023.11 iResearch Inc.0 码力 | 43 页 | 4.69 MB | 1 年前3
JumpServer ⼴受欢迎的开源堡垒机《信息安全技术⽹络安全等级保护 2.0 标准》正式实施,等级保护正式 进⼊ 2.0 时代。 堡垒机助⼒企业满⾜等保三级技术要求 安全物理环境 安全通信⽹络 安全区域边界 安全审计 - 帮助企业快速构建身份鉴别、访问控制、安全审计等能⼒ - 堡垒机 安全计算环境 身份鉴别 访问控制 安全审计 系统管理 审计管理 安全管理 安全管理中⼼ 堡垒机的典型⾏业应⽤场景 ⾦融 银⾏、证券、基⾦、保 ⼴泛的多云管理⽀持 ⾃动同步与纳管 特⾊功能⼆ JS - 1 统⼀存储 缓存 A.jms.com 离散⼊⼝分布式部署⽅案 区域 A 区域 B 超⼤规模分布式资产⽀持 - ⽀持多分⽀、多区域的集群分布式互联部署 - B.jms.com 负载均衡 JS - 2 JS - N JS - A 负载均衡 JS - B JS - N 访问不同的节点, 访问不同地域资产 数据库 ⽀持最⼤资产数量为 5000 台 JS-XC000 JumpServer 信创⼀体机 XC000 符合信创要求的运⾏环境 + JumpServer 企 业版(标准)软件授权 ⽀持最⼤资产数量为 500 台 JS-XC100 JumpServer 信创⼀体机 XC100 符合信创要求的运⾏环境 + JumpServer 企 业版(专业)软件授权 ⽀持最⼤资产数量为 5000 台 - 开箱即⽤、安全稳定、深度优化、⽆忧使⽤0 码力 | 40 页 | 6.66 MB | 1 年前3
全球开源发展态势洞察(2023年第八期)修复Flux文档中有关安装loadtester的错误; • 删除OSM测试。 D2iQ Kubernetes Platform v2.5 发布 D2iQ Kubernetes Platform(DKP)是适应生 产环境的企业级自主可控Kubernetes平台。 DKP基于开源Kubernetes、云原生工作负载及 整个云原生生态系统,助力企业获取数字化敏 捷性。 近日,D2iQ Kubernetes Platform 分三个阶段推出更新。直到2024年第一季度将 发布第三阶段的更新,该更新将默认启用修复 程序,届时将导致旧的Windows启动媒介将会 无法使用。 AI Village创始人Sven Cattell表示,“只有让更 多的人了解如何开展红队测试和评估人工智能模 型,才能解决这些模型中的各种问题。”通过对 人工智能模型组开展最大规模的红队演习,AI Village和DEF CON希望能培养出处理人工智能 系统漏洞的研究者社区。事实证明,大语言模型 等 方式,推动在业务发展和组织战略中充分利用开 源解决方案,来满足所确定的需求。在不断的发 展中,该项目更为长远的目标是持续地、系统地 促进开源软件的使用,协助地区企业和公共机构 适应不断变化的数字环境。为实现这一目标,制 定在芬兰南萨沃地区米凯利市建立开源能力中心 的计划,并与相关的国家和国际网络建立合作关 系。 “在南萨沃地区建立开源能力中心是一项具有前 瞻性的、卓越的举措,旨在填补开源软件在采用0 码力 | 22 页 | 1.99 MB | 1 年前3
2021 中国开源年度报告方向。 专家点评 堵俊平:开源的参与者中非技术人员比例提高说明开源在向各行各业渗透,同时开源自身也需要法务,公共政 策等领域的支撑才能更好的发展。 20 3.7 开发语言 开发语言呈现多超多强的状态,Python 后来居上,超过 Java 成为榜首, JavaScript/TypeScript 位居第三。 专家点评 堵俊平:Python 和 Java 并驾齐驱,某种程度反映了当下 GitHub 数据 2021 中国开源年度报告 49 VSCode 工作时间分布打孔图 不管是从活跃度及具体数据,还是直观的打孔图来看,VSCode 都是当之无愧的国际开源项目,参与人 数多,涉及地区广。 NixOS/nixpkgs 工作时间分布打孔图 每一位开发者在使用 Linux 的过程中想必都遭受过软件包版本冲突的痛苦折磨。NixOS 系统以非常出色 的包管理工具获取了一大批 com/baomidou/mybatis-plus 在 Gitee 指数上,来自华为的 OpenHarmony、MindSpore 和 Ascend 占据了前三甲,Gitee 上优质 的开源项目作者与大厂相比也不遑多让,仍然保持着极高的活跃度,在 Top 10 中也占据了五个席位。 2.8 开源安全与合规 2.8.1 CVE 漏洞风险 Gitee 采用棱镜七彩 FossEye 静态扫描了 1.5 万 个 Gitee0 码力 | 132 页 | 14.24 MB | 1 年前3
2020 中国开源年度报告
发展 中国开源基金会意义重大。通过中国开源基金会的发展壮大,不断鼓励国内巨头科技企业和社 会力量合力共建开源创新生态环境;同时,通过学习借鉴更完善的基金会运行模式、组织机制 和法律制度,建设可持续发展的中国开源创新力量。此外,在当前全球开源商业模式越来越成 熟的市场环境下,建设开源基金会,还可以引导国内外基金和投资机构孵化支持开源,培育中 国开源『独角兽』,最终形成资本、企业、开发人员为主体、共享共惠的中国开源商业生态体 源⽣态的整体繁荣有重要意义。我们期待看到开放原⼦可以成为开源的连接器,连接国际开源 社区、链接国内外优质资源,帮助开源项⽬成⻓与成功。 6、开发者技术现状 6.1 开发语⾔ 开发语⾔呈现多超多强的状态,前三甲分别为 Java、JavaScript 和 Python,排名与去年基 本保持⼀致。 【专家点评】 王伟:编程语⾔是⼤家喜闻乐⻅的话题,排名⽅⾯没有太⼤的变化。值得⼀提的是 SQL 数据篇 中的基础数据全部都是⽤ SQL 跑出来的,是⼀项开发者必备的重要基础技能。 6.2 在线⽂档协作编辑⼯具 在线⽂档编辑⼯具中,⽯墨⽂档是⽬前中国开源社区经常使⽤的⼯具,wiki 也依然是⾮常多参 与者使⽤的协作⼯具。 6.3 编辑器 VS Code 今年仍然是最受欢迎的编辑器,紧随其后的是 vim 以及 notepad++。 6.4 版本控制⼯具 毫⽆疑问的是,Git ⼀枝独秀,具有绝对性优势。SVN、TFS、CVS0 码力 | 46 页 | 4.09 MB | 1 年前3
共 11 条
- 1
- 2













