2024 中国开源开发者报告
AI 辅助研发中心的概念,即在一个组织中,AI 辅助研发中心可以 为不同团队提供 AI 能力,以提升整体的研发效率。需要注意的是,AI 在快速生成大量代码的同 时,也会带来一些问题,如代码质量、安全性等。我们需要考虑如何在 AI 生成代码的同时,保 证代码的质量。 60 / 111 生成式 AI 与低代码平台结合,可以在多个方面实现增强的生产力和创新。文本生成与聊天 机器人、从 PDF 除模型层面外,应用层面的工具同样在快速发展,工具的进步紧密跟随 AI 应用的发展趋势。 自 ChatGPT 发布以来,应用构建方式大致经历了三个阶段。 首先是基于单一提示词模板的聊天助手类应用,此阶段重点关注模型和提示词的安全性以及 模型输出的可控性。例如,garak 可用于检测模型幻觉、数据泄露和生成毒性内容等问题;rebuff 则针对提示词注入进行检测;DSPy 框架提供了系统高效的编程方法,帮助解决应用开发中的 模型的代码生成工具,如 OpenAI 的 Codex 和 GitHub 的 Copilot,已成为开发者的重要助手,能显著地提升开发者的开发效率。 然而,这些工具在带来便利的同时,也带来了代码安全性和质量的新挑战。根据 IDC 数据, 82%的开发者已使用带有智能代码生成功能的工具,而这些开发者中的 71%表示其超过 40%的 代码由这些工具生成。 GitClear 研究检查了 20200 码力 | 111 页 | 11.44 MB | 8 月前3人工智能安全治理框架 1.0
隐患。 2.2 技术应对措施方面。针对模型算法、训练数据、算力设施、产品服务、 应用场景,提出通过安全软件开发、数据质量提升、安全建设运维、测评监测 加固等技术手段提升人工智能产品及应用的安全性、公平性、可靠性、鲁棒性- 3 - 人工智能安全治理框架 的措施。 2.3 综合治理措施方面。明确技术研发机构、服务提供者、用户、政府 部门、行业协会、社会组织等各方发现、防范、应对人工智能安全风险的措施 力, 确保基础设施和服务运行不中断。 (d)对于人工智能系统采用的芯片、软件、工具、算力和数据资源,应 高度关注供应链安全。跟踪软硬件产品的漏洞、缺陷信息并及时采取修补加固 措施,保证系统安全性。 4.2 针对人工智能应用安全风险 4.2.1 网络域风险应对 (a)建立安全防护机制,防止模型运行过程中被干扰、篡改而输出不可 信结果。 (b)应建立数据护栏,确保人工智能系统输出敏感个人信息和重要数据 审查制度。 5.5 强化人工智能供应链安全保障。推动共享人工智能知识成果,开 源人工智能技术,共同研发人工智能芯片、框架、软件,引导产业界建立开放 生态,增强供应链来源多样性,保障人工智能供应链安全性稳定性。 5.6 推进人工智能可解释性研究。从机器学习理论、训练方法、人机 交互等方面组织研究人工智能决策透明度、可信度、纠错机制等问题,不断提 高人工智能可解释性和可预测性,避免人工智能系统意外决策产生恶意行为。0 码力 | 20 页 | 3.79 MB | 27 天前3DeepSeek图解10页PDF
Tuning),如下图11所示。通用强化学习训练过 程后,使得 R1 不仅在推理任务中表现卓越,同时在非推理任务中也表现出 色。但由于其能力拓展至非推理类应用,因此在这些应用中引入了帮助性 (helpfulness)和安全性(safety)奖励模型(类似于 Llama 模型),以优化 与这些应用相关的提示处理能力。 DeepSeek-R1 是训练流程的终点,结合了 R1-Zero 的推理能力和通用强化 学习的任务 DeepSeek-R1 中间推理模型生成:通过推理导向的强化学习(Reasoning-Oriented RL), 直接生成高质量的推理数据(CoT 示例),减少人工标注依赖。通用强化学 习优化:基于帮助性和安全性奖励模型,优化推理与非推理任务表现,构建 通用性强的模型。最终,DeepSeek-R1 将 R1-Zero 的推理能力与通用强化 学习的适应能力相结合,成为一个兼具强推理能力和任务广泛适应性的高 核心创新总结 中间推理模型生成:通过推理导向的强化学习(Reasoning-Oriented RL),直接生成高质量的推理数据(CoT 示例),减少人工标注依赖。 通用强化学习优化:基于帮助性和安全性奖励模型,优化推理与非推 理任务表现,构建通用性强的模型。 最终成果:DeepSeek-R1 将 R1-Zero 的推理能力与通用强化学习的 适应能力相结合,成为一个兼具强推理能力和任务广泛适应性的高效0 码力 | 11 页 | 2.64 MB | 7 月前3Gitea v1.21.1 中文文档
低,可以在资源有限的环境下运行良好。 易于部署和维护: 轻松地部署在各种服务器上,不需要复杂的配置和依赖。这使得个人开发者或小团队可以方 便地设置和管理自己的 Git 服务。 安全性: Gitea 注重安全性,提供了用户权限管理、访问控制列表等功能,可以确保代码和数据的安全性。 代码评审:代码评审同时支持 Pull Request workflow 和 AGit workflow。评审⼈可以在线浏览代 码,并提交评审意见或问题。 您应该会被提示输入数据库用户的密码,并连接到数据库。 如果 Gitea 和您的数据库实例之间的通信是通过私有网络进行的,或者如果 Gitea 和数据库运行在同一台服务器 上,那么可以省略本节,因为 Gitea 和数据库实例之间的安全性不会受到严重威胁。但是,如果数据库实例位于公 共网络上,请使用 TLS 对数据库连接进行加密,以防止第三方拦截流量数据。 您需要两个有效的 TLS 证书,一个用于数据库实例(数据库服务器),一个用于 来信任全部。 DISABLE_GIT_HOOKS : true:设置为 false 以允许具有 Git 钩子权限的用户创建自定义 Git 钩子。 警 Admin ( admin ) 安全性 ( security ) 配置说明 - 100 - 本文档使用 书栈网 · BookStack.CN 构建 告:自定义 Git 钩子可用于在主机操作系统上执行任意代码。这允许用户访问和修改此配置文件和0 码力 | 303 页 | 3.88 MB | 1 年前32023 中国开源开发者报告
许多 AI 采用者仍处于早期阶段:26% 的人使用 AI 不到一年,而 18% 的人已经在生产中进行了应用。 16% 从事 AI 工作的受访者表示正在使用开源模型。 意外结果、安全性、公平性、偏见和隐私是采用者测试 的最大风险。 工业和信息化部赛迪研究院数据显示,目前,我国已有超 过 19 个大语言模型研发厂商。其中,15 家厂商的模型 产品已经通过备案,预计今年我国大语言模型市场规模将 sudo-rs 是互联网安全研究小组 (ISRG) 发起的 Prossimo 项目——用 Rust 重写 sudo 和 su,目标是提升它们在内存方面的安全性,确保它们不再遭 受内存安全漏洞的困扰,并进一步增强 Linux 和开源生态系统的安全性。 Bun 发布 1.0 正式版本 2023 年 9 月 8 日,JavaScript 运行时 Bun 正式发布 1.0 版本,标志 着这个由前 Facebook 年度大版本更新:2023.3 24 / 87 1 1 curl 8.4.0 正式发布 开源开发者事件回顾 Yarn 4.0 正式发布 微软称 .NET 8 提供了数以千计的性能、稳定性和安全性改进,以及平台 和工具增强功能,有助于提高开发者的工作效率和创新速度。 .NET 8 正式 GA PHP 8.3 GA Yarn 不 仅 是 现 代 化 的 JavaScript 软件包管理 器,还可以作为项目管理0 码力 | 87 页 | 31.99 MB | 1 年前3清华大学 DeepSeek+DeepResearch 让科研像聊天一样简单
使其在学术研究和工业应 用中具有广泛的应用前景 可解释性和可靠性 需要采取措施确保模型的 可靠性和可解释性 社区参与 需要社区成员的共同参与 维护和更新,需要较高的 社区活跃度和凝聚力 安全性 需要采取措施确保模型的 安全性和隐私保护 模型 训练成本 调用成本 (输入/百万 tokens) 调用成本 (输出/百万 tokens) DeepSeek-V3 557.6万美元 0.14美元(缓存未命中) 完全开源免费;社区支持广泛; 多语言基础能力均衡 多模态功能缺失; 长文本生成质量不稳定 Anthropic Claude-3.5 闭源推理模型 对话系统、内容生成、 逻辑推理 对话逻辑连贯性强; 伦理安全性高;文档分析能力突出 中文支持较弱; 闭源且 API 访问受限 百度 文心一言 闭源大语言模型 多语言处理、复杂的语 言理解和文本生成 中文场景优化最佳; 多模态搜索整合;本土行业适配性强0 码力 | 85 页 | 8.31 MB | 7 月前3清华大学 普通人如何抓住DeepSeek红利
探讨大语言模型(LLMs)在模拟人类意见动态和社 会现象(如极化和错误信息传播)中的表现,特别 是引入偏误信息后的意见动态变化。使用大模型模 拟多个虚拟代理,讨论“气候变暖”、“转基因食 品的安全性”和“疫苗的有效性和安全性”三个具 有科学共识的话题。 实验一在无偏误信息条件下,代理通过社交网络进 行每日对话,记录最终信念状态和信息传播路径。 实验二改变初始信念分布,探讨初始条件对结果的 影响。0 码力 | 65 页 | 4.47 MB | 7 月前3全球开源发展态势洞察(2023年第八期)
公布从此次竞赛中得到的启发,帮助其他想要做 类似尝试的人们。希望越来越多的人能知晓该如 何使用大语言模型,了解这些模型的局限性。” 注释:“红队”测试,是指安全专家尝试在组织系 统中发现漏洞或缺陷,以提高整体安全性和弹性的 过程。 全球开源态势洞察|第十期 07 04 开源热点 芬兰南萨沃计划建立 开源能力中心 Decidim参与式民主的开源平台 正在被日本广泛使用 作为欧盟所资助的Open MemoryLab项目的一 情况下,优先选择采用开源软件。 最近,OpenTalk在德国公共管理开源代码仓库OpenCoDE.de中依据EUPL(欧洲 公共许可证)共享了其代码。在此之前,他们对解决方案进行了全面重新设计,以 满足所需的机密性和安全性要求。OpenTalk首席执行官详细地演示了更多专门为 公共管理部门使用该解决方案而开发的各种功能,包括法律合规性、可扩展性等。 案例分享:全国首例GPL抗辩获得支持案i 05 开源法律速递0 码力 | 22 页 | 1.99 MB | 1 年前3网易数帆 领先的数字化转型技术与服务提供商 2021
企业级应用快速开发平台,助力企业提升开发效率降低开发成本。 轻舟低代码 14 生命周期管理 丰富的中间件及统一的管控平台,支持 全生命周期的运维操作。 高可用 支持节点、可用区级故障,灵活调度策 略,有效保障数据安全性与可用性。 故障恢复 支持 Node 级和实例级故障自动恢复, 无需人工值守。 异构网络访问 支 持 异 构 协 议 转 换 为 HTTP 协 议 RESTFUL 接口,具备请求转换能力,有 提供大数据敏捷开发和数据分析平台 内核级开发工程团队和咨询服务能力 客户收益: 构建集团级统一的数据中枢系统 数据分析工作效率提升 10 倍 实现跨云部署,核心数据私有化环境 运行,严格保障数据使用的安全性 客户需求: 内部流量数据沉淀及运用 提升自身数据洞察能力,降本增效 解决方案: 搭建壳牌石油全链路数据资产平台 建立壳牌消费者标签分析模型及客 户运营指标模型 客户收益: 统一数据仓库体系,构建壳牌统一的0 码力 | 43 页 | 884.64 KB | 1 年前3Weblate 4.18.1 用户文档
}, } 在 4.18 版本加入. 方案覆盖。Weblate 尝试从仓库 URL 解析方案并退回到 https。如果你正在 内部运行 API 服务器,你也许想转而使用 http,但考虑安全性。 提示 在 Docker 容器中,用三个变量配置凭据,且基于这些变量构造凭据。GitHub 的示例配置看起来可能像是这样: 将用作: 参见 Gitea 拉取请求, 创建 Gitea 个人访问令牌 令牌,必填。 scheme 在 4.18 版本加入. 方案覆盖。Weblate 尝试从仓库 URL 解析方案并退回到 https。如果你正在 内部运行 API 服务器,你也许想转而使用 http,但考虑安全性。 提示 在 Docker 容器中,用三个变量配置凭据,且基于这些变量构造凭据。GitHub 的示例配置看起来可能像是这样: 将用作: 参见 GitLab 合并请求, GitLab: 个人访问令牌 令牌,必填。 scheme 在 4.18 版本加入. 方案覆盖。Weblate 尝试从仓库 URL 解析方案并退回到 https。如果你正在 内部运行 API 服务器,你也许想转而使用 http,但考虑安全性。 提示 在 Docker 容器中,用三个变量配置凭据,且基于这些变量构造凭据。GitHub 的示例配置看起来可能像是这样: 将用作: GITHUB_CREDENTIALS = { "api0 码力 | 838 页 | 22.34 MB | 1 年前3
共 118 条
- 1
- 2
- 3
- 4
- 5
- 6
- 12